Google Gemini là một trí tuệ nhân tạo đa dạng của DeepMind, xử lý văn bản, âm thanh, hình ảnh và nhiều hơn nữa. Bao gồm ba phiên bản: Ultra, Pro và Nano, mỗi phiên bản được tinh chỉnh cho các mức độ phức tạp khác nhau. Gemini vượt trội trong các thước đo trí tuệ nhân tạo, được tối ưu hóa cho các thiết bị đa dạng, và đã được kiểm tra về an toàn và thiên vị, tuân thủ các nguyên tắc trí tuệ nhân tạo có trách nhiệm. Nó được tích hợp vào các sản phẩm của Google và có sẵn thông qua Google AI Studio và Google Cloud Vertex AI. Gemini Ultra của Google vượt trội trong các thước đo mô hình ngôn ngữ lớn, vượt qua kết quả tốt nhất hiện tại trong 30 trong số 32 thử nghiệm. Nó đã vượt qua các chuyên gia con người trong thử nghiệm MMLU, đánh giá hiểu biết trong 57 chủ đề như toán học, vật lý và đạo đức. Gemini tiếp cận MMLU bằng cách nhấn mạnh vào lý do hơn là ấn tượng ban đầu, dẫn đến các phản ứng cải thiện đáng kể. Gemini Ultra vượt trội trong các thước đo hình ảnh, không cần hỗ trợ từ hệ thống nhận dạng ký tự đối tượng (OCR) để trích xuất văn bản từ hình ảnh để xử lý tiếp. Các thước đo này làm nổi bật tính đa dạng của Gemini và cho thấy dấu hiệu sớm về khả năng lý do phức tạp hơn của Gemini.