Vào ngày 23/2, Google đã tạm dừng tính năng tạo ảnh bằng trí thông minh nhân tạo (AI) của Gemini sau khi nhiều người dùng phản ánh công cụ này tạo ra những hình ảnh không chính xác về các nhân vật lịch sử. Ví dụ, Gemini AI mô tả vị Tổng thống đầu tiên của nước Mỹ George Washington là một người da màu, nhưng thực tế ông là một người da trắng.

Ảnh: Cnet.
Ảnh: Cnet.

“Công cụ AI trên Gemini có khả năng tạo ra hình ảnh con người với nhiều sắc tộc khác nhau. Nhìn chung đây là một điều tốt vì mọi người trên khắp thế giới đều sử dụng nó. Tuy nhiên, công cụ vẫn còn lộ nhiều thiếu sót và công ty đang nỗ lực cải thiện những nhược điểm này. Chúng tôi sẽ nhanh chóng phát hành lại phiên bản cải tiến trong thời gian tới”, Jack Krawczyk, Giám đốc sản phẩm cấp cao của Gemini tại Google, cho biết.

Trong khi Google đang gặp vấn đề với trình tạo hình ảnh AI của Gemini, đối thủ của họ là công ty Open AI tuần trước đã ra mắt Sora, mô hình AI tổng hợp mới có khả năng tạo video từ văn bản của người dùng.

Điểm khác biệt giữa Gemini với các mô hình ngôn ngữ lớn khác là nó có tính đa phương thức, nghĩa là nó có thể kết hợp các loại thông tin khác nhau bao gồm văn bản, mã, âm thanh, hình ảnh và video. Gemini có tổng cộng ba phiên bản bao gồm Nano, Pro và Ultra. Trong đó, phiên bản Gemini Pro đã được tích hợp vào chatbot Bard của Google.