Vào cuối tháng 2, Meta (công ty mẹ của Facebook) đã phát hành một mô hình ngôn ngữ lớn mới dựa trên trí thông minh nhân tạo (AI) mang tên LLaMA, làm nóng cuộc chạy đua AI khi các công ty công nghệ lớn gấp rút tích hợp công nghệ này vào sản phẩm của họ và gây ấn tượng với các nhà đầu tư.
Cuộc chạy đua bắt đầu vào cuối năm ngoái khi công ty OpenAI với sự hậu thuẫn của Microsoft đã ra mắt công cụ ChatGPT. Đầu tháng 2, Google cũng giới thiệu AI mới mang tên Bard để cạnh tranh với ChatGPT của OpenAI. Bard hoạt động dựa trên Mô hình ngôn ngữ dành cho các ứng dụng đối thoại (LaMDA).
“Các mô hình ngôn ngữ lớn dựa trên AI cho thấy rất nhiều ứng dụng trong việc tạo văn bản, thực hiện các cuộc hội thoại, tổng hợp và tóm tắt tài liệu, thực hiện những nhiệm vụ phức tạp hơn như giải toán hoặc dự đoán cấu trúc protein”, Mark Zuckerberg, Giám đốc điều hành Meta, cho biết.
LLaMA là viết tắt của cụm từ “Large Language Model Meta AI” (Mô hình Ngôn ngữ Lớn về AI của Meta). Meta cung cấp nó dưới dạng giấy phép phi thương mại cho các nhà nghiên cứu và những tổ chức liên kết với chính phủ, xã hội dân sự và học viện.
LLaMA yêu cầu sức mạnh tính toán ít hơn nhiều so với các AI trước đó. Nó được đào tạo trên 20 ngôn ngữ, tập trung vào những ngôn ngữ có bảng chữ cái Latinh và Kirin. Một phiên bản nhỏ của LLaMA mang tên LLaMA-13B với 13 tỷ tham số hoạt động tốt hơn GPT-3 của OpenAI. Trong khi phiên bản lớn nhất LLaMA-65B với 65 tỷ tham số có khả năng cạnh tranh với mô hình ngôn ngữ Chinchilla70B và PaLM-540B của Google.
Nguồn: Reuters.com
Quốc Hùng - Bá Lộc thực hiện