Công ty trí tuệ nhân tạo OpenAI mới đây đã tiết lộ GPT-4, phiên bản mới nhất của mô hình ngôn ngữ lớn GPT, với những cải tiến lớn.
Một điểm nâng cấp của GPT-4, được phát hành vào ngày 14/3, là giờ đây nó có thể xử lý cả hình ảnh chứ không chỉ văn bản. Để minh chứng cho năng lực này, Open AI cho biết GPT-4 đã vượt qua kỳ thilấy chứng chỉ hành nghề luật sư với kết quả cao hơn hẳn phiên bản trước. Nhưng phiên bản mới vẫn chưa được mở cho công chúng, đến nay chỉ những người đăng ký trả phí của ChatGPT mới có quyền truy cập.
Evi-Anne van Dis, nhà tâm lý học tại Đại học Amsterdam, một trong những người được xem bản demo của GPT-4, kể lại một ví dụ ấn tượng về khả năng xử lý hình ảnh. GPT-4 được cho xem hình phác thảo nguệch ngoạc về một trang web, sau đó đã tạo ra code để xây dựng trang web đó.
Nhưng cộng đồng khoa học vẫn tỏ ra thất vọng về việc OpenAI giữ bí mật cách thức và dữ liệu đào tạo mô hình, cũng như nguyên lý hoạt động thực sự của nó. “Tất cả những mô hình nguồn đóng này về cơ bản đều là ngõ cụt trong khoa học. OpenAI có thể tiếp tục phát triển dựa trên nghiên cứu của họ, nhưng đối với cộng đồng nói chung, đó là một ngõ cụt", Sasha Luccioni, nhà khoa học khí hậu tại HuggingFace, một cộng đồng AI nguồn mở, nói.
Andrew White, kỹ sư hóa học tại Đại học Rochester, là một trong số ít người có quyền truy cập vào GPT-4 với tư cách người thử nghiệm nền tảng được OpenAI trả tiền. White có quyền truy cập vào GPT-4 trong sáu tháng qua, và cho biết ban đầu GPT-4 có vẻ không khác gì với các phiên bản trước đó.
White đặt câu hỏi cho AI về các bước phản ứng hóa học cần thiết để tạo ra một hợp chất nhất định, dự đoán hiệu suất phản ứng và chọn chất xúc tác. “Lúc đầu, tôi thực sự không ấn tượng. AI đã bỏ sót và bịa đặt một số chi tiết”, White kể lại.
Nhưng khi nhóm thử nghiệm cấp cho GPT-4 quyền truy cập vào các bài báo khoa học, mọi thứ đã thay đổi đáng kể. “Chúng tôi nhận thấy những mô hình này sẽ không có hiệu suất tuyệt vời nếu chỉ đứng một mình. Nhưng khi kết nối chúng với Internet hoặc máy tính, thì đột nhiên nhiều khả năng mới xuất hiện", White cho biết.
Đưa ra thông tin sai là một vấn đề khác được quan tâm. Luccioni nói rằng các mô hình như GPT-4, làm nhiệm vụ dự đoán từ tiếp theo trong một câu, không thể "khỏi bệnh" bịa đặt — hay được gọi là ảo giác. “Chúng ta không thể tin cậy vào những kiểu mô hình này vì hiện tượng ảo giác xuất hiện quá nhiều. Và điều này vẫn là một mối lo ngại trong phiên bản mới nhất", cô cho biết.
Ngoài ra, với việc không có quyền truy cập vào dữ liệu được sử dụng để đào tạo, Luccioni nghi ngờ sự an toàn của mô hình. “Chúng ta không biết dữ liệu là gì, vì vậy, không thể cải thiện nó. Hoàn toàn không thể làm khoa học với một mô hình như thế này”, cô nói.
Bí ẩn về cách đào tạo GPT-4 cũng là mối quan tâm của nhà tâm lý học Claudi Bockting - đồng nghiệp của van Dis tại Amsterdam. "Rất khó để chịu trách nhiệm cho một thứ mà bạn không thể giám sát", Bockting nói về việc sử dụng AI này trong khoa học - nhiều tạp chí hiện yêu cầu nhà nghiên cứu chịu trách nhiệm hoàn toàn cho những thông tin mà AI viết ra nếu sử dụng AI trong nghiên cứu. “Một trong những mối lo ngại là chúng có thể thiên vị hơn nhiều so với sự thiên vị của con người".
Luccioni giải thích rằng nếu không thể truy cập mã đằng sau GPT-4 thì không thể biết được sự thiên vị có thể bắt nguồn từ đâu hoặc để khắc phục nó.
Bockting và van Dis cũng lo ngại về việc các hệ thống AI chủ yếu được sở hữu bởi các công ty công nghệ lớn. Họ muốn công nghệ AI phải được các nhà khoa học kiểm tra và xác minh. Họ cho rằng cần phát triển một bộ hướng dẫn để quản lý việc phát triển và sử dụng AI và các công cụ như GPT-4. Họ lo ngại các văn bản luật liên quan đến công nghệ AI khó theo kịp tốc độ phát triển của công nghệ.
Bockting và van Dis đã triệu tập một hội nghị tại Đại học Amsterdam vào ngày 11/4 tới để thảo luận những mối quan tâm này, với đại diện từ các tổ chức gồm Ủy ban khoa học-đạo đức của UNESCO, Tổ chức Hợp tác và Phát triển Kinh tế, và Diễn đàn Kinh tế Thế giới.
Theo White, bất chấp các mối lo ngại, GPT-4 và các phiên bản tương lai của nó sẽ làm chấn động nền khoa học thế giới. “Tôi nghĩ rằng công nghệ này sẽ là một sự thay đổi lớn về cơ sở hạ tầng trong khoa học, gần giống như Internet”, ông nói.
Nguồn: