Tạm thời, ChatGPT chỉ là một bản demo để giải trí hoặc tham khảo, chứ chưa có khả năng mang lại đột phá ngay lập tức trong lĩnh vực giáo dục như nhiều người kỳ vọng. Để tạo ra các AI có khả năng giúp cá nhân hóa giáo dục, cần có sự chuẩn bị đặc biệt về dữ liệu.
Khi được hỏi ChatGPT có thể giải quyết vấn đề gì, Mira Murati, Giám đốc kỹ thuật của OpenAI, chỉ nhắc đến một ví dụ, không phải quảng cáo hay viết lách mà là cá nhân hóa giáo dục. “Tôi thấy rằng ChatGPT có tiềm năng cách mạng hóa cách chúng ta học. Ngày nay, có những lớp học 30 người, mọi người có cách học khác nhau nhưng nhận được cùng một chương trình giảng dạy”, Murati trả lời phỏng vấn Times. “Với các công cụ như ChatGPT, chúng ta có thể trò chuyện với AI, và nó sẽ giải thích cho chúng ta hiểu một khái niệm theo cách phù hợp với mức độ hiểu biết của mình. Công cụ này có tiềm năng lớn trong việc giúp chúng ta cá nhân hóa giáo dục”.
Tầm nhìn này đi kèm một lưu ý. “Hiện tại, ChatGPT vẫn đang trong giai đoạn thử nghiệm, vì vậy tôi không muốn nói quá chắc chắn về những vấn đề mà nó có thể giải quyết”, theo Murati, người đứng đầu nhóm phát triển nền tảng GPT-3 và các sản phẩm AI tạo sinh văn bản ChatGPT và AI tạo sinh hình ảnh DALL-E.
Để tích hợp những đổi mới như trí tuệ nhân tạo vào giáo dục sẽ cần những dữ liệu chuyên ngành và phù hợp với địa phương, thay vì những sản phẩm được đào tạo dựa trên dữ liệu văn bản Internet như ChatGPT. Ảnh: Reuters
ChatGPT không trả lời, nó dự đoán
ChatGPT không trả lời người dùng giống như cách hai người trò chuyện với nhau – một người đặt câu hỏi và người còn lại phản hồi bằng thông tin họ biết. Thay vào đó, khi nhận được một từ hoặc một đoạn văn bản đầu vào, dựa trên xác suất thống kê, nó sẽ chọn ra những từ có thể tiếp nối vào văn bản đó một cách trôi chảy và trông giống ngôn ngữ của con người nhất có thể.
ChatGPT hay các mô hình ngôn ngữ lớn (LLM) nói chung không phải những bộ não biết mọi thông tin và trả lời khi được hỏi, mà chỉ làm nhiệm vụ “đoán văn bản”, TS Nguyễn Xuân Hoài, nhà nghiên cứu học máy và xử lý ngôn ngữ tự nhiên và người sáng lập AI Academy, nói với Khoa học và Phát triển. Khi nhận được một câu hỏi hoặc một văn bản đầu vào, mô hình dựa vào đó để đoán ra từ tiếp nối, và lại dựa vào từ vừa đoán để dự đoán tiếp.
Điều này đồng nghĩa với việc khi giao tiếp với ChatGPT, người dùng không nên kỳ vọng phản hồi sẽ là câu trả lời cho điều vừa hỏi. Kỳ vọng hợp lý hơn là văn bản nào có khả năng cao nhất nối tiếp vào văn bản tôi vừa cung cấp.
Trong một nghiên cứu năm 2021, các nhà nghiên cứu OpenAI chỉ ra một vấn đề với các LLM là chúng không phản hồi đúng theo hướng mà người dùng mong muốn, và đưa ra hướng khắc phục là kỹ thuật Học tăng cường với phản hồi của con người, hay Reinforcement learning with human feedback. Kỹ thuật này, cùng với mô hình GPT-3, đã tạo ra ChatGPT.
“Câu trả lời AI đưa ra sẽ nhận được phản hồi từ người dùng, có thể là huấn luyện viên của OpenAI, và phản hồi này được đưa vào để cải thiện mô hình. Về lý thuyết, kỹ thuật này có thể làm cho ChatGPT ‘hiểu ý’ người dùng hơn và tạo ra câu trả lời thỏa mãn yêu cầu hơn so với các LLM đã có”, TS Xuân Hoài cho biết. Ngoài các nền tảng cơ bản này, OpenAI có nhiều bí quyết kỹ thuật và công nghệ tích lũy sau nhiều năm nghiên cứu để có thể tạo ra mô hình với kích thước lớn, chuyên gia lưu ý.
“Mọi người bất ngờ khi các AI tạo sinh có thể phản hồi lưu loát đến ‘kỳ diệu’ như vậy, nhưng thực tế công nghệ này đã có quá trình phát triển dài”, TS Tạ Hải Tùng, Hiệu trưởng Trường Công nghệ Thông tin và Truyền thông thuộc Đại học Bách khoa Hà Nội, cho biết. “Tôi nghĩ rằng ChatGPT chỉ là một bản demo cho nền tảng công nghệ đằng sau, và nền tảng đó mới là tương lai cho lĩnh vực trí tuệ nhân tạo”.
Nền tảng công nghệ mà TS Hải Tùng nói đến chính là kiến trúc Transformer do Google phát triển và công bố năm 2017. Transformer cho phép mô hình đánh giá được đâu là các từ quan trọng trong văn bản đầu vào, và tìm ra từ tiếp theo dựa trên những ràng buộc nhất định với các từ đó, có thể về mặt ngữ nghĩa hoặc ngữ pháp. Với kiến trúc này, khi được cho một tệp dữ liệu đủ lớn, mô hình có thể tự tìm ra các mối liên hệ bên trong mà không cần đến những người làm nhiệm vụ “dán nhãn” dữ liệu một cách thủ công.
OpenAI tạo ra mô hình GPT đầu tiên vào năm 2018 bằng cách kết hợp kiến trúc Transformer với kỹ thuật self-supervised hay tự giám sát. Theo đó, mô hình tự lấy một văn bản, bỏ đi một phần và dựa vào phần còn lại để dự đoán phần bị lược bỏ. GPT-3, ra đời vào năm 2020, không thay đổi về nền tảng công nghệ so với hai thế hệ GPT và GPT-2, mà chỉ “phóng đại” nhiều lần lượng dữ liệu và tham số, hay số giá trị trong mạng được điều chỉnh trong quá trình đào tạo, theo Will Douglas Heaven, nhà khoa học máy tính tại MIT Technology Review. GPT-3 gây sốc trong giới công nghệ vì có hơn 175 tỷ tham số, so với 1,5 tỷ của GPT-2 ra đời trước nó một năm, và “tự học” trên 570 GB dữ liệu văn bản từ Internet. |
Ấn tượng nhưng không đáng tin
Công nghệ đằng sau ChatGPT gây ấn tượng, nhưng nội dung mà nó đem đến cho người học, nếu AI này được đưa vào sử dụng trong giáo dục, thì hoàn toàn ngược lại. “Tôi rất hào hứng trong vài phút đầu tiên, nhưng nhanh chóng thất vọng. ChatGPT đưa ra câu trả lời thuận tai nhưng thông tin và nội hàm không đáp ứng được câu hỏi, do các hạn chế về dữ liệu, đặc biệt là khi giao tiếp bằng tiếng Việt”, TS Tạ Hải Tùng, Hiệu trưởng Trường Công nghệ Thông tin và Truyền thông, Đại học Bách khoa Hà Nội, chia sẻ trải nghiệm sử dụng chatbot.*
Phản hồi của ChatGPT khi tự so sánh mình với Google Search, nói rằng mình là công cụ để trò chuyện, không phải công cụ tìm kiếm thông tin như Google. Ảnh: Hoàng Nam
Theo sau cơ chế đoán từ là thông tin sai. Các LLM lặp lại những cách dùng từ và câu có trong dữ liệu dùng để huấn luyện mô hình, còn giá trị thông tin hoàn toàn không liên quan. 570 GB văn bản dùng trong đào tạo GPT-3 được đảm bảo về chất lượng kỹ thuật theo nhiều khía cạnh, nhưng nội dung có thể đến từ bất kỳ đâu trên Internet - từ những trang đáng tin như Encyclopedia Britannica đến những nguồn ngẫu nhiên như bài đăng Wikipedia, Reddit hay bình luận trên một diễn đàn bất kỳ.
Từ góc độ khoa học xã hội, TS Hoàng Anh Tuấn, Hiệu trưởng Trường ĐH Khoa học xã hội và Nhân văn thuộc ĐH Quốc gia Hà Nội, nói về trải nghiệm gây thất vọng tương tự. “Khi đặt một số câu hỏi mang tính đại cương, chatbot trả lời tốt, nhưng không thể trả lời một cách có ý nghĩa khi được hỏi sâu hơn hoặc lật lại vấn đề, cho thấy nó bị hạn chế ở những dữ liệu và thông tin phổ biến.”
Thông tin sai sự thật là điểm yếu chung của các LLM hiện nay. “ChatGPT gặp vấn đề tương tự các mô hình ngôn ngữ lớn, nó bịa đặt. Đây là một thách thức cốt lõi của công nghệ này”, Murati nhận định trên Times. OpenAI gần như không bỏ lỡ cơ hội nào để cảnh báo người dùng về điểm yếu này - ở giao diện trang web, lời nhắc trước khi bắt đầu hội thoại, và thậm chí trong mỗi lần CEO Sam Altman hay CTO Mira Murati nói chuyện trước công chúng về ChatGPT.
Thông tin sai hoặc hời hợt không qua mắt được các chuyên gia đang tìm cách “thử” chatbot, nhưng có nguy cơ gây hại hoặc ít nhất là vô giá trị với những người hỏi để học cũng như thu nhận thông tin. Khi được hỏi về nguồn thông tin, ChatGPT thường xuyên bịa đặt trích dẫn, thậm chí “pha trộn” bằng cách lấy tên người có thật, tên nghiên cứu có thật và gán vào đó các nội dung không liên quan.
“Khi tôi hỏi ChatGPT về tài liệu tham khảo, chatbot viết ra tên nghiên cứu, xuất bản ở tạp chí nào, số nào, trang nào, nhưng thực tế đó là nghiên cứu do nó bịa ra. Chatbot thậm chí còn tóm tắt nội dung của nghiên cứu ‘tưởng tượng’ đó”, TS Nguyễn Việt Cường, nhà nghiên cứu kinh tế, cho biết trên trang cá nhân. OpenAI khuyến nghị người dùng kiểm chứng thông tin AI đưa ra, nhưng thực tế khó đòi hỏi người học, hay bất kỳ ai không có chuyên môn về lĩnh vực đang hỏi, kiểm chứng những “trích dẫn” phức tạp như vậy trên các tạp chí chuyên ngành.
“Các nhà giáo dục quan ngại về chất lượng thông tin và câu trả lời của ChatGPT, đặc biệt là khi nguồn dữ liệu có những định kiến và sai lệch”, TS Lê Anh Vinh, Viện trưởng Viện Khoa học Giáo dục, nói.
Nếu sử dụng ChatGPT trong giáo dục, câu hỏi đặt ra là một AI “đoán văn bản”, dùng nội dung Internet đến năm 2021, và thường xuyên đưa ra thông tin sai có thể giúp gì cho người học hay người dạy.
Chuẩn bị dữ liệu cho AI giáo dục
Với việc Việt Nam gần như không có khả năng xây dựng các mô hình với quy mô như GPT-3 hay ChatGPT, thì kịch bản sử dụng AI trong giáo dục khả thi nhất là huấn luyện các mô hình đã có dựa trên dữ liệu giáo dục Việt. “Công việc phát triển các mô hình AI tạo sinh không dành cho ‘nhà nghèo’, và tôi vẫn khẳng định chúng ta không có cơ hội để cạnh tranh, thay vào đó nên tìm cách tạo ra các ứng dụng dựa trên nền tảng đã có, như cách OpenAI tạo ra GPT dựa trên công nghệ của Google”, TS Xuân Hoài nói.
OpenAI đã thương mại hóa các mô hình trước đây, trong đó có GPT-3. TS Hải Tùng dự đoán sản phẩm mà công ty này sẽ tiếp tục thương mại hóa trong tương lai, cũng như sản phẩm có tác động đến giáo dục, sẽ không phải là ChatGPT mà là một nền tảng công nghệ để các doanh nghiệp hoặc tổ chức tự đào tạo mô hình dựa trên dữ liệu mà họ mong muốn, phục vụ các chuyên ngành nhất định.
Chẳng hạn, “nếu được huấn luyện dựa trên nguồn dữ liệu mà Bộ GD&ĐT kiểm chứng, ChatGPT sẽ trở thành một gia sư hữu ích. Đây là cách mang tính địa phương hóa vào trong mô hình này và khiến nó trở nên tốt hơn”, TS Hải Tùng nói với VietnamNet.
Vì vậy, cách tốt nhất để sẵn sàng cho AI là xây dựng dữ liệu. “Vấn đề đặt ra là nếu muốn giải quyết một vấn đề cụ thể, cho một ngành nghề nào đó, thì chúng ta có những dữ liệu chuyên ngành để tạo ra các sản phẩm có lợi thế về tính địa phương của dữ liệu và tri thức hay không”, TS Xuân Hoài cho biết.
ChatGPT là cơ hội để nhìn nhận công nghệ này có thể làm gì, và những vấn đề gắn liền với nó là gì, theo nhóm các nhà nghiên cứu từ VinUniversity.
“Các công cụ như ChatGPT có thể được đào tạo dựa trên, và do đó đưa ra kết quả, là thông tin sai. Nhưng chúng tôi tin rằng sẽ có các AI dựa trên nền tảng công nghệ này, với các tập dữ liệu chuyên biệt hơn dành riêng cho tiếng Việt, toán học, kỹ thuật, y tế”, GS Rajat Mittal, một thành viên của nhóm, cho biết. “Hầu hết những thông tin mới nhất về các chuyên ngành đều nằm sau những rào cản truy cập nhất định, có thể là các nghiên cứu hoặc tạp chí trả phí, vì vậy những phiên bản tốt hơn của ChatGPT dựa trên những dữ liệu này vẫn còn ở tương lai”.
Nhóm VinUniversity cho biết thêm họ kỳ vọng trong thời gian tới, dựa trên các dữ liệu chuyên môn và đáng tin cậy hơn, ChatGPT sẽ có phiên bản “scholar” dành cho học thuật, tương tự như Google Scholar, đó đó Khoa Khoa học máy tính của trường đã thiết kế các khóa học để sinh viên làm quen với công cụ AI cũng như các mặt lợi và hại của nó.
Trao đổi với Khoa học và Phát triển, ThS Châu Hồng Quang, Khoa Ngôn ngữ và Văn hoá các nước nói tiếng Anh, Trường Đại học Ngoại ngữ, cho biết hiện có những cách sử dụng ChatGPT để giảm tải một số công việc nhất định cho giáo viên tiếng Anh.
Tuy nhiên đây là những phần công việc đơn giản, mang tính lặp đi lặp lại, chẳng hạn như sửa lỗi ngữ pháp trong câu tiếng Anh, và sau đó giáo viên vẫn phải soát lại, chứ chưa thể kỳ vọng ChatGPT thực hiện các nhiệm vụ soạn bài, chấm điểm thay giáo viên hay là nguồn trả lời câu hỏi cho học sinh.
“Việc đánh giá về từ vựng và ngữ pháp, theo đánh giá của tôi, không phải đợi đến ChatGPT mà các công cụ khác như Grammarly hay Quillbot đã làm khá tốt rồi. Giáo viên có thể tham khảo phần nhận xét của ChatGPT và sửa phần nhận xét đó để tiết kiệm thời gian, công sức, dù vẫn phải sửa nhiều trước khi có thể trả cho học sinh”, ThS Hồng Quang nói. “Còn ChatGPT có thay được giáo viên hoàn toàn trong việc chấm chữa bài không, thì câu trả lời là không”. |
* Các phát biểu không có chú thích gì thêm đều được ghi tại Hội thảo về ChatGPT và AI do Bộ Giáo dục và Đào tạo tổ chức ngày 13/2/2023.