Tháng 10 vừa qua, Bộ thể hiện quan điểm này rõ ràng hơn khi ban hành kế hoạch nghiên cứu và phát triển AI.
Thử gõ câu hỏi: “Obama bao nhiêu tuổi?” vào thanh công cụ tìm kiếm của Google, câu trả lời hiện ra ngay lập tức, trước cả khi bạn kịp nhấn phím enter. Đó là dấu hiệu cho thấy máy hiểu và trò chuyện được với con người. Bạn có lẽ đã chứng kiến chatbot trả lời mình nhiều lần trên các trang web thương mại điện tử hay các cửa hàng online trên Facebook, nhưng chatbot của Google không giống như vậy. Không có ai lập trình chi tiết cho con chatbot này cách trả lời như thế nào với từng loại câu hỏi cụ thể, mà nó phải “tự học” dựa trên một khối lượng dữ liệu lớn các cuộc hội thoại ngoài đời thực và trong phim.
Đây chính là kết quả nghiên cứu của một nhóm những nhà khoa học tại Google Brain, trong đó có Lê Viết Quốc, một người gốc Việt và là diễn giả của hội nghị AI4VN vừa diễn ra. Kỹ thuật mà anh sử dụng thuộc về học máy, một lĩnh vực đang nổi của trí tuệ nhân tạo, cho phép máy tính tự làm, tự hoàn thiện một kĩ năng cụ thể dựa trên một dữ liệu lớn đầu vào, mà con người không cần lập trình một cách chi tiết.
Google Chatbot trả lời người dùng thông qua một khối lượng cơ sở dữ liệu khổng lồ từ phim và các đoạn hội thoại ngoài đời thực. Khi bạn dùng Google search, rất có thể là bạn đang nói chuyện với Chatbot này. Ảnh: fasstcompany.com
Sự nổi lên của học máy, cùng với công nghệ lưu trữ và tính toán dữ liệu khiến AI sẽ tạo nên những đột phá quan trọng trong tất cả mọi lĩnh vực. Cho máy tính dữ liệu của quá khứ, nó sẽ biết hành động như thế nào trong tương lai. Trí tuệ nhân tạo, không chỉ giúp máy tính nhận diện khuôn mặt, nhận diện giọng nói, dịch tự động,…mà còn tiến tới thực hiện những nhiệm vụ phức tạp như phẫu thuật, lái xe.
Tuy nhiên, lực lượng nghiên cứu trong lĩnh vực này vẫn đang rất mỏng. Trên thế giới chỉ có khoảng 22.000 người được đào tạo tiến sĩ về AI và 40% trong số đó đến từ Mỹ. Trong vòng hai năm qua, đã có một cuộc chạy đua về trí tuệ nhân tạo trên toàn cầu với hơn 20 quốc gia trên thế giới và Liên minh Châu Âu lần lượt ban hành chiến lược phát triển AI một cách toàn diện trên cả lĩnh vực R&D lẫn giáo dục (riêng Đông Nam Á có hai nước là Singapore và Malaysia). Rất nhiều quốc gia như Trung Quốc, Mỹ, Pháp, Anh, Canada… đầu tư hàng tỉ USD vào chiến lược này với tham vọng dẫn đầu thế giới về nghiên cứu phát triển và ứng dụng AI.
Đúng phân khúc, đúng thị trường
Theo Thứ trưởng Bộ KH&CN Bùi Thế Duy, một trong số những người chắp bút cho kế hoạch nghiên cứu và phát triển AI Việt Nam cho rằng, Việt Nam sẽ khó có thể lựa chọn con đường giống như các nước phát triển nói trên. Hướng đi của Việt Nam là chọn đúng phân khúc công việc trong chuỗi giá trị toàn cầu, đúng thị trường ngách và giải quyết được những bài toán đặc thù trong nước.
Hiện nay kế hoạch nghiên cứu và phát triển AI Việt Nam mới là một chương trình khung với ba nhiệm vụ gồm: (1) Đầu tư cho nghiên cứu và hạ tầng nghiên cứu ngành trí tuệ nhân tạo (2) Phát triển các ứng dụng liên quan (3) Thúc đẩy đào tạo nhân lực. Trong ba nhiệm vụ này, cụ thể nhất là nhiệm vụ đầu tiên. Theo đó, ngoài việc định hướng các chương trình tài trợ nghiên cứu (chẳng hạn như chương trình KC 4.0) và quỹ Nafosted có những ưu tiên nhất định cho AI, Bộ sẽ đầu tư hạ tầng tính toán hiện đại với kinh phí vào khoảng 1-1.5 triệu USD dùng chung cho các cụm viện nghiên cứu, trường đại học. Ngoài ra, Bộ sẽ dựa vào đề án Hệ tri thức Việt số hóa để xây dựng kho dữ liệu mở, tri thức mở phục vụ cho các nghiên cứu và ứng dụng trong lĩnh vực này.
Công nghệ trí tuệ nhân tạo cho phép máy có thể xác định và thu hoạch đúng những quả dâu đủ độ chín trên cành.
Rào cản dữ liệu
Trước khi kế hoạch này ra đời, trong các hội thảo AI4life và AI4VN, các nhà khoa học cũng gợi ý rằng, Việt Nam nên bắt đầu với những vấn đề liên quan trực tiếp đến phát triển kinh tế - xã hội, tăng năng suất lao động, nâng cao đời sống người dân. Theo họ, việc xác định đúng bài toán cần giải quyết quan trọng hơn nhiều so với việc lựa chọn công nghệ nào, dù tiên tiến đến đâu.
Trong hội thảo AI4life, PGS. Nguyễn Xuân Hoài, người sáng lập học viện AI để giảng dạy và ứng dụng AI cho doanh nghiệp, nguyên giám đốc trung tâm nghiên cứu và phát triển CNTT, Đại học Hà Nội cho rằng nên ưu tiên ứng dụng AI để giải quyết các bài toán trong nông nghiệp, dễ hiểu là vì đây là lĩnh vực xuất khẩu thế mạnh của Việt Nam (hiện nay giá trị xuất khẩu rau quả của Việt Nam gấp rưỡi dầu thô) và xử lý ngôn ngữ tiếng Việt, do những ứng dụng tương tác giữa máy và người đang được sử dụng rất phổ biến trên thế giới đều không “làm việc tốt” trên tiếng Việt. Tập trung vào việc xử lý ngôn ngữ tiếng Việt không chỉ giúp phát triển nhiều ứng dụng trong nước mà còn kéo gần khoảng cách giữa các trường đại học, viện nghiên cứu và khối công nghiệp.
Công nghệ trí tuệ nhân tạo giờ đây cho phép phân tích màu sắc, chi tiết trong những bức ảnh của cánh đồng được chụp bằng máy bay không người lái từ trên cao để xác định sức khỏe của vụ mùa. Ảnh: cambridgeconoulants.com
Tuy nhiên, ngay cả khi xác định được những lĩnh vực ưu tiên, việc triển khai các nghiên cứu phát triển, ứng dụng AI trong những lĩnh vực đó cũng chưa chắc đã thực hiện được vì không có dữ liệu. Kho dữ liệu của hệ tri thức Việt số hóa nếu dựa vào sự tình nguyện đóng góp của cộng đồng và dữ liệu của các bộ ngành như hiện nay có nhược điểm là chưa được phân loại, chưa được “dán nhãn”, chưa thể phục vụ riêng cho những bài toán trong một số lĩnh vực cụ thể và cũng mất nhiều năm để có quy mô đủ lớn và có ích.
Trong khi đó, những dữ liệu được chuẩn hóa là nguyên liệu đầu vào quan trọng để áp dụng kỹ thuật học máy, hay nói cách khác là để “huấn luyện” máy tính. Anh Nguyễn Anh Hoàng, giám đốc Trung tâm IoT VNPT, CEO/CTO công ty Wala Technologies, thuộc tập đoàn VNPT đã nêu ra vấn đề này khi chia sẻ trong sự kiện AI4life rằng, sở dĩ, Israel là quốc gia đi đầu về nông nghiệp thông minh trên thế giới không phải chỉ bởi máy móc, thiết bị hiện đại mà chính bởi cơ sở dữ liệu về chế độ chăm sóc, dinh dưỡng, khí hậu cho hàng vạn loại cây trồng được xây dựng qua nhiều chục năm.
Nếu không xây dựng cơ sở dữ liệu như vậy, không thể áp dụng AI vào nông nghiệp Việt Nam để hệ thống máy móc điều khiển mùa màng, dự báo những loại cây con trồng phù hợp, dự báo sâu bệnh, tối ưu hóa nguồn nước, đất và phân bón…như nhiều người mong muốn.
Vấn đề nghiên cứu và phát triển AI ở Việt Nam phần nào lại trở về câu chuyện có phần xưa cũ, đã được nhắc đến nhiều lần là “số hóa”. Mặc dù có rất nhiều dữ liệu nằm ngoài khả năng thu thập của Bộ KH&CN, đặc biệt là trong sản xuất công nghiệp, dịch vụ tư và dịch vụ công đòi hỏi phải thay đổi quy trình vận hành, xây dựng “văn hóa dữ liệu” trong các tổ chức, doanh nghiệp nhưng Bộ KH&CN vẫn có thể dành kinh phí cho những dự án chuyên thu thập, chuẩn hóa dữ liệu để làm đầu vào cho các dự án trí tuệ nhân tạo trong nhiều lĩnh vực khác sử dụng kỹ thuật máy học.
Và, những dự án thu thập dữ liệu này cũng nên được coi trọng không kém gì những dự án nghiên cứu, nếu không, những kết quả nghiên cứu về trí tuệ nhân tạo trong các lĩnh vực quan trọng của Việt Nam, chỉ đúng trên một tập dữ liệu nhỏ và không thể áp dụng vào thực tế cuộc sống.
Thứ trưởng Bộ KH&CN Bùi Thế Duy. Theo Thứ trưởng Bộ KH&CN Bùi Thế Duy, để triển khai cụ thể kế hoạch nghiên cứu và phát triển AI của Việt Nam Bộ KH&CN sẽ tham vấn các chuyên gia liên quan đến từ khối nhà nước, khối viện – trường và khối doanh nghiệp và tổ chức họ thành bốn nhóm:
Nhóm các giáo sư đầu ngành, có nhiều kinh nghiệm sẽ có vai trò xác định chiến lược, hướng đi cho ngành trí tuệ nhân tạo của Việt Nam;
Nhóm các nhà nghiên cứu cơ bản sẽ tiếp tục triển khai các nghiên cứu cập nhật những công nghệ và kĩ thuật mới trong AI với tài trợ từ ngân sách, đặc biệt là từ quỹ Nafosted;
Nhóm doanh nghiệp tư nhân và một số viện trường sẽ tổ chức đào tạo và tái đào tạo người lao động;
Nhóm các tổ chức, cá nhân đằng sau Hệ tri thức Việt số Hóa sẽ thúc đẩy dữ liệu dùng chung. |