Muốn hiện thực hóa Chiến lược Quốc gia về nghiên cứu phát triển và ứng dụng trí tuệ nhân tạo, Việt Nam cần hình thành văn hóa chia sẻ dữ liệu mà vẫn đảm bảo nguyên tắc về tính bảo mật và quyền riêng tư
Thứ trưởng Bộ KH&CN Bùi Thế Duy tại buổi tọa đàm. Ảnh: Hà Trang
Ngày 30/6, Bộ KH&CN đã tổ chức tọa đàm trực tuyến “Phát triển hạ tầng dữ liệu và tính toán cho trí tuệ nhân tạo tại Việt Nam". Phát biểu mở đầu sự kiện, Thứ trưởng Bộ KH&CN Bùi Thế Duy cho biết trí tuệ nhân tạo là lĩnh vực đang nhận được sự quan tâm trên toàn thế giới, những công nghệ trong lĩnh vực này có khả năng thay đổi sự phát triển về kinh tế - xã hội của tất cả các quốc gia, trong đó có Việt Nam. Chính vì vậy, “với mục tiêu triển khai nghiên cứu, phát triển AI ở nước ta, năm 2021, Thủ tướng Chính phủ đã ban hành Chiến lược Quốc gia về nghiên cứu phát triển và ứng dụng trí tuệ nhân tạo ở Việt Nam”.
Cũng theo ông, để triển khai hiệu quả những chiến lược này, cần tổ chức các chương trình nghiên cứu, xây dựng các cơ sở dữ liệu, xây dựng đồng bộ hạ tầng máy tính có khả năng tính toán lớn, cũng như đội ngũ kỹ thuật viên có thể xử lý những dữ liệu lớn trên các hệ thống tính toán này.
Đồng tình với ý kiến đó, TS Nguyễn Việt Cường (Tổng Giám đốc công ty TNHH Tích hợp Thông minh) cho biết, hạ tầng dữ liệu và tính toán có vai trò rất quan trọng, bởi muốn phát triển trí tuệ nhân tạo, nhất là trí tuệ nhân tạo trên nền tảng học máy thống kê, “chúng ta cần có dữ liệu lớn và mô hình tốt để khai thác dữ liệu”.
Theo TS Nguyễn Việt Cường, có thể phân hạ tầng dữ liệu làm ba loại: “Thứ nhất là hạ tầng thu thập và lưu trữ dữ liệu, đó là cơ sở đầu vào cho các tính toán. Thứ hai là hạ tầng chế tác dữ liệu, là việc chuẩn hóa, dán nhãn dữ liệu để phục vụ cho các mô hình học máy; lượng dữ liệu phải rất lớn và cần cộng đồng cùng đóng góp và chuẩn hóa. Thứ ba là hạ tầng phục vụ dữ liệu, hạ tầng này giúp tạo ra các cơ chế chia sẻ dữ liệu, khai thác và dùng trong các tác vụ tính toán.”
Còn với hạ tầng tính toán, ông cho biết, để ứng dụng trí tuệ nhân tạo hiện đại dựa trên nền tảng máy học, chúng ta cần “mô hình tốt để khai thác các dữ liệu lớn, và hiện tại hệ thống tính toán hiệu năng cao có thể đáp ứng được nhu cầu đó”. Gần đây, với sự ra đời của các mô hình máy học chất lượng cao, “chúng ta cần các hệ thống tính toán lớn thì mới bắt kịp được những nghiên cứu tiến bộ trên thế giới, và có thể ứng dụng trong bối cảnh cạnh tranh toàn cầu”, ông nhận định.
Chính vì vậy, “chúng ta cần phải tăng cường năng lực tự chủ trong công nghệ hạ tầng dữ liệu và tính toán. Chỉ có như vậy, chúng ta mới có thể phát triển các trung tâm tính toán lớn nhỏ trên khắp cả nước, và khi đấy chúng ta mới có thể hiện thực hóa Chiến lược quốc gia về nghiên cứu phát triển và ứng dụng trí tuệ nhân tạo đến năm 2030”, ông nhận định.
Cân bằng giữa quyền riêng tư và việc chia sẻ dữ liệu
Bên cạnh việc xây dựng hệ thống tính toán lớn, Thứ trưởng Bộ KH&CN Bùi Thế Duy cho rằng một trong những điểm cần lưu ý khi triển khai chiến lược AI là tìm ra cách thức chia sẻ, sử dụng các hạ tầng tính toán một cách hợp lý, hiệu quả nhất.
Để có thể sử dụng hạ tầng tính toán hiệu quả, theo PGS.TS Thoại Nam (Giám đốc Trung tâm Tính toán hiệu năng cao - HPC Lab, Trường ĐH Bách Khoa, ĐH Quốc gia TP.HCM), Việt Nam cần hội tụ đủ ba yếu tố: dữ liệu, giải pháp và hệ thống. Trong đó, dữ liệu là yếu tố khó đạt được nhất, bởi “dù có tiền thì cũng chưa chắc thu thập được, nó liên quan đến quyền riêng tư, và là tài sản quý giá đối với những đơn vị sở hữu”.
Hiện tại dữ liệu của Việt Nam đang rải rác ở khắp nơi mà chưa thể tập trung lại được, vì vậy theo PGS Thoại Nam, cần hình thành văn hóa chia sẻ dữ liệu tại Việt Nam. “Từ góc nhìn của doanh nghiệp và các đơn vị nghiên cứu, tôi nghĩ việc chia sẻ sẽ có lợi cho quốc gia. Chia sẻ sẽ tạo tiền đề cho các nghiên cứu có ích cho xã hội, thúc đẩy nền kinh tế - xã hội phát triển. Tinh thần tập trung và chia sẻ dữ liệu ở các quốc gia phát triển rất cao, những ở những quốc gia đang phát triển – trong đó có Việt Nam – thì tinh thần này lại chưa cao”.
Hệ thống quản lý và chia sẻ dữ liệu gen và y sinh học VinGen Data Portal. Ảnh chụp màn hình websitehttps://genome.vinbigdata.org/login
Song song với việc chia sẻ dữ liệu, PGS Thoại Nam lưu ý, “Nhà nước cần có những chính sách bảo đảm tính bảo mật và quyền riêng tư, nếu không sẽ có rất nhiều vấn đề nảy sinh và chúng ta sẽ phải đối diện với nhiều hậu quả trong tương lai”.
Đồng tình với ý kiến này, TS Võ Sỹ Nam (Trưởng phòng Tin Y sinh ứng dụng, Viện nghiên cứu Dữ liệu lớn VinBigData) nhận định, muốn nâng cao hạ tầng dữ liệu và tính toán tại Việt Nam, trước hết cần phát triển một nền tảng cho phép tập hợp và chia sẻ những nguồn dữ liệu rời rạc đó, và Nhà nước cần đưa ra các quy tắc để đảm bảo cân bằng giữa quyền riêng tư và chia sẻ dữ liệu.