Một chương trình mới của Quỹ Khoa học quốc gia Mỹ (NSF) sẽ giúp các nhà khoa học tăng khả năng đào tạo trí tuệ nhân tạo.

Chương trình sẽ hỗ trợ cho các nhà nghiên cứu AI sử dụng các siêu máy tính như Frontera tại Trung tâm Điện toán Nâng cao thuộc Đại học Texas.
Chương trình sẽ hỗ trợ cho các nhà nghiên cứu AI sử dụng các siêu máy tính như Frontera tại Trung tâm Điện toán Nâng cao thuộc Đại học Texas.

Kỹ sư cơ khí Baskar Ganapathy subramanian đang phát triển một ứng dụng sử dụng trí tuệ nhân tạo (AI) để giúp nông dân xác định sâu bệnh và tư vấn giải pháp chống sâu bệnh. Nhà khoa học máy tính Anuj Karpatne coi AI là chìa khóa để dự báo về biến đổi khí hậu, hay việc sử dụng đất hiện nay cũng như nhu cầu gia tăng sẽ ảnh hưởng như thế nào đến chất lượng nước ở các hồ của Mỹ. Nhà hóa sinh David Baker đã sử dụng AI để thiết kế các phân tử mới có thể tạo ra các loại thuốc mới.

Mới đây cả ba nhà khoa học đều đã nhận được nguồn tài trợ dồi dào của Chính phủ Mỹ để hỗ trợ phòng thí nghiệm của mình. Nhưng họ chưa thể tiếp cận các siêu máy tính để đào tạo hệ thống AI của mình.

Vào ngày 6/5, NSF đã công bố các nhà khoa học này nằm trong số 35 người được thụ hưởng chương trình hỗ trợ siêu máy tính, do chính phủ tài trợ trong một dự án thí điểm kéo dài hai năm nhằm thúc đẩy nghiên cứu dựa trên AI trên nhiều lĩnh vực và cải thiện tính an toàn, độ tin cậy, và độ tin cậy của hệ thống AI. Đây là hỗ trợ đầu tiên từ Chương trình Tài nguyên Nghiên cứu Trí tuệ Nhân tạo Quốc gia (NAIRR), mà Tổng thống Joe Biden đã yêu cầu Quỹ Khoa học Quốc gia Mỹ điều phối, đã đề cập trong Sắc lệnh về Phát triển và sử dụng AI an toàn, bảo mật và tin cậy từ năm 2023.

“Các nhà sinh học tính toán chưa bao giờ được tiếp cận [công cụ tính toán] ở cấp độ này”, Baker, đứng đầu Viện Thiết kế Protein tại Đại học Washington, cho biết. “Thật khó để giới hàn lâm theo kịp giới công nghiệp.”

Và NAIRR được thiết kế để thu hẹp khoảng cách đó. “Chúng tôi muốn tăng quyền truy cập trang thiết bị tính toán quy mô lớn để có thêm nhiều người có thể giải quyết các thách thức quan trọng của xã hội”. Katie Antypas, người đứng đầu Văn phòng Cơ sở hạ tầng mạng Nâng cao của NSF, nơi đang quản lý chương trình này, cho biết. “Chúng tôi cũng muốn cho sinh viên quyền truy cập các trang thiết bị này.”

Lộ trình của NAIRR xuất phát từ kế hoạch sáu năm trị giá 2,6 tỷ USD nhằm tăng cường năng lực nghiên cứu AI của quốc gia được đề xuất vào tháng 1/2023. Các nhà khoa học được NAIRR tài trợ sẽ có quyền truy cập vào các siêu máy tính được NSF và Bộ Năng lượng (DOE) hỗ trợ, như các siêu máy tính Frontera và Lonestar tại Trung tâm Điện toán Nâng cao thuộc Đại học Texas. Đề xuất ngân sách năm 2025 của NSF bao gồm yêu cầu thanh toán trước 150 triệu USD để đầu tư cho một chiếc máy mới trị giá nửa tỷ đô tại trung tâm Texas. Quyết định gần đây của DOE nhằm kéo dài tuổi thọ của siêu máy tính Summit sáu năm tuổi tại Phòng thí nghiệm Quốc gia Oak Ridge (chiếc siêu máy tính này vốn đã bị lu mờ vai trò do có các siêu máy tính khác còn mạnh hơn) cũng sẽ hỗ trợ cho các nhà khoa học tham gia Chương trình NAIRR.

Đến nay, với sự trợ giúp từ hàng chục cơ quan liên bang khác, NSF đã tái phân bổ nguồn lực để quản lý chương trình này. Đồng thời NAIRR sẽ nhận được nguồn tài trợ riêng nếu Quốc hội chấp thuận yêu cầu của NSF cấp 30 triệu USD để tiếp tục hỗ trợ cho đến năm 2025. Ngoài ra, khoảng 26 công ty, bao gồm cả những ông lớn về AI hiện nay như Microsoft, Amazon Web Services và NVIDIA, đã đồng ý cung cấp thêm nguồn lực tính toán. Sethuraman Panchanathan, Giám đốc NSF đã phát biểu trong một sự kiện về AI của Nhà Trắng gần đây: “Dù Quốc hội có cấp ngân sách thế nào cũng vẫn không đủ, vì vậy chúng tôi sẽ cần các đối tác”.

Karpatne, giáo sư tại Viện Đại học Bách khoa Virginia, hy vọng hỗ trợ của NAIRR sẽ đẩy nhanh tiến độ mô hình chất lượng nước ông đang phát triển mà ông đặt tên là Lake-GPT. Không giống như các mô hình truyền thống dựa trên việc giám sát chi tiết một hoặc hai hồ và chỉ áp dụng đúng cho trường hợp được cài đặt, Lake-GPT sẽ được sử dụng để dự đoán chất lượng nước ở hàng nghìn hồ trên khắp đất nước. Mô hình này đang được đào tạo dựa trên dữ liệu lớn về môi trường được thu thập bởi các dự án như Mạng lưới quan sát sinh thái quốc gia, cũng do NSF tài trợ.

Quá trình huấn luyện mô hình AI đó sẽ cần nhiều thời gian tính toán, vì vậy Karpatne cần tới 12 triệu giờ GPU trên bất kỳ máy nào có sẵn (giờ GPU là tổng thời lượng của từng GPU riêng lẻ được sử dụng cho học sâu). Sử dụng các siêu máy tính tiết kiệm thời gian hơn, ông chỉ sử dụng chưa đến 10% số giờ đó, vào khoảng 750.000 giờ GPU, trên siêu máy tính Summit. Ông nói rằng chừng đó là đủ để đưa ra dự báo về 20 hồ trong sáu tháng tới là thu được kết quả và ông hy vọng sẽ giúp có thêm thời gian sử dụng máy tính trong các vòng tiếp theo.

Năm 2021, Ganapathysubramanian đã giành được khoản hỗ trợ trị giá 20 triệu USD trong năm năm từ Bộ Nông nghiệp Mỹ (USDA) để xây dựng Viện AI cho Nông nghiệp thích ứng tại Đại học Bang Iowa. Ông cho biết số tiền USDA dùng để hỗ trợ nhân sự và các dự án nghiên cứu chưa cần đến siêu máy tính.

Nhưng khả năng tính toán cao hơn là thứ ông cần để mở rộng InsectNet, một mô hình có thể xác định các loài gây hại trong ảnh chụp trên điện thoại di động. Phiên bản hiện tại của InsertNet đã được huấn luyện trên khoảng 10 triệu ảnh về côn trùng, nhưng Ganapathysubramanian hy vọng sẽ cải thiện độ chính xác bằng cách mở rộng việc huấn luyện lên 150 triệu ảnh. Ông đã được cấp 920.000 giờ GPU trên siêu máy tính Frontera để huấn luyện mô hình. Ông cũng muốn thêm một chatbot cho phép nông dân truy cập trên điện thoại của mình để hỏi đáp và nhận tư vấn về cách đối phó với sâu bệnh. Cuối cùng, ông muốn xử lý các yêu cầu theo thời gian thực của nông dân, cùng với dữ liệu từ máy bay không người lái, để xác định các “điểm nóng” nông nghiệp-những đợt lây nhiễm có thể cần can thiệp ngay lập tức.

Đối với Shu Hu, một nhà khoa học máy tính tại Đại học Purdue, cơ hội đào tạo sinh viên của mình cũng quan trọng như quỹ 4300 giờ GPU mà Shu sẽ có trên siêu máy tính Lonestar để đào tạo mô hình AI của mình nhằm phát hiện hình ảnh giả. Hai học viên của ông đang hy vọng học cách đi trước những kẻ lừa đảo một bước bằng cách tìm kiếm những đặc điểm chung trong các hình ảnh giả mạo do AI tạo ra (DeepFakes). Đồng thời, hai học viên sẽ có quyền truy cập vào các học liệu về AI do DOE tài trợ.

Nhóm nhà khoa học đầu tiên được nhận hỗ trợ đến từ 17 tiểu bang, cho thấy NAIRR đã thực hiện một bước đầu tiên trong việc làm cho các công cụ AI dễ tiếp cận hơn, Antypas lưu ý. Bà cho biết các nhà quản lý cũng đang thảo luận về NAIRR để không chỉ hỗ trợ sử dụng các siêu máy tính mà còn truy cập vào các bộ dữ liệu đào tạo khổng lồ, chẳng hạn như dữ liệu hình ảnh từ các thử nghiệm lâm sàng do liên bang tài trợ. “Chúng tôi muốn NAIRR trở thành một nguồn tài nguyên quốc gia thực sự”, Antypas nói.

Nguồn: science.org