Nghiên cứu sinh tiến sỹ Nguyễn Tùng (Đại học California, Los Angeles, Mỹ) và các nhà nghiên cứu tại Phòng thí nghiệm Quốc gia Argonne thuộc Bộ Năng lượng Hoa Kỳ đã phát triển mô hình trí tuệ nhân tạo mới giúp phát huy hiệu quả khả năng dự báo thời tiết từ các dữ liệu có độ phân giải thấp.

Hình minh họa dự báo trong sáu ngày về tốc độ gió 10 mét (tô màu) và áp suất mực nước biển trung bình (đường viền) bằng phiên bản có độ phân giải cao chạy ở độ phân giải ngang 30 km. Ảnh: Troy Arcomano/Phòng thí nghiệm Quốc gia Argonne.
Hình minh họa dự báo trong sáu ngày về tốc độ gió 10 mét (tô màu) và áp suất mực nước biển trung bình (đường viền) bằng phiên bản có độ phân giải cao chạy ở độ phân giải ngang 30 km. Ảnh: Troy Arcomano/Phòng thí nghiệm Quốc gia Argonne.

Khả năng tạo ra các mô hình thời tiết chính xác để dự báo thời tiết là điều cần thiết cho mọi khía cạnh của nền kinh tế, từ lĩnh vực hàng không cho đến việc vận chuyển. Có thể nói, việc dự báo thời tiết là một vấn đề cơ bản của khoa học và xã hội. Với mối lo ngại ngày càng tăng về biến đổi khí hậu, việc dự báo thời tiết chính xác sẽ giúp chuẩn bị và phục hồi sau những ảnh hưởng của thiên tai và các hiện tượng thời tiết cực đoan, đồng thời đóng vai trò là công cụ quan trọng để các nhà nghiên cứu hiểu rõ hơn về khí quyển.

Cho đến nay, các mô hình thời tiết chủ yếu dựa trên các phương trình liên quan đến nhiệt động lực học và động lực học chất lưu trong khí quyển. Song vấn đề nằm ở chỗ, các mô hình này cực kỳ tốn kém về mặt tính toán và thường đòi hỏi phải chạy trên các siêu máy tính lớn.

Chẳng hạn, “những mô hình này sử dụng hệ thống phương trình vi phân mô tả dòng chất lỏng và nhiệt động lực học, có thể được tích hợp theo thời gian để thu được dự báo trong tương lai. Mặc dù được sử dụng rộng rãi nhưng các mô hình dự báo thời tiết vẫn gặp nhiều thách thức, chẳng hạn như lỗi tham số hóa của các quy trình vật lý quan trọng ở quy mô nhỏ, bao gồm vật lý đám mây và bức xạ”, nghiên cứu sinh tiến sỹ Nguyễn Tùng và nhóm nghiên cứu cho biết trong bài báo mới công bố. Các phương pháp số cũng có chi phí tính toán cao do tính phức tạp của việc tích hợp một hệ phương trình vi phân lớn, đặc biệt là khi lập mô hình ở độ phân giải không gian và thời gian tốt. Hơn nữa, “độ chính xác dự báo của các mô hình dự báo thời tiết không cải thiện khi có nhiều dữ liệu hơn vì các mô hình dựa vào chuyên môn của các nhà khoa học khí hậu để tinh chỉnh các phương trình, tham số hóa và thuật toán”, nhóm nghiên cứu cho biết.


Triết lý về việc dự báo thời tiết trong nhiều năm qua là làm thế nào để đạt được độ phân giải cao hơn để dự báo tốt hơn. Lý do là bởi bạn có thể giải quyết các yếu tố vật lý chính xác hơn, nhưng tất nhiên điều này lại đi kèm với chi phí tính toán lớn. Nhưng hiện tại, với phương pháp đang sử dụng, chúng tôi thực sự có thể có được kết quả tương đương với các mô hình có độ phân giải cao hiện có ngay cả ở độ phân giải thô.
Rao Kotamarthi


Bởi vậy, các nhà nghiên cứu từ các công ty tư nhân như Nvidia và Google đã bắt đầu phát triển các mô hình trí tuệ nhân tạo (AI) lớn, được gọi là mô hình nền tảng, để dự báo thời tiết. Và gần đây, các nhà khoa học tại Phòng thí nghiệm Quốc gia Argonne thuộc Bộ Năng lượng Hoa Kỳ đã hợp tác chặt chẽ với nhà nghiên cứu Aditya Grover và nghiên cứu sinh tiến sỹ Nguyễn Tùng tại Đại học California, Los Angeles (Mỹ) để bắt đầu nghiên cứu loại mô hình thay thế này. Trong một số trường hợp, mô hình này thậm chí có thể đưa ra dự báo chính xác hơn các mô hình dự báo thời tiết số hiện có với chi phí tính toán chỉ bằng một phần nhỏ.

Kết quả nghiên cứu mới đây đã được đăng tải trong bài báo “Scaling Transformers For Skillful And Reliable Medium-Range Weather Forecasting” mà nghiên cứu sinh Nguyễn Tùng là tác giả thứ nhất tại hội thảo “Giải quyết vấn đề biến đổi khí hậu bằng học máy” được tổ chức vào tháng năm vừa qua tại Vienna, Áo. Bài bào này cũng đã nhận được Giải thưởng Bài báo hay nhất tại hội thảo.

Điều đáng chú ý là một số mô hình của nhóm nghiên cứu có khả năng dự đoán vượt trội hơn các mô hình hiện tại trong thời gian hơn bảy ngày, giúp các nhà khoa học có thêm những góc nhìn mới về thời tiết.

Cách tiếp cận mới

Cho đến nay, để giải quyết những thách thức của các mô hình dự báo thời tiết, các nhà khoa học đã và đang ngày càng quan tâm đến các phương pháp tiếp cận với dữ liệu dựa trên học sâu để dự báo thời tiết. Ý tưởng chính của những nghiên cứu như vậy là đào tạo mạng lưới thần kinh sâu để dự đoán điều kiện thời tiết trong tương lai bằng cách sử dụng dữ liệu lịch sử. Sau khi được đào tạo, các mô hình này có thể đưa ra dự báo trong vài giây, trái ngược với thời gian mà các mô hình dự báo thời tiết điển hình đòi hỏi.

Mặc dù khả năng dự báo của các nghiên cứu này khá ấn tượng, song, “các phương pháp hiện tại thường liên quan đến các vấn đề phức tạp, gây khó khăn cho việc xác định những thành phần nào thực sự đóng góp vào sự thành công của các phương pháp ấy”, nhóm nghiên cứu chỉ ra vấn đề. Do đó, “lý tưởng nhất là chúng ta phải đơn giản hóa các phương pháp tiếp cận hiện tại này. Thêm vào đó, việc thiết lập một khuôn khổ chung sẽ tạo điều kiện thuận lợi cho việc phát triển các mô hình nền tảng cho thời tiết và khí hậu bênh cạnh khả năng dự báo thời tiết”, nghiên cứu sinh tiến sỹ Nguyễn Tùng và nhóm nghiên cứu cho biết.

Theo đó, nhóm nghiên cứu đã sử dụng một kiến ​​trúc đơn giản với công thức đào tạo phù hợp có thể hoạt động cạnh tranh với các phương pháp tiên tiến nhất. ‘Chúng tôi bắt đầu với kiến ​​trúc biến áp tầm nhìn tiêu chuẩn (ViT), và thông qua các nghiên cứu cắt bỏ thành phần rộng, xác định ba thành phần chính đối với hiệu suất của mô hình: (1) lớp nhúng dành riêng cho thời tiết để chuyển đổi dữ liệu đầu vào thành một chuỗi mã thông báo bằng cách mô hình hóa sự tương tác giữa các biến khí quyển; (2) mục tiêu dự báo động lực học ngẫu nhiên giúp huấn luyện mô hình dự đoán động lực học thời tiết theo các khoảng thời gian ngẫu nhiên; và (3) tổn thất theo trọng số áp suất có trọng số thay đổi ở các mức áp suất khác nhau trong hàm tổn thất để xấp xỉ mật độ ở mỗi mức áp suất”, nhóm nghiên cứu cho biết trong bài báo.

Các mô hình nền tảng được xây dựng dựa trên việc sử dụng “token” - những bit thông tin nhỏ mà thuật toán AI sử dụng để tìm hiểu vật lý điều khiển thời tiết. Nhiều mô hình nền tảng được sử dụng để xử lý ngôn ngữ tự nhiên - xử lý các từ và cụm từ.

Đối với các mô hình ngôn ngữ lớn như vậy, các token là các từ hoặc các bit ngôn ngữ mà mô hình dự đoán theo trình tự. Còn đối với mô hình dự báo thời tiết mới, các token thay vào đó là các hình ảnh - các mảng biểu đồ mô tả những thứ như độ ẩm, nhiệt độ và tốc độ gió ở các cấp độ khác nhau của khí quyển.

“Thay vì quan tâm đến chuỗi văn bản, dữ liệu bạn đang xem là dữ liệu không gian-thời gian, được thể hiện bằng hình ảnh”, nhà khoa học máy tính Sandeep Madireddy của Argonne cho biết trong bản tin của Phòng thí nghiệm Quốc gia Argonne. “Khi sử dụng các mảng hình ảnh này trong mô hình, bạn có một số khái niệm về vị trí tương đối của chúng và cách chúng tương tác do cách chúng được mã hóa”.

Nhà khoa học khí quyển Rao Kotamarthi của Argonne cho biết nhóm khoa học có thể sử dụng dữ liệu có độ phân giải khá thấp và vẫn đưa ra được những dự đoán chính xác.

“’Triết lý’ về việc dự báo thời tiết trong nhiều năm qua là làm thế nào để đạt được độ phân giải cao hơn để dự báo tốt hơn. Lý do là bởi bạn có thể giải quyết các yếu tố vật lý chính xác hơn, nhưng tất nhiên điều này lại đi kèm với chi phí tính toán lớn”, ông nói. “Nhưng hiện tại, với phương pháp chúng tôi đang sử dụng, chúng tôi thực sự có thể có được kết quả tương đương với các mô hình có độ phân giải cao hiện có ngay cả ở độ phân giải thô”.

Trong khi việc dự báo thời tiết một cách đáng tin cậy trong thời gian ngắn có vẻ là mục tiêu khả thi trong trong tương lai gần với AI, thì việc sử dụng phương pháp tương tự cho mô hình khí hậu, bao gồm việc phân tích thời tiết theo thời gian, lại là một thách thức không nhỏ.

“Về mặt lý thuyết, các mô hình nền tảng cũng có thể được sử dụng để lập mô hình khí hậu. Tuy nhiên, các khu vực tư nhân có nhiều động lực để theo đuổi các phương pháp tiếp cận mới cho việc dự báo thời tiết hơn là lập mô hình khí hậu”, Kotamarthi cho biết.

“Công việc xây dựng các mô hình nền tảng cho mô hình khí hậu có thể sẽ tiếp tục là nhiệm vụ của các phòng thí nghiệm và trường đại học quốc gia chuyên theo đuổi các giải pháp vì lợi ích chung của cộng đồng.”

Nhà khoa học môi trường Troy Arcomano tại Argonne cho biết, một trong những lý do khiến cho việc lập mô hình khí hậu trở nên khó khăn là do khí hậu thay đổi theo thời gian thực.

“Với khí hậu, chúng ta đã chuyển từ trạng thái tĩnh tại sang trạng thái không tĩnh tại. Điều này có nghĩa là tất cả các số liệu thống kê về khí hậu của chúng ta đều thay đổi theo thời gian do lượng carbon bổ sung trong khí quyển. Lượng carbon đó cũng đang thay đổi ‘ngân sách’ năng lượng của Trái đất”, ông cho biết trong thông cáo báo chí của Phòng thí nghiệm Quốc gia Argonne. “Thật phức tạp để tính toán bằng số liệu và chúng tôi vẫn đang tìm cách sử dụng AI”.

Với siêu máy tính exascale mới của Argonne, Aurora, các nhà nghiên cứu có thể đào tạo một mô hình AI rất lớn có thể hoạt động ở độ phân giải rất cao. “Chúng tôi cần một máy exascale để thực sự có thể xây dựng một mô hình chi tiết với AI”, Kotamarthi cho biết.

Đăng số 1301 (số 29/2024) KH&PT