Trong hơn một thập kỷ qua, trí tuệ nhân tạo đã giúp các nhà khoa học nghiên cứu nhanh hơn, tốt hơn và hiệu quả hơn.

Các nhà nghiên cứu đã bắt đầu tích hợp AI vào trong quy trình hoạt động của phòng thí nghiệm. Ảnh minh họa: Thinkstock
Các nhà nghiên cứu đã bắt đầu tích hợp AI vào trong quy trình hoạt động của phòng thí nghiệm. Ảnh: Thinkstock

Tìm kiếm

Năm 2019, các nhà khoa học tại Viện Công nghệ Massachusetts MIT (Mỹ) đã làm được một điều hiếm hoi trong y học hiện đại - tìm ra một loại kháng sinh mới, halicin. Tháng 5/2023, một nhóm nghiên cứu khác tìm ra loại kháng sinh thứ hai, abaucin. Điều đặc biệt về cả hai loại kháng sinh này không chỉ ở tiềm năng chống lại vi khuẩn kháng kháng sinh nguy hiểm nhất từng được biết đến mà còn ở cách xác định mới lạ của chúng.

Trong cả hai nghiên cứu, các nhà khoa học đã dùng mô hình AI để tìm kiếm những hợp chất tốt nhất chống lại mỗi dạng “siêu vi khuẩn”. Mô hình AI được đào tạo dựa trên dữ liệu cấu trúc hóa học của hàng nghìn loại kháng sinh đã biết và hiệu quả của chúng khi chống lại vi khuẩn trong phòng thí nghiệm. Trong quá trình đào tạo, mô hình tự tìm ra mối liên hệ giữa cấu trúc hóa học và khả năng thành công trong việc gây hại cho vi khuẩn, từ đó gợi ý các ứng viên hợp chất thích hợp. Khi AI đưa ra danh sách rút gọn, các nhà khoa học dựa trên đó để tổng hợp thuốc và thử nghiệm hiệu quả kháng sinh trong phòng lab.

Regina Barzilay, nhà khoa học máy tính tại MIT, người đã góp phần tìm ra abaucin halicin, nói rằng nếu việc phát hiện các loại thuốc mới giống như mò kim trong đống cỏ thì AI đóng vai trò tương tự như một máy dò kim loại.

"AI có thể mở ra một thời kỳ phục hưng mới của khám phá", Demis Hassabis, đồng sáng lập Google DeepMind, nói. "Nó nhân lên trí thông minh, sáng tạo của con người". Ông ví von AI với kính viễn vọng, một công cụ thiết yếu cho phép các nhà khoa học nhìn xa hơn và hiểu nhiều hơn so với chỉ nhìn bằng mắt thường.

Mặc dù là một công cụ khoa học từ những năm 1960, nhưng phần lớn đời sống của AI chỉ giới hạn trong những ngành mà các nhà khoa học đã thạo lập trình máy tính, ví dụ như vật lý hạt hoặc toán học. Tuy nhiên, đến những năm 2022-2023, với sự trỗi dậy của học sâu, hơn 99% lĩnh vực nghiên cứu đã có những kết quả công bố liên quan đến AI, theo cơ quan khoa học quốc gia Úc CSIRO (xem biểu đồ).

Các công cụ và kỹ thuật AI hiện đang được áp dụng trong hầu hết mọi lĩnh vực khoa học, mặc dù mức độ áp dụng rất khác nhau: ví dụ, 7,2% bài báo vật lý và thiên văn học được xuất bản vào năm 2022 liên quan đến AI, trong khi chỉ có 1,4% bài báo đề cập đến việc sử dụng AI trong khoa học thú y. Nguồn: CSIRO.
Các công cụ và kỹ thuật AI hiện đang được áp dụng trong hầu hết mọi lĩnh vực khoa học, mặc dù mức độ áp dụng rất khác nhau: ví dụ, 7,2% bài báo vật lý và thiên văn học được xuất bản vào năm 2022 liên quan đến AI, trong khi chỉ có 1,4% bài báo đề cập đến việc sử dụng AI trong khoa học thú y. Nguồn: CSIRO.

"Việc mở rộng khả năng tiếp cận AI đến mọi người là nguyên nhân dẫn đến sự bùng nổ này", Mark Girolami, nhà khoa học đứng đầu tại Viện Alan Turing ở London, nói. Những công việc trước đây đòi hỏi phải có bằng cấp về khoa học máy tính và các dòng ngôn ngữ lập trình phức tạp mới giải quyết được giờ đây có thể được thực hiện bằng các công cụ thân thiện với người dùng, thường tạo ra kết quả chỉ sau một câu hỏi đặt ra cho ChatGPT, chatbot của OpenAI. Nhờ vậy, các nhà khoa học có thể dễ dàng tiếp cận một thứ về cơ bản là trợ lý nghiên cứu siêu phàm, có khả năng tính toán mạnh mẽ và sàng lọc không mệt mỏi hàng đống dữ liệu khổng lồ để tìm kiếm bất kỳ khuôn mẫu hoặc mối tương quan nào.

Cũng giống như trong y dược học, khoa học vật liệu có một lượng khổng lồ các hợp chất. Khi các nhà nghiên cứu tại Đại học Liverpool (Anh) tìm kiếm các vật liệu có đặc tính cụ thể để làm ra loại pin tốt hơn, họ sử dụng một mô hình AI gọi là “mã hóa tự động" (autoencoder) để rà soát tổng cộng 200.000 hợp chất tinh thể ổn định đã biết trong Cơ sở dữ liệu cấu trúc tinh thể vô cơ lớn nhất thế giới. Mô hình AI này trước đó đã được học về những tính chất vật lý và hóa học quan trọng nhất cần có để tạo vật liệu pin mới như mong muốn và áp dụng các điều kiện này vào công cuộc tìm kiếm. Nó đã thành công trong việc giảm số lượng vật liệu ứng viên cho các nhà khoa học thử nghiệm trong phòng thí nghiệm từ hàng ngàn xuống chỉ còn năm, giúp tiết kiệm rất nhiều thời gian và tiền bạc. Ứng viên cuối cùng - một vật liệu kết hợp lithium, thiếc, lưu huỳnh và clo – vô cùng mới mẻ và đang được xem xét kỹ lưỡng, mặc dù vẫn còn quá sớm để nói liệu nó có ra được đến thị trường hay không.

Dự đoán

Ngoài tìm kiếm, còn có thể dùng AI để dự đoán. Chẳng hạn, hình dạng xoắn của protein là yếu tố quyết định chức năng của chúng, nhưng đến nay các nhà khoa học vẫn chưa biết protein tạo nếp gấp như thế nào. Năm 2021, Google DeepMind đã phát triển AlphaFold, một mô hình AI tự học cách dự đoán cấu trúc của protein chỉ từ trình tự axit amin của nó. Kể từ khi được phát hành, AlphaFold đã tạo ra một cơ sở dữ liệu gồm hơn 200 triệu cấu trúc protein dự đoán, được hơn 1,2 triệu nhà nghiên cứu trên thế giới sử dụng.

Matthew Higgins, nhà hóa sinh tại Đại học Oxford, đã sử dụng AlphaFold để tìm ra hình dạng của một loại protein trong muỗi rất quan trọng đối với ký sinh trùng sốt rét mà côn trùng thường mang theo. Sau đó, ông kết hợp các dự đoán từ AlphaFold để xác định vị trí trên protein mà thuốc dễ dàng gắn vào và phát huy tác dụng. Một nhóm nghiên cứu khác đã dùng AlphaFold để tìm ra - chỉ trong vòng 30 ngày - cấu trúc của một loại protein ảnh hưởng đến sự phát triển nhanh của một loại ung thư gan, từ đó mở ra cơ hội thiết kế một phương pháp điều trị hướng đích mới.

AlphaFold cũng giúp mở rộng hiểu biết của chúng ta về sinh học. Ví dụ, vài năm trước, các nhà khoa học đã biết đến sự tồn tại của các cổng đưa vật liệu vào để sản xuất protein ở nhân tế bào, nhưng biết rất ít về cấu trúc của chúng. Sử dụng AlphaFold, họ đã dự đoán cấu trúc và đóng góp hiểu biết về các cơ chế bên trong của tế bào.

“Chúng tôi vẫn chưa thể hiểu hết cách [AI] tạo ra cấu trúc đó. Nhưng một khi AI đã tạo ra cấu trúc, nó trở thành một nền tảng mà toàn bộ cộng đồng khoa học có thể dựa vào đó để phát triển thêm,” theo Pushmeet Kohli, một trong những người phát minh ra AlphaFold.

Tìm ra hình dạng của protein không phải là nhiệm vụ dễ dàng. Ảnh: New Scientist
Tìm ra hình dạng của protein không phải là nhiệm vụ dễ dàng. Ảnh: New Scientist

AI cũng tỏ ra hữu ích trong việc tăng tốc các mô phỏng máy tính phức tạp, chẳng hạn như các mô hình thời tiết dựa trên các phương trình toán học mô tả trạng thái bầu khí quyển của Trái đất tại bất kỳ thời điểm nào. Hiện nay, các siêu máy tính dự báo thời tiết rất tốn kém, tiêu thụ nhiều năng lượng và mất nhiều thời gian để thực hiện tính toán. Và các mô hình phải được chạy đi chạy lại để theo kịp luồng dữ liệu liên tục từ các trạm thời tiết trên khắp thế giới.

Do đó, giới khoa học khí hậu và các công ty tư nhân bắt đầu triển khai học máy để tăng tốc mọi thứ. Pangu-Weather, mô hình AI do công ty Huawei của Trung Quốc xây dựng có thể đưa ra dự đoán về thời tiết trước một tuần, nhanh hơn và rẻ hơn hàng nghìn lần so với tiêu chuẩn hiện tại mà vẫn đảm bảo độ chính xác tương đương. FourCastNet, mô hình do nhà sản xuất chip Nvidia của Mỹ xây dựng, có thể tạo ra các dự báo như vậy trong vòng chưa đầy hai giây và là mô hình AI đầu tiên dự đoán chính xác mưa ở độ phân giải không gian cao (có nghĩa là dữ liệu được tính toán cho một lưới các điểm có khoảng cách rất nhỏ, có thể là mỗi 5-10-20 km hoặc ít hơn). Đây là thông tin quan trọng để dự đoán thiên tai như lũ quét.

Cả hai mô hình AI này đều được đào tạo để dự đoán thời tiết bằng cách học hỏi từ dữ liệu quan sát hoặc đầu ra của các mô phỏng siêu máy tính. Và chúng mới chỉ là khởi đầu - Nvidia đã công bố kế hoạch xây dựng một bản sao kỹ thuật số của Trái đất được gọi là "Earth-2", mà công ty hy vọng có thể dự đoán biến đổi khí hậu ở cấp độ khu vực trước vài thập kỷ.

Kiểm soát

Trong khi đó, các nhà vật lý khai thác sức mạnh của phản ứng tổng hợp hạt nhân đã sử dụng AI để kiểm soát những thành phần phức tạp. Để tạo ra năng lượng nhiệt hạch, họ cần nung nóng hydro thành plasma bên trong một lò phản ứng tokamak hình vòng. Khi đạt đến nhiệt độ khoảng 100 triệu độ C, các hạt trong plasma bắt đầu hợp lại và giải phóng năng lượng. Nhưng nếu plasma chạm vào thành lò tokamak, nó sẽ nguội đi và ngừng hoạt động, vì vậy các nhà vật lý phải giữ chúng trong một lồng từ trường.

Theo một nhà vật lý, việc tìm ra cấu hình phù hợp của từ trường là cực kỳ khó khăn ("giống như cố gắng giữ một cục thạch dẻo bằng que đan”) và nếu kiểm soát chúng một cách thủ công, phải dùng đến các phương trình toán học để dự đoán hành vi của plasma, sau đó thực hiện hàng ngàn điều chỉnh nhỏ mỗi giây cho khoảng 10 cuộn dây từ tính khác nhau. Ngược lại, một hệ thống điều khiển bằng AI do Google DeepMind và Đại học EPFL ở Thụy Sĩ xây dựng cho phép các nhà khoa học thử những hình dạng từ trường khác nhau để giữ plasma trên mô phỏng máy tính, sau đó AI sẽ tìm ra cách tốt nhất để đạt được điều đó.

Người ta cũng đang dùng AI để tự động hóa và tăng tốc các thí nghiệm vật lý. “Phòng thí nghiệm tự điều hành” có thể lên kế hoạch cho một thí nghiệm, thực hiện nó bằng cánh tay robot và sau đó phân tích kết quả. Quá trình tự động hóa làm cho việc khám phá các hợp chất mới, hoặc tìm ra những cách tạo hợp chất cũ tốt hơn, nhanh hơn đến cả nghìn lần.

Tạo dữ liệu

Đối với công chúng, AI tạo sinh mới làm bùng lên mối quan tâm khi mô hình ngôn ngữ lớn ChatGPT xuất hiện vào năm 2022. Nhưng các nhà khoa học đã sử dụng AI tạo sinh từ lâu rồi, với hai ứng dụng khoa học chính.

Thứ nhất, dùng nó để tạo dữ liệu. Các mô hình AI “siêu phân giải” có thể tăng cường hình ảnh kính hiển vi điện tử độ phân giải thấp, giá rẻ thành hình ảnh có độ phân giải cao. Nó so sánh hình ảnh của một khu vực trên vật liệu hoặc mẫu sinh học ở độ phân giải cao với khu vực tương ứng ở độ phân giải thấp hơn, sau đó tìm hiểu sự khác biệt giữa hai độ phân giải và “phiên dịch” điểm ảnh giữa chúng. Hoặc cũng giống như cách một mô hình ngôn ngữ lớn (LLM) có thể tạo ra các câu văn trôi chảy bằng cách dự đoán từ tốt nhất sẽ xuất hiện tiếp theo trong một chuỗi từ, các mô hình tổng hợp phân tử hóa học cũng có thể tạo ra các phân tử mới bằng cách chọn và nối từng nguyên tử, từng liên kết hóa học với nhau.

Thứ hai, có một cách sử dụng các mô hình LLM trong tương lai mà nhà tâm lý học Igor Grossmann tại Đại học Waterloo (Canada) mô tả: Nếu một mô hình LLM có thể tạo những câu chuyện thực tế (hoặc bịa đặt) để phản ánh chính xác những gì người tham gia có thể nói, thì về mặt lý thuyết, nó có thể thay thế cho việc phỏng vấn nhóm và được dùng như một tác nhân trong nghiên cứu kinh tế. Các mô hình LLM có thể được đào tạo với nhiều tính cách khác nhau và hành vi của chúng có thể được sử dụng để mô phỏng các thí nghiệm. Nếu những kết quả phỏng đoán này thú vị thì sau đó chúng có thể được xác nhận lại trên đối tượng con người.

Chia sẻ kiến thức nền

LLM đã giúp các nhà khoa học tự làm việc hiệu quả hơn. Theo GitHub, sử dụng các công cụ như "Copilot", các lập trình viên viết phần mềm nhanh hơn 55%. Đối với tất cả các nhà khoa học, đọc nghiên cứu cơ bản trong một lĩnh vực trước khi bắt tay vào một dự án là một nhiệm vụ khó khăn. Elicit, công cụ AI trực tuyến miễn phí được tạo ra bởi phòng thí nghiệm nghiên cứu phi lợi nhuận Ought của Mỹ, có thể hỗ trợ bằng cách sử dụng LLM để lướt qua hàng núi tài liệu nghiên cứu và tóm tắt những tài liệu quan trọng, nhanh hơn nhiều so với bất kỳ ai. Các mô hình LLM thậm chí có thể giúp trích xuất thông tin có cấu trúc từ hàng triệu tài liệu, chẳng hạn như một liều dùng của một loại thuốc cụ thể được sử dụng trong tất cả các thí nghiệm.

Các nhà khoa học đang tìm cách hiểu và sử dụng các công cụ AI ngôn ngữ. Ảnh: MIT Technology Review
Các nhà khoa học đang tìm cách hiểu và sử dụng các công cụ AI ngôn ngữ. Ảnh: MIT Technology Review

AI còn giúp mở rộng khả năng tiếp cận kiến thức trong các ngành. Mỗi máy dò tại máy gia tốc hạt lớn ở trung tâm nghiên cứu CERN đòi hỏi phải có các nhóm vận hành và phân tích chuyên môn riêng. Việc kết hợp và so sánh dữ liệu từ các nhóm là bất khả thi nếu không có các nhà vật lý từ mỗi máy dò chia sẻ chuyên môn của họ. Nhưng không phải lúc nào cũng khả thi với các nhà vật lý lý thuyết, những người muốn nhanh chóng thử nghiệm những ý tưởng mới. Miguel Arratia, nhà vật lý tại Đại học California, Riverside, đã đề xuất sử dụng AI để tích hợp các phép đo từ nhiều thí nghiệm vật lý cơ bản (và thậm chí cả quan sát vũ trụ) để các nhà vật lý lý thuyết có thể nhanh chóng khám phá, kết hợp và tái sử dụng dữ liệu trong công việc của riêng họ.

Hạn chế của AI

TS. Girolami cảnh báo, trong khi AI có thể giúp nhà khoa học lấp đầy khoảng trống kiến thức, các mô hình của nó vẫn gặp khó khăn trong việc vượt ra khỏi những điều đã biết. Ông nhận xét rằng các hệ thống AI rất giỏi nội suy (kết nối các điểm với nhau) nhưng kém hơn nhiều trong việc ngoại suy (tưởng tượng điểm tiếp theo có thể đi tới đâu).

Và có một số vấn đề khó khăn mà ngay cả những hệ thống AI thành công nhất hiện nay cũng không thể xử lý được. Ví dụ, AlphaFold không phải lúc nào cũng tạo ra protein đúng. Jane Dyson, nhà sinh học cấu trúc tại Viện nghiên cứu Scripps nói rằng đối với các protein "hỗn loạn", đặc biệt liên quan đến nghiên cứu của cô, dự đoán của AI chủ yếu là rác.

"[AI] không phải là một cuộc cách mạng khiến tất cả các nhà khoa học như chúng ta thất nghiệp", cô nói. Và AlphaFold vẫn chưa thể giải thích tại sao protein lại gấp nếp như thế này chứ không phải thế khác, mặc dù có lẽ AI "có một lý thuyết mà chúng ta chưa thể nắm bắt được", TS. Kohli nói.

Hiện nay, việc sử dụng AI để tăng năng suất nghiên cứu vẫn còn rất mới. Các nhà khoa học mới nhúng chân vào vũng nước nông của AI. Trong thập kỷ tới và xa hơn, họ sẽ phải lặn sâu để khám phá những tiềm năng mới của AI.

Nguồn: