Những thuật toán trí tuệ nhân tạo mới nhất đang tìm hiểu sự tiến hóa của các thiên hà, tính toán các hàm sóng lượng tử, tìm ra những hợp chất hóa học mới, và nhiều thứ nữa. Liệu có công việc nào của các nhà khoa học không thể được tự động hóa.


Không một gương mặt nào trong số này là của người thật. Các gương mặt ở hàng trên (A) và cột bên trái (B) được một mạng sinh đối kháng sinh ra từ các yếu tố cơ sở lấy từ những ảnh thật. Sau đó, mạng sinh đối kháng kết hợp những đặc điểm cơ bản của những gương mặt A, gồm giới tính, tuổi, khuôn mặt, với những đặc điểm tinh hơn của những gương mặt B, như màu tóc và màu mắt, để tạo ra những gương mặt trong bảng ở giữa.

Không một người hay một nhóm người nào có thể theo kịp dòng lũ thông tin được sinh ra từ các thí nghiệm hiện đại về vật lý và vũ trụ. Có những thí nghiệm ghi lại hàng terabyte dữ liệu mỗi ngày, và luồng dữ liệu sẽ còn tăng nữa. Kính thiên văn giao thoa vô tuyến Square Kilometer Array, dự kiến sẽ bắt đầu hoạt động giữa thập kỷ 2020, sẽ sinh ra mỗi năm một lượng dữ liệu bằng toàn bộ internet.

Dòng lũ thông tin khiến nhiều nhà khoa học phải quay sang cầu cứu trí tuệ nhân tạo. Chỉ với sự can thiệp tối thiểu từ con người, những hệ thống trí tuệ nhân tạo như những mạng thần kinh (là mô hình máy tính mô phỏng những mạng lưới nơ-ron, bắt chước chức năng của bộ não) có thể cày xới hàng núi dữ liệu, phát hiện những điểm bất thường và những quy luật mà con người chẳng bao giờ có thể nhận ra.

Dĩ nhiên, máy tính đã được dùng trong nghiên cứu khoa học từ cách đây khoảng 75 năm, và phương pháp thăm dò (một cách “thủ công”) dữ liệu để tìm ra những quy luật có ý nghĩa thì đã có từ hàng nghìn năm trước. Nhưng một số nhà khoa học lập luận rằng những kỹ thuật mới nhất của học máy và trí tuệ nhân tạo là một cách làm khoa học mới mang tính nền tảng. Một trong những cách tiếp cận đó là tìm mô hình tối ưu dựa trên thống kê và xác suất (mô hình sinh mẫu – generative model); nó có thể giúp xác định thuyết hợp lý nhất trong nhiều cách giải thích khác nhau cho dữ liệu quan sát được, mà chỉ dựa vào dữ liệu, và quan trọng hơn, không cần tri thức về các quá trình vật lý diễn ra bên trong hệ đang được nghiên cứu. Phe ủng hộ mô hình này cho rằng nó đủ mới lạ để có thể được coi là một “cách thứ ba” để tìm hiểu về vũ trụ.

Từ xưa, chúng ta đã tìm hiểu thiên nhiên thông qua quan sát. Một thí dụ là việc Johannes Kepler rà soát vị trí các hành tinh từ dữ liệu của Tycho Brahe và cố tìm ra quy luật ẩn trong đó. (Ông rút ra được rằng các hành tinh di chuyển trên các quỹ đạo hình ê-líp). Khoa học còn tiến lên nhờ mô phỏng. Thí dụ, một nhà thiên văn học có thể mô hình hóa chuyển động của dải Ngân hà và thiên hà Andromeda1 và dự đoán sự va chạm của chúng trong vài tỷ năm nữa. Quan sát và mô phỏng giúp các nhà khoa học đưa ra những giả thuyết có thể được kiểm chứng bởi những quan sát khác mới hơn. Phương pháp tìm mô hình tối ưu dựa trên thống kê và xác suất khác với cả hai cách tiếp cận này.

Phương pháp tối ưu thống kê này “theo nghĩa nào đó, đối lập hoàn toàn với mô phỏng. Chúng ta không biết gì; chúng ta không muốn giả định gì. Chúng ta muốn dữ liệu tự nó cho biết điều gì có thể đang diễn ra.”

“Về cơ bản, nó là một cách tiếp cận thứ ba, nằm ở giữa quan sát và mô phỏng,” Kevin Schawinski, nhà vật lý thiên văn tại Viện Công nghệ Liên bang Thụy Sĩ ở Zurich (ETH Zurich), một trong những người ủng hộ phương pháp này mạnh mẽ nhất, cho biết. “Nó là một cách khác để tấn công một bài toán.”

Một số nhà khoa học coi cách tiếp cận này và những kỹ thuật mới khác đơn giản là những công cụ mạnh để làm khoa học truyền thống. Nhưng phần lớn đồng ý rằng trí tuệ nhân tạo đang có ảnh hưởng to lớn, và vai trò của nó trong khoa học sẽ còn phát triển hơn nữa. Brian Nord, một nhà vật lý thiên văn tại Phòng thí nghiệm Máy gia tốc Quốc gia Fermi2, người sử dụng mạng thần kinh để nghiên cứu vũ trụ, là một trong số những người lo ngại rằng không có một việc gì của một nhà khoa học [con người] lại không tự động hóa được. “Đó là một ý nghĩ khá đáng sợ,” ông nói.

Tạo ra để khám phá

Từ khi còn là nghiên cứu sinh, Schawinski đã nổi tiếng trong lĩnh vực khoa học dựa trên dữ liệu. Trong luận án tiến sỹ của mình, ông đối mặt với việc phân loại hàng nghìn thiên hà dựa vào hình dạng của chúng. Vì thời đó không có sẵn phần mềm nào để làm việc đó, ông quyết định nhờ sự trợ giúp của cộng đồng, và dự án khoa học Galaxy Zoo ra đời. Bắt đầu từ năm 2007, người dùng máy tính bình thường có thể giúp các nhà thiên văn học bằng cách cung cấp ý kiến phân loại của mình về các thiên hà, và kết quả phân loại chọn theo đa số nói chung là chính xác. Đó là một dự án thành công, nhưng, như Schawinski nhận xét, trí tuệ nhân tạo khiến nó trở nên lạc hậu: “Ngày nay, một nhà khoa học giỏi, có kinh nghiệm về học máy và biếtsử dụng điện toán đám mây có thể hoàn thành nó trong một buổi chiều.”

Schawinski đến với phương pháp này, một công cụ mới rất mạnh, vào năm 2016. Về cơ bản, nó cho biết khả năng quan sát được kết quả đầu ra Y nếu điều kiện đầu vào là X. Cách tiếp cận này đã cho thấy hiệu lực và sự linh hoạt khó tin. Thí dụ, giả sử chúng ta đưa cho một bộ dữ liệu gồm ảnh một số mặt người, mỗi bức ảnh kèm theo tuổi của người đó. Trong quá trình duyệt qua dữ liệu sẵn có này, chương trình máy tính bắt đầu rút ra mối liên hệ giữa những gương mặt già hơn và khả năng có nếp nhăn lớn hơn. Cuối cùng, nó có thể làm “lão hóa” một gương mặt bất kỳ, nghĩa là nó có thể dự đoán những thay đổi mà một gương mặt ở một lứa tuổi bất kỳ có thể trải qua.

Những hệ mô hình kiểu này được biết đến nhiều nhất là các “mạng sinh đối kháng”3. Sau khi tiếp xúc với đủ dữ liệu huấn luyện, một mạng sinh đối kháng có thể phục chế những bức ảnh bị lỗi điểm ảnh, hoặc làm nét những bức ảnh bị mờ. Chúng học cách suy ra thông tin bị thiếu thông qua một quá trình cạnh tranh (vì thế mới gọi là “đối kháng”): một phần của mạng, gọi là bộ phát, tạo ra dữ liệu giả, trong khi phần thứ hai, gọi là bộ tách, tìm cách phân biệt dữ liệu giả với dữ liệu thật. Chương trình càng chạy thì cả hai phần càng đồng thời tốt lên. Có lẽ bạn đọc cũng đã từng thấy những bức ảnh lan truyền rộng rãi gần đây về những gương mặt siêu chân thực được mạng sinh đối kháng tạo ra; một bài báo đã gọi chúng là những bức ảnh “về những con người thật một cách dị thường nhưng không tồn tại”.

Một cách tổng quát, phương pháp mô tìm mô hình tối ưu này tiếp nhận các bộ dữ liệu (thường, nhưng không phải luôn luôn, là hình ảnh) và chia nhỏ chúng thành một tập hợp các khối cơ bản, trừu tượng, mà các nhà khoa học gọi là “không gian ẩn” của dữ liệu. Thuật toán làm việc với các phần tử của không gian ẩn để xem chúng ảnh hưởng đến dữ liệu gốc như thế nào, qua đó khám phá ra những quy luật vận động bên trong hệ.

Khái niệm không gian ẩn rất trừu tượng và khó hình dung. Một cách đại khái, có thể so sánh với hoạt động của bộ não khi chúng ta đoán giới tính của một gương mặt. Chúng ta có thể để ý đến kiểu tóc, hình dáng của cái mũi, v.v., cũng như những nét khó diễn tả bằng lời. Chương trình máy tính cũng tìm kiếm những đặc điểm nổi bật từ dữ liệu: dù không biết ria mép hay giới tính là những thứ gì, nếu được huấn luyện trên những bộ dữ liệu có những bức ảnh mang nhãn “đàn ông” hoặc “phụ nữ”, và trong đó có những bức mang nhãn “ria mép”, nó sẽ nhanh chóng suy ra mối liên hệ.

Trong một bài báo công bố tháng 12 năm 20184 trên tạp chí Astronomy & Astrophysics, Schawinski và các đồng nghiệp tại ETH Zurich là Dennis Turp và Ce Zhang đã dùng phương pháp mô hình tối ưu để tìm hiểu những thay đổi vật lý trong quá trình tiến hóa của các thiên hà. (Phần mềm họ dùng xử lý không gian ẩn theo một cách khác với cách của một mạng sinh đối kháng, bởi thế nó dù tương tự nhưng không phải là mạng sinh đối kháng.) Mô hình của họ tạo ra các bộ dữ liệu nhân tạo để kiểm tra những giả thuyết về các quá trình vật lý. Chẳng hạn, họ muốn biết sự “tắt” của quá trình hình thành sao (sự giảm đột ngột tốc độ hình thành sao) liên quan như thế nào đến sự tăng mật độ của một thiên hà.

Với Schawinski, câu hỏi mấu chốt là có bao nhiêu thông tin về các quá trình của sao và thiên hà có thể được rút ra chỉ từ dữ liệu. “Hãy xóa hết mọi thứ chúng ta biết về vật lý thiên văn,” ông nói. “Chỉ dùng dữ liệu, đến mức độ nào chúng ta có thể khôi phục kiến thức đó?”

Đầu tiên, những hình ảnh về thiên hà được xử lí đưa về không gian ẩn của chúng; lúc này, Schawinski có thể điều chỉnh một phần tử của không gian đó theo một cách tương ứng với một thay đổi nào đó của thiên hà, chẳng hạn mật độ xung quanh nó. Sau đó, ông có thể tái tạo thiên hà và xem có khác biệt gì xuất hiện. “Thế là giờ tôi có một cái máy sinh ra giả thuyết,” ông giải thích. “Tôi có thể lấy một mớ những thiên hà vốn ở trong môi trường mật độ thấp, và qua quá trình này khiến cho chúng trông giống như ở trong một môi trường mật độ cao.” Schawinski, Turp và Zhang nhận thấy rằng khi chuyển từ mật độ thấp sang mật độ cao, các thiên hà có màu đỏ hơn, và các ngôi sao của chúng tập trung hơn về trung tâm. Điều này phù hợp với những quan sát đã có, Schawinski cho biết. Câu hỏi là tại sao lại thế.

Bước kế tiếp, theo Schawinski, hiện vẫn chưa được tự động hóa: “Tôi phải bước vào, với vai trò một con người, và nói: ‘Được rồi, hiệu ứng này có thể được giải thích như thế nào bằng vật lý?’” Có hai cách giải thích có vẻ hợp lý: Có thể các thiên hà đỏ hơn trong môi trường mật độ cao vì có nhiều bụi hơn, hoặc có thể chúng đỏ hơn vì sự hình thành sao giảm đi (nói cách khác, các ngôi sao của chúng già hơn). Cả hai ý tưởng đều có thể được kiểm tra sử dụng phương pháp tìm mô hình tối ưu theo thống kê: các thành phần của không gian ẩn liên quan đến độ bụi và tốc độ hình thành sao được thay đổi để xem chúng ảnh hưởng như thế nào đến màu của các thiên hà. “Và câu trả lời rất rõ ràng,” Schawinski nói. Những thiên hà đỏ hơn “khi sự hình thành sao giảm, không phải do thay đổi về bụi.”

Cách tiếp cận này có liên quan với cách mô phỏng truyền thống, nhưng có những khác biệt quan trọng. Một mô phỏng “về cơ bản là dựa vào giả định”, Schawinski nói. “Mô phỏng tức là nói ‘Tôi nghĩ mình biết những quy luật vật lý nào dẫn đến mọi thứ tôi quan sát được trong hệ.’ Tôi có một công thức cho sự hình thành sao, một công thức cho cách thức hoạt động của vật chất tối, v.v. Tôi đưa mọi giả thuyết của mình vào, và chạy mô hình mô phỏng. Rồi tôi hỏi: Trông nó có giống như thực tế không?” Trong khi với phương pháp tối ưu thống kê này “theo nghĩa nào đó, đối lập hoàn toàn với mô phỏng. Chúng ta không biết gì; chúng ta không muốn giả định gì. Chúng ta muốn dữ liệu tự nó cho biết điều gì có thể đang diễn ra.”


Kevin Schawinski, nhà vật lý thiên văn và nhà sáng lập công ty trí tuệ nhân tạo Modulos, lập luận rằng kỹ thuật mô hình sinh mẫu là một cách thứ ba để tìm hiểu về vũ trụ.

Thành công rõ ràng của phương pháp này trong nghiên cứu kể trên tất nhiên không có nghĩa là các nhà thiên văn học và các nghiên cứu sinh đã trở nên thừa thãi. Nhưng nó dường như cho thấy một sự thay đổi về lượng tri thức vật lý thiên văn có thể đạt được nhờ một hệ thống nhân tạo mà trong “tay” không có gì ngoài một kho mênh mông dữ liệu. “Đó chưa phải là khoa học hoàn toàn tự động hóa, nhưng nó chứng tỏ rằng chúng ta có khả năng xây dựng những công cụ để tự động hóa chí ít là một phần của quá trình nghiên cứu khoa học,” Schawinski nói.

Phương pháp này hiển nhiên rất mạnh, nhưng việc nó có đại diện cho một cách tiếp cận mới trong khoa học hay không vẫn đang được tranh luận. Với David Hogg, một nhà vũ trụ học tại Đại học New York và Viện Flatiron, kỹ thuật này dù rất ấn tượng nhưng rốt cuộc vẫn chỉ là một cách tinh vi để rút ra các quy luật từ dữ liệu – việc mà các nhà thiên văn học vẫn làm từ hàng thế kỷ. Nói cách khác, nó là một dạng cao cấp của quan sát và phân tích. Như Schawinski, Hogg cũng dùng rất nhiều trí tuệ nhân tạo trong việc nghiên cứu của mình; ông dùng mạng thần kinh để phân loại sao dựa vào quang phổ và để suy ra các thuộc tính vật lý khác của sao nhờ các mô hình dựa vào dữ liệu. Nhưng ông coi nghiên cứu của mình, cũng như nghiên cứu của Schawinski, là khoa học “thử và sai”5. “Tôi không nghĩ nó là một cách thứ ba,” ông mới phát biểu gần đây. “Tôi chỉ nghĩ rằng cộng đồng chúng ta đã khéo hơn rất nhiều trong cách sử dụng dữ liệu. Đặc biệt, chúng ta đã tiến bộ nhiều trong việc so sách các dữ liệu với nhau. Nhưng theo quan điểm của tôi, việc nghiên cứu của tôi vẫn nằm trọn trong cách tiếp cận quan sát.”

Những trợ lý cần cù

Dù có phải là một khái niệm mới hay không, trí tuệ nhân tạo và mạng thần kinh rõ ràng đã được đưa vào và đóng một vai trò rất quan trọng trong nghiên cứu thiên văn và vật lý đương đại. Tại Viện Nghiên cứu lý thuyết Heidelberg6, nhà vật lý Kai Polsterer là trưởng nhóm tin học thiên văn, một nhóm các nhà nghiên cứu tập trung vào các phương pháp nghiên cứu vật lý thiên văn mới dựa trên dữ liệu. Gần đây, họ đã sử dụng một thuật toán học máy để rút ra thông tin về độ dịch chuyển đỏ của các thiên hà từ dữ liệu, một việc trước đây vốn rất khó khăn.

Polsterer coi những hệ thống mới dựa trên trí tuệ nhân tạo này là những “trợ lý cần cù”, những trợ lý có thể lục lọi hàng giờ liền trong đống dữ liệu mà không nản hay kêu ca về điều kiện làm việc. Những hệ thống này, ông cho biết, có thể làm hết những công việc nhàm chán, cho phép bạn “tự mình làm thứ khoa học hay ho, thú vị.”

Thường thì một hệ thống đưa ra một câu trả lời nhưng không đưa kèm theo một bức tranh rõ ràng về cách mà câu trả lời đó được tìm ra.

Nhưng chúng không hoàn hảo. Đặc biệt, Polsterer cảnh báo, các thuật toán chỉ biết làm những gì chúng được dạy. Hệ thống không biết gì về dữ liệu đầu vào. Đưa nó một thiên hà, nó có thể ước lượng tuổi hay độ dịch chuyển đỏ của thiên hà đó, nhưng đưa nó một bức ảnh “tự sướng” hay ảnh một con cá chết đang phân hủy, nó vẫn sẽ tính ra một số tuổi (tất nhiên là rất không chính xác). Cuối cùng, vẫn rất cần sự giám sát của một nhà khoa học con người, ông nói. “Vẫn lại là bạn, nhà khoa học. Bạn là người có trách nhiệm giải thích [kết quả].”

Về phần mình, Nord, ở Phòng thí nghiệm Fermi, khuyến cáo rằng mạng thần kinh cần cung cấp không chỉ kết quả, mà cả sai số7 kèm theo, điều mà mọi sinh viên đều được dạy phải làm. Trong khoa học, nếu bạn thực hiện một phép đo mà không đưa ra một ước lượng về sai số [của phép đo đó], sẽ không ai coi các kết quả đó là nghiêm túc, ông nói.

Như nhiều nhà nghiên cứu trí tuệ nhân tạo khác, Nord cũng lo ngại về sự khó hiểu của những kết quả do mạng thần kinh đưa ra; thường thì một hệ thống đưa ra một câu trả lời nhưng không đưa kèm theo một bức tranh rõ ràng về cách mà câu trả lời đó được tìm ra.

Nhưng không phải ai cũng cảm thấy sự khó hiểu đó là một vấn đề. Lenka Zdeborová, một nhà khoa học tại Viện Vật lý lý thuyết thuộc CEA Saclay8 (Pháp), chỉ ra rằng trực giác của con người cũng thường khó hiểu không kém. Bạn nhìn vào một bức ảnh và nhận ra ngay một con mèo, “nhưng bạn không biết làm sao bạn biết”, bà nói. “Bộ não của bạn, theo một nghĩa nào đó, cũng là một hộp đen.”

Không chỉ có các nhà vật lý thiên văn và các nhà vũ trụ học chuyển hướng sang khoa học dựa vào dữ liệu và trí tuệ nhân tạo. Những nhà vật lý lượng tử, như Roger Melko tại viện Perimeter9 và Đại học Warterloo ở Ontario (Canada), đã dùng mạng thần kinh để giải một số bài toán khó nhất và quan trọng nhất trong lĩnh vực của mình, chẳng hạn bài toán biểu diễn hàm sóng mô tả một hệ nhiều hạt. Sự cần thiết của trí tuệ nhân tạo là do, từ của Melko, “lời nguyền hàm mũ của số chiều”. Cụ thể, số dạng có thể của một hàm sóng tăng theo hàm mũ của số hạt trong hệ mà nó mô tả. Độ khó ở đây cũng tương tự như việc tìm ra nước đi tốt nhất trong một ván cờ vua hoặc cờ vây: bạn cố tính xa hơn nước tiếp theo, tưởng tượng cách đối thủ đáp trả, rồi lại chọn nước đi tốt nhất, và cứ sau mỗi một nước, số khả năng lại tăng gấp bội.

Tất nhiên, trí tuệ nhân tạo đã chơi thành thạo cả hai trò: cờ vua từ vài thập kỷ trước10, còn cờ vây từ năm 2016, khi chương trình AlphaGo đánh bại một kỳ thủ hàng đầu. Một cách tương tự, chúng cũng thích hợp cho những bài toán vật lý lượng tử, Melko nói.

Trí tuệ của máy móc

Dù người đúng là Schawinski, nghĩa là ông đã tìm ra “cách thứ ba” để làm khoa học, hay là Hogg, nghĩa là nó đơn giản là quan sát truyền thống kết hợp với phân tích dữ liệu “lên đồng”, rõ ràng trí tuệ nhân tạo đang làm thay đổi hương vị và giúp tăng tốc khám phá khoa học. Cuộc cách mạng trí tuệ nhân tạo trong khoa học sẽ tiến xa đến đâu?

Cứ lâu lâu lại có những tuyên bố to tát về thành tựu của một “nhà khoa học robot”. Khoảng một chục năm trước, một robot - nhà hóa học có tên Adam nghiên cứu bộ gene11 của men bánh mỳ và xác định những gene nào có vai trò tạo ra một số axit amin nào đó. (Adam thực hiện việc này bằng cách quan sát những đoạn men thiếu một số gene nào đó, và so sánh với những đoạn men có các gene đó.) Tạp chí Wired đưa tiêu đề “Robot tự mình khám phá khoa học”12.

Mới hơn, Lee Cronin, một nhà hóa học tại Đại học Glasgow (Scotland), dùng một robot để trộn ngẫu nhiên các hóa chất với nhau, để tìm những hợp chất mới. Theo dõi các phản ứng trong thời gian thực với một phổ kế khối lượng, một máy cộng hưởng từ hạt nhân, và một phổ kế hồng ngoại, hệ thống dần học được cách dự đoán những phản ứng hóa học nào là mạnh nhất. Dù nó không tìm ra được chất mới, hệ thống tự động đó, theo Cronin, có thể giúp đẩy nhanh các nghiên cứu hóa học tới 90 phần trăm.

Năm ngoái, một nhóm nghiên cứu khác tại ETH Zurich dùng mạng thần kinh để rút ra các định luật vật lý từ dữ liệu. Hệ thống của họ, một loại robo-Kepler, thiết lập lại mô hình nhật tâm của hệ Mặt trời từ dữ liệu vị trí của Mặt trời và sao Hỏa trên bầu trời khi quan sát từ trái Đất, và rút ra định luật bảo toàn động lượng nhờ quan sát va chạm của những quả bóng. Vì các định luật vật lý thường có thể được thể hiện theo nhiều cách, các nhà nghiên cứu tự hỏi liệu hệ thống có thể đưa đến những cách nghĩ mới, có thể đơn giản hơn, về các định luật đã biết.

Những thí dụ trên đều nói về việc trí tuệ nhân tạo khởi đầu cho quá trình khám phá khoa học, mặc dù trong mỗi trường hợp, chúng ta đều có thể tranh luận về tính cách mạng của cách tiếp cận mới. Có lẽ câu hỏi gây tranh cãi nhất là có bao nhiêu thông tin có thể được rút ra chỉ từ dữ liệu. Đây là một câu hỏi cấp thiết trong kỷ nguyên của những dữ liệu vô cùng lớn (và còn tiếp tục tăng). Trong “Cuốn sách tại sao”13, nhà khoa học máy tính Judea Pearl và cây viết khoa học Dana Mackenzie khẳng định rằng dữ liệu “ngu hết sức”. Những câu hỏi về quan hệ nhân - quả “không bao giờ trả lời được chỉ từ dữ liệu,” họ viết trong sách. “Bất cứ lúc nào bạn gặp một bài báo hay một nghiên cứu phân tích dữ liệu mà không theo một mô hình, bạn có thể chắc chắn rằng kết quả của nghiên cứu đó chỉ là tóm tắt, và có thể biến đổi, nhưng không phải giải thích dữ liệu.” Schawinski đồng tình với lập trường của Pearl, nhưng ông coi ý tưởng làm việc “chỉ với dữ liệu” là “hơi đánh tráo khái niệm.” Ông nói mình chưa bao giờ tuyên bố rút ra quan hệ nhân - quả theo cách đó. “Tôi chỉ nói rằng với dữ liệu, chúng ta có thể làm được nhiều hơn so với lối thông thường.”

Một luận điểm thường gặp khác là khoa học đòi hỏi sáng tạo, và rằng, ít nhất cho tới hiện tại, chúng ta không biết làm sao lập trình sự sáng tạo. (Chỉ thử mọi cách, như robot của Cronin, thì chẳng có gì là sáng tạo cho lắm.) “Tôi cho rằng đưa ra được một lý thuyết có đủ lý lẽ đòi hỏi sự sáng tạo,” Polsterer nói. “Cứ cần sự sáng tạo là cần phải có con người.” Và sự sáng tạo đến từ đâu? Polsterer ngờ rằng nó đến từ sự buồn chán, một điều mà theo ông máy móc không thể nào cảm nhận. “Muốn sáng tạo, bạn cần ghét cảm giác nhàm chán. Và tôi nghĩ máy tính không bao giờ có thể thấy chán.” Mặt khác, người ta thường dùng những từ “sáng tạo”, “truyền cảm hứng” khi nói về những chương trình máy tính như Deep Blue hay AlphaGo. Và sự khó khăn trong việc diễn tả những gì diễn ra bên trong “trí tuệ” của máy móc cũng giống như sự khó khăn khi tìm hiểu chính quá trình suy nghĩ của chúng ta.

Schawinski mới bỏ môi trường hàn lâm để làm việc trong lĩnh vực tư nhân. Ông hiện dẫn dắt Modulos, một công ty khởi nghiệp với nhiều nhân viên là các nhà khoa học của ETH Zurich. Trên trang chủ, công ty tự giới thiệu là “ở trong mắt bão của sự phát triển trí tuệ nhân tạo và học máy”. Dù có những trở ngại nào chắn giữa công nghệ trí tuệ nhân tạo hiện nay và trí tuệ nhân tạo hoàn thiện, Schawinski và những chuyên gia khác vẫn tin rằng máy móc sẽ làm ngày càng nhiều công việc của các nhà khoa học. Có giới hạn hay không thì còn chưa biết.

“Liệu chúng ta có thể, trong một tương lai gần, sử dụng những linh kiện sinh học, tạo ra một cỗ máy có thể khám phá những tri thức vật lý và toán học mà những con người thông minh nhất cũng không thể tự mình tìm ra?” Schawinski băn khoăn. “Liệu tương lai của khoa học có nhất định phải dựa vào những cỗ máy hoạt động ở một trình độ chúng ta không bao giờ đạt tới? Tôi không biết. Đó là một câu hỏi hay.”


1 Còn gọi là thiên hà Tiên Nữ, là một thiên hà gần với dải Ngân Hà của chúng ta.

2 “Fermilab”, bang Illinois, Mỹ.

3 Generative adversarial networks (GAN).

4 Tác giả có chút nhầm lẫn: bài báo được nói đến là “Exploring galaxy evolution with generative models”, đăng trên số tháng 8/2018 (volume 616) của tạp chí A&A; “tháng 12/2018” là ngày ghi trên bản thảo lưu tại trang lưu trữ trực tuyến ArXiv.

5 “Tried-and-true”.

6 Heidelberg Institute for Theoretical Studies, Đức.

7 Nguyên văn: “error bars”.

8 Institut de Physique Théorique; CEA: Commissariat à l’Energie Atomique et aux Energies Alternatives – Cơ quan Năng lượng nguyên tử và các Năng lượng thay thế.

9 Perimeter Institute for Theoretical Physics: viện vật lý lý thuyết ở Canada, thành lập năm 1999; “perimeter” có thể hiểu là vòng ngoài, bao quanh.

10 Thực ra là hai thập kỷ.

11 Genome.

12 “Robot makes scientific discovery all by itself”: https://www.wired.com/2009/04/robotscientist/.

13 The Book of Why (2018).