Quốc Lê, nhà khoa học máy tính tại Google, cùng các đồng nghiệp đã tạo ra một phần mềm có thể phát triển các chương trình AI tự tiến hóa theo đúng nghĩa đen.

Nhóm nghiên cứu đã tạo ra phần mềm "mượn" các khái niệm từ thuyết tiến hóa của Darwin, bao gồm cả "sự sống sót của kẻ mạnh nhất", để xây dựng các chương trình AI có khả năng tự cải thiện từ thế hệ này qua thế hệ khác mà không cần can thiệp của con người.

"Trong khi hầu hết mọi người đang đi những bước chập chững, họ đã có một bước nhảy của người khổng lồ vào những điều chưa biết," Risto Miikkulainen, nhà khoa học máy tính tại Đại học Texas, Austin, người không tham gia nghiên cứu, cho biết. "Đây là một trong những bài báo có thể khởi động rất nhiều nghiên cứu trong tương lai."


Xây dựng một thuật toán AI cần có thời gian. Lấy ví dụ như mạng thần kinh - một loại hình học máy phổ biến được sử dụng để dịch ngôn ngữ và lái xe ô tô. Các mạng này bắt chước một cách tương đối cấu trúc của não và học hỏi từ việc huấn luyện dữ liệu bằng cách thay đổi sức mạnh của các kết nối giữa các tế bào thần kinh nhân tạo. Các chuỗi tế bào thần kinh nhỏ hơn thực hiện các nhiệm vụ cụ thể, ví dụ như phát hiện ra các biển chỉ đường. Để tìm ra cách kết nối cho mạng thần kinh như thế hoạt động liền mạch, các nhà nghiên cứu có thể mất nhiều tháng.

Những năm gần đây, các nhà khoa học đã đẩy nhanh quá trình bằng cách tự động hóa một số bước. Nhưng các chương trình này vẫn dựa vào việc ghép các chuỗi tế bào thần kinh nhân tạo có sẵn. Có nghĩa là đầu ra vẫn bị giới hạn bởi trí tưởng tượng và những thiên kiến của của các kỹ sư.

Vì vậy, Quốc Lê [hay Lê Viết Quốc theo cách gọi Việt Nam], nhà khoa học máy tính tại Google, và các đồng nghiệp đã tạo ra một phần mềm có tên AutoML-Zero, có thể phát triển các chương trình AI không cần đầu vào từ con người, chỉ sử dụng các khái niệm toán học cơ bản mà một học sinh trung học cũng biết. "Mục tiêu cuối cùng của chúng tôi là thực sự phát triển các khái niệm học máy mới lạ," Quốc Lê nói.

Phần mềm này khám phá ra các thuật toán mới bằng cách sử dụng một mô phỏng tương đối quá trình tiến hóa.

Nó bắt đầu bằng cách tạo ra một quần thể gồm 100 thuật toán ứng viên nhờ kết hợp ngẫu nhiên các phép toán. Sau đó, nó kiểm tra các phép toán này bằng một nhiệm vụ đơn giản, chẳng hạn như một vấn đề nhận dạng hình ảnh, trong đó nó phải quyết định xem một bức ảnh là hình con mèo hay chiếc xe tải.

Trong mỗi chu kỳ, nó so sánh hiệu suất của các thuật toán với các thuật toán được thiết kế thủ công. Các bản sao của những thuật toán tốt nhất sẽ được "biến đổi gen" bằng cách thay thế, chỉnh sửa hoặc xóa một số mã của chúng một cách ngẫu nhiên để tạo ra các biến thể nhỏ. Thế hệ kế tiếp được thêm vào trong quần thể, trong khi các chương trình cũ hơn bị loại bỏ. Chu kỳ lặp lại liên tục.

Hệ thống này tạo ra hàng ngàn quần thể như vậy cùng một lúc, cho phép nó lướt qua hàng chục ngàn thuật toán trong một giây cho đến khi tìm thấy giải pháp tốt nhất. Chương trình cũng sử dụng các thủ thuật để tăng tốc độ tìm kiếm, như thỉnh thoảng trao đổi thuật toán giữa các quần thể để tránh gặp ngõ cụt tiến hóa và tự động loại bỏ các thuật toán trùng lặp.

Trong một tiền xuất bản phẩm được công bố trên arXiv vào tháng trước, các nhà nghiên cứu cho thấy phương pháp này có thể trùng lặp với một số kỹ thuật học máy cổ điển, bao gồm cả mạng lưới thần kinh. Các giải pháp còn đơn giản so với các thuật toán tiên tiến nhất hiện nay, Quốc Lê thừa nhận nhưng nói rằng công việc này là một bằng chứng về nguyên tắc và có thể được mở rộng để tạo ra các AI phức tạp hơn nhiều.

Joaquin Vanschoren, nhà khoa học máy tính tại Đại học Công nghệ Eindhoven, cho rằng sẽ phải mất một thời gian trước khi phương pháp này có thể cạnh tranh với các công nghệ tiên tiến nhất. Một việc có thể giúp cải thiện chương trình này, ông nói, là không yêu cầu nó bắt đầu tìm các thuật toán từ đầu, mà thay vào đó bắt đầu từ một số thủ thuật và kỹ thuật mà con người đã phát hiện ra.

Đó chính là việc mà Quốc Lê dự định làm. Tập trung vào các bài toán nhỏ thay vì toàn bộ các thuật toán cũng là một hướng hứa hẹn khác, anh nói thêm. Nhóm của anh đã xuất bản một bài báo khác trên arXiv vào ngày 6/4, sử dụng cách tiếp cận tương tự để thiết kế lại một thành phần làm sẵn phổ biến được sử dụng trong nhiều mạng thần kinh.

Nhưng Quốc Lê cũng tin rằng việc tăng số lượng các phép toán trong kho và dành nhiều tài nguyên điện toán hơn cho chương trình có thể cho phép phần mềm khám phá các khả năng AI hoàn toàn mới. "Đó là một hướng mà chúng tôi thực sự đam mê," anh nói. "Để khám phá một cái gì đó mang tính nền tảng mà con người sẽ mất rất nhiều thời gian mới tìm ra được."

Nguồn: