Chương trình chơi cờ vây AlphaGo Zero không chỉ tự học chơi cờ mà còn phát minh ra những nước đi mới chỉ trong vài ngày.

AlphaGo Zero tự rèn luyện khả năng chơi cờ siêu việt. Ảnh: Guardian.
AlphaGo Zero tự rèn luyện khả năng chơi cờ siêu việt. Ảnh: Guardian.

Chương trình chơi cờ vây AlphaGo Zero của DeepMind, công ty trí tuệ nhân tạo thuộc Google, đúc kết hàng nghìn năm kiến thức của con người về trò chơi và tự phát minh ra những nước đi mới chỉ trong ba ngày, Guardian hôm 18/10 đưa tin.

AlphaGo Zero được ca ngợi là bước tiến vượt bậc vì khả năng tự học thành thạo trò chơi trong khi con người không trợ giúp gì ngoài nêu luật chơi. Nó thắng áp đảo phiên bản cũ năm 2015, phiên bản từng đánh bại Lee Sedol, kiện tướng cờ vây người Hàn Quốc.

Kỳ tích này đánh dấu một bước tiến mới trong việc các trí tuệ nhân tạo đa nhiệm làm được nhiều hơn là chơi cờ thắng con người. Vì AlphaGo Zero tự học từ con số 0 nên khả năng của nó có thể được sử dụng cho các vấn đề thiết thực khác. AlphaGo Zero đang nghiên cứu quá trình protein cuốn gấp, một thách thức khoa học lớn có thể phục vụ cho phát triển thuốc.

"Với chúng tôi, AlphaGo không phải chỉ để chiến thắng các trận cờ vây. Đây là một bước tiến lớn trong việc thiết lập những thuật toán đa nhiệm", Demis Hassabis, CEO của DeepMind chia sẻ.

Phần lớn trí tuệ nhân tạo bị cho là "hạn hẹp" vì chỉ thực hiện một nhiệm vụ nhất định như phiên dịch hay nhận diện khuôn mặt. Nhưng trí tuệ nhân tạo đa nhiệm có thể làm tốt hơn con người ở nhiều công việc khác nhau. Trong 10 năm tới, Hassabis tin rằng các phiên bản cải tiến của AlphaGo sẽ làm việc cùng con người như những chuyên gia khoa học hay y tế.

Các phiên bản AlphaGo trước đây học nước cờ qua hàng nghìn trận đấu của các kỳ thủ giỏi. Tuy nhiên, AlphaGo Zero học chơi cờ hoàn toàn nhờ tự chơi đi chơi lại hàng triệu lần. Ban đầu nó chỉ đặt quân cờ xuống một cách ngẫu nhiên, nhưng dần dần tiến bộ khi khám phá ra chiến thuật để giành thắng lợi.

Trận đấu giữa AlphaGo và Lee Sedol năm 2016. Ảnh: Erikbenson.
Trận đấu giữa AlphaGo và Lee Sedol năm 2016. Ảnh: Erikbenson.

Điểm then chốt của chương trình là một tập hợp neuron phần mềm kết nối với nhau để tạo nên mạng neuron nhân tạo. Với mỗi lượt đi, mạng neuron này quan sát vị trí các quân cờ trên bàn, tính toán nước đi tiếp theo và khả năng giành chiến thắng.

Sau mỗi trận đấu, AlphaGo Zero lại cập nhật mạng neuron, khiến nó trở thành một kỳ thủ giỏi hơn. Dù vượt trội so với các phiên bản trước, nhưng AlphaGo Zero lại là chương trình đơn giản và thành thạo trò chơi nhanh hơn.

Đây là một chiến tích ấn tượng, Eleni Vasilaki, giáo sư khoa học thần kinh tính toán tại Đại học Sheffield, nhận xét. Nhưng bà cũng chỉ ra, trong khi máy tính đánh bại con người ở những trò chơi cần độ chính xác cao và sự tính toán phức tạp, chúng lại kém xa con người ở những nhiệm vụ khác.

"Trí tuệ nhân tạo thất bại trong các hoạt động cực kỳ đơn giản với con người. Cứ nhìn cách robot thực hiện những hoạt động thường ngày như đi bộ, chạy hay đá bóng xem", Vasilaki nói.

Dù AlphaGo Zero là bước tiến mới cho trí tuệ nhân tạo đa nhiệm, nhưng nó chỉ có thể xử lý những vấn đề được mô phỏng hoàn hảo trên máy tính nên các nhiệm vụ khác, ví dụ như lái xe, sẽ trở nên bất khả thi.

Việc trí tuệ nhân tạo có thể sánh kịp con người ở nhiều nhiệm vụ khác nhau vẫn còn là tương lai xa, Hassabis đánh giá. Điều thiết thực hơn trong thập kỷ tới là sử dụng trí tuệ nhân tạo để giúp con người tìm ra các loại thuốc và vật liệu mới hay khám phá những bí ẩn trong vật lý.