Với một chiếc điện thoại thông minh và trình duyệt Internet, mọi người trên toàn thế giới có thể tương tác với robot để đẩy nhanh quá trình dạy robot thực hiện các nhiệm vụ cơ bản.

Tại tầng hầm tòa nhà Khoa học máy tính Gates của Đại học Stanford (Mỹ), màn hình gắn liền với một cánh tay robot màu đỏ sáng lên và đôi mắt máy tính bắt đầu nhấp nháy. "Đây là Bender", Ajay Mandlekar, nghiên cứu sinh ngành kỹ thuật điện của trường, giới thiệu.

Nhóm nghiên cứu của ĐH Stanford sử dụng phần mềm hướng dẫn robot cầm nắm đồ (Ảnh: L.A. Cicero)
Nhóm nghiên cứu của ĐH Stanford sử dụng phần mềm hướng dẫn robot cầm nắm đồ
(Ảnh: L.A. Cicero)

Bender là một trong những cánh tay robot mà nhóm nghiên cứu của ĐH Stanford sử dụng để thử nghiệm hai nền tảng (framework) khi phối hợp cùng nhau có thể giúp việc dạy các kỹ năng cơ bản cho robot nhanh và dễ dàng hơn. Nền tảng RoboTurk cho phép mọi người dùng điện thoại thông minh và trình duyệt làm mẫu công việc (ví dụ: cầm đồ vật) cho cánh tay robot trong thời gian thực. Nền tảng thứ hai SURREAL tăng tốc quá trình học tập của robot bằng cách chạy đồng thời nhiều mẫu mô phỏng nhằm giúp robot học hỏi từ nhiều kinh nghiệm cùng lúc.

"Với nền tảng RoboTurk và SURREAL, chúng tôi có thể đẩy giới hạn có thể làm của robot bằng cách kết hợp nhiều dữ liệu thu thập từ con người với việc học tăng cường (Reinforcement Learning) - Mandlekar, thành viên nhóm phát triển, cho biết. Nhóm sẽ trình bày về RoboTurk và SURREAL tại hội nghị học máy ở Zurich, Thụy Sĩ vào cuối tháng 10.

Người dạy robot

Yuke Zhu, nghiên cứu sinh tiến sĩ về khoa học máy tính và là thành viên của nhóm nghiên cứu, minh họa cách hệ thống hoạt động bằng một ứng dụng trên iPhone. Anh hướng dẫn cánh tay robot - như bộ phận gắp/kẹp cơ học trong trò chơi gắp quà - di chuyển bên trên phần thưởng của nó: một khối gỗ được vẽ thành hình miếng thịt nướng. Đây là một nhiệm vụ đơn giản, bao gồm nhận diện khối gỗ đó, nhặt nó lên và đặt vào đúng thùng ghi nhãn.

Với con người, nhiệm vụ trên hết sức dễ dàng, nhưng với robot hiện nay, đây là một công việc tương đối khó khăn. Thông thường, robot học bằng cách tương tác với môi trường xung quanh và thường tạo ra nhiều cử chỉ tay di chuyển ngẫu nhiên hoặc học từ các tập dữ liệu lớn. Những cách này đều không hiệu quả như khi được con người giúp đỡ. Việc chúng ta làm mẫu những công việc cụ thể cho robot cũng giống như cách cha mẹ cầm tay dạy trẻ con đánh răng.

Tuy nhiên, những bài học đó không phải lúc nào cũng hoàn hảo. Khi Zhu ấn vào màn hình điện thoại và robot nhả tay cầm ra, miếng gỗ bị đập vào rìa thùng và rơi xuống bàn. "Con người vẫn chưa tối ưu hóa được việc học này”, Mandlekar nói, "nhưng với robot, kinh nghiệm như trên là không thể thiếu.”

Đẩy nhanh việc học song song

Những thử nghiệm, gồm cả những lần thất bại, đều cung cấp thông tin vô giá. Các động tác thao diễn được thu thập bởi RoboTurk sẽ cung cấp kiến thức nền để robot khởi động việc học tập, trong khi SURREAL sẽ cùng lúc chạy hàng nghìn trải nghiệm mô phỏng của con người trên khắp thế giới nhằm tăng tốc quá trình học tập của robot.

"Với SURREAL, chúng tôi muốn đẩy nhanh sự tương tác với môi trường", Linxi Fan, thành viên của nhóm nghiên cứu cho biết. Các nền tảng này làm tăng đáng kể lượng dữ liệu cho robot học hỏi.

Animesh Garg, một thành viên khác, nhấn mạnh: “Hai nền tảng song sinh kết hợp với nhau tạo ra một cơ chế cho phép con người hỗ trợ AI thực hiện các nhiệm vụ ở nơi chúng ta cần đưa con người tránh xa khỏi môi trường nguy hiểm trong khi vẫn duy trì được mức độ thành thạo tương tự trong việc thực thi nhiệm vụ.”

Trong tương lai, robot sẽ là một phần không thể tách rời của cuộc sống hàng ngày, từ giúp việc gia đình, thực hiện các nhiệm vụ lắp ráp trong nhà máy sản xuất cho đến hoàn thành các nhiệm vụ nguy hiểm đe dọa đến tính mạng con người. “Khi đó, chúng ta không muốn phải chỉ đạo robot xoay cánh tay 20 độ và tiến về phía trước 10cm,” Zhu nói, “chúng ta muốn bảo robot hãy đi vào bếp và lấy một quả táo ra đây.”

Các thành viên hiện tại của nhóm RoboTurk và SURREAL bao gồm Ajay Mandlekar, Yuke Zhu, Fan Linxi, Animesh Garg và các giảng viên Fei-Fei Li và Silvio Savarese.

Nguồn: