"Bắt chước là một cách tuyệt vời để học", Shikhar Bahl, nghiên cứu sinh tại Viện Robotics (RI) trong Khoa Khoa học Máy tính của Đại học Carnegie Mellon, cho biết.
"Việc để robot thực sự học hỏi từ việc quan sát trực tiếp con người vẫn còn là một vấn đề chưa được giải quyết trong lĩnh vực này, và công việc này đóng góp một bước tiến quan trọng."
Bahl đã làm việc với Deepak Pathak và Abhinav Gupta, cả hai đều là giảng viên của RI, để phát triển một phương pháp học tập mới cho robot có tên là WHIRL, viết tắt của In-the-Wild Human Imitating Robot Learning. WHIRL là một thuật toán hiệu quả để giúp robot bắt chước từ hình ảnh ghi nhận được. Nó có thể học trực tiếp từ các video ghi lại hoạt động của con người và khái quát thông tin đó thành các tác vụ/ hành động, làm cho robot rất dễ học các công việc gia đình. Mọi người liên tục thực hiện các công việc khác nhau trong nhà của họ. Vì thế với WHIRL, robot có thể quan sát các công việc đó, thu thập dữ liệu video và tìm ra cách hoàn thành công việc.
Nguồn ảnh: Đại học Carnegie Mellon
Nhóm đã thêm một máy ảnh và phần mềm WHIRL vào một con robot có sẵn và nó đã học cách thực hiện hơn 20 công việc trong gia đình — từ đóng mở các thiết bị, cửa tủ và ngăn kéo đến đặt nắp nồi, đẩy ghế và thậm chí lấy một túi rác ra khỏi thùng. Mỗi lần, robot quan sát một con người hoàn thành một công việc và sau đó bắt đầu thực hành và học hỏi để tự mình hoàn thành công việc đó. Nhóm đã trình bày nghiên cứu của họ trong tháng này tại hội nghị Robotics: Science and Systems ở New York.
Pathak, một trợ lý giáo sư tại RI và là thành viên của nhóm cho biết: “Công trình này đưa ra một cách để đưa robot vào cuộc sống gia đình. Thay vì lập trình hoặc đào tạo sẵn robot để hoàn thành các công việc khác nhau trước khi đưa chúng vào sử dụng trong gia đình, công nghệ này cho phép chúng tôi đưa robot vào gia đình và sau đó chúng mới học cách làm các công việc và thích nghi với các môi trường khác nhau, chỉ bằng cách quan sát con người."
Các phương pháp hiện tại để dạy robot một công việc/ tác vụ thường dựa vào việc học bắt chước hoặc tăng cường. Trong học bắt chước, con người vận hành thủ công một robot để dạy nó cách hoàn thành công việc. Quá trình này phải được thực hiện nhiều lần cho một công việc/ tác vụ trước khi robot học xong. Trong học tập tăng cường, robot thường được đào tạo qua hàng triệu lần vận hành giả định trong phần mềm mô phỏng và sau đó điều chỉnh kết quả cho phù hợp với thế giới thực.
Cả hai mô hình học tập đều hoạt động tốt khi dạy robot một tác vụ trong môi trường có cấu trúc, nhưng chúng rất khó mở rộng và triển khai trong các môi trường thực tế. WHIRL có thể học từ bất kỳ video nào về một con người đang thực hiện một công việc/ tác vụ. Nó có thể dễ dàng mở rộng, không bị giới hạn trong một nhiệm vụ cụ thể và có thể hoạt động trong môi trường gia đình thực tế. Nhóm thậm chí đang làm việc trên một phiên bản WHIRL được đào tạo bằng cách xem các video về tương tác giữa con người với nhau từ YouTube và Flickr.
Sự tiến bộ trong thị giác máy tính đã làm cho nghiên cứu này trở nên khả thi. Sử dụng các mô hình được đào tạo bằng dữ liệu internet, máy tính giờ đây có thể hiểu và lập mô hình chuyển động dưới dạng 3D. Nhóm đã sử dụng các mô hình này để hiểu chuyển động của con người, tạo điều kiện cho việc đào tạo WHIRL.
Với WHIRL, robot có thể hoàn thành các nhiệm vụ trong môi trường thực tế thông thường ở các gia đình, mà không cần đến các thiết bị, cửa ra vào, ngăn kéo, nắp đậy, ghế và túi đựng rác không được sửa đổi hoặc chế tác sao cho phù hợp với hoạt động của robot. Mặc dù robot có thể không hoàn thành công việc/ tác vụ bằng các chuyển động giống như con người, nhưng đó không phải là mục tiêu. Con người và robot có các bộ phận khác nhau, và cách di chuyển khác nhau. Điều quan trọng là kết quả cuối cùng là như nhau. Robot vẫn có thể mở cửa, bật công tắc hay vòi nước.
Tuy nhiên, Pathak nói: “Để mở rộng quy mô robot trong thực tế, dữ liệu phải đáng tin cậy và ổn định, và các robot phải có cơ hội thực hành trong môi trường thực.”
Nguồn: https://techxplore.com/news/2022-07-robots-household-tasks-humans.html