Nếu từng bị yêu cầu chọn những bức ảnh chứa đèn giao thông, xe đạp, xe buýt trong một loạt bức ảnh cho sẵn hay bị bắt gõ lại những chữ và số bị bóp méo trước khi truy cập vào một trang web, bạn đã trải nghiệm sự khó chịu mà mã CAPTCHA gây ra.
CAPTCHA - viết đầy đủ là Completely Automated Public Turing test to tell Computers and Humans Apart (Thử nghiệm Turing công khai hoàn toàn tự động để phân biệt máy tính và con người) - được phát triển cách đây 20 năm để ngăn tin tặc dùng phần mềm tự động hay bot để tấn công trang web.
Dù vậy, CAPTCHA gây phiền toái và mất thời gian cho người dùng. Trong nhiều trường hợp, rất khó đáp ứng yêu cầu của các bài kiểm tra. Chẳng hạn, khi được yêu cầu chọn các bức ảnh có đèn giao thông, liệu một mảnh cực nhỏ của chân cột đèn có được tính là đèn giao thông hay không? Với dạng CAPTCHA gõ lại văn bản biến dạng, nhiều khi ký tự bị bóp méo đến mức khó phân biệt được là chữ hay số nào.
Hình minh họa. Nguồn: Getty Images
Giờ đây, CAPTCHA gặp phải một điểm yếu nữa khiến nó gần như vô nghĩa. Các bot tự động giải CAPTCHA còn chính xác hơn con người, theo các nhà nghiên cứu tại Đại học California (Mỹ) sau khi thử nghiệm một số loại CAPTCHA trên 1.400 người. Họ phát hiện các bot không chỉ giải các dạng CAPTCHA nhận dạng hình ảnh, câu đố và văn bản bị bóp méo chính xác hơn con người, mà còn nhanh hơn.
"CAPTCHA đã phát triển về mức độ phức tạp và đa dạng, ngày càng trở nên khó giải đối với cả bot và con người" - Andrew Searles, tác giả của bài báo có tiêu đề "Nghiên cứu thực nghiệm và đánh giá các CAPTCHA hiện đại", cho biết. Bài báo đã được đăng trên arXiv.
"Nhưng những tiến bộ về thị giác máy tính và học máy đã làm tăng đáng kể khả năng nhận dạng văn bản bị biến dạng của bot, với độ chính xác hơn 99%", Searles nói. Trong nghiên cứu của họ, bot bẻ khóa CAPTCHA văn bản biến dạng với độ chính xác gần 100%. Trong khi đó, con người đạt được độ chính xác từ 50-84%. Và con người cần tới 15 giây để giải CAPTCHA, trong khi bot cần chưa đầy một giây.
“Không cần nghiên cứu cũng có thể kết luận người dùng mạng không thích CAPTCHA. Nhưng điều chưa ai biết là nỗ lực đó có liệu có đáng không" - theo Gene Tsudik, một tác giả khác của bài báo.
Các bot cũng tỏ ra xuất sắc trong việc giải các loại CAPTCHA khác. Gây nhiều khó khăn cho bot nhất là dạng CAPTCHA chọn hình ảnh, dù vậy hiệu suất giải dạng CAPTCHA này của bot vẫn tốt hơn con người.
"Không còn thể dễ dàng dùng thử thách hình ảnh hay thử thách nào khác để phân biệt con người và bot nữa", Searles nói. Thay vào đó, nhóm nghiên cứu khuyến nghị các nhà phát triển web tận dụng những tiến bộ của AI để thiết kế các thuật toán thông minh nhận dạng dấu hiệu hoạt động và thao tác khác nhau giữa người và bot, dựa trên loạt thao tác, mức độ lặp lại và khoảng cách thời gian giữa các thao tác.
Nguồn:
Ngọc Đỗ