Các nhà nghiên cứu Thea Sommerschield, Jonathan Prag (Đại học Oxford) và Yannis Assael (DeepMind) đã phát triển Pythia - một mạng lưới thần kinh nhân tạo dự đoán các ký tự hoặc từ ngữ bị khuyết giúp khôi phục các văn tự Hi Lạp cổ đại.

Các văn khắc (văn tự được khắc trên các bề mặt như đá, gốm ceramic hoặc kim loại) được lựa chọn có niên đại từ 1500 đến 2600 năm.

Văn khắc một nghị định có nội dung liên quan tới Thành Athens có niên đại vào khoảng năm 485-484 trước Công nguyên. Ảnh: WikiMedia.

Công trình nghiên cứu đăng trên tạp chí New Scientist còn cho rằng trí tuệ nhân tạo (AI) đã vượt qua con người trong việc giải mã các văn bản khắc đã bị hư hại theo thời gian.

Trong một bài kiểm tra với nhiệm vụ hoàn thiện 2949 văn khắc không còn nguyên vẹn, các chuyên gia con người có tỉ lệ mắc lỗi cao hơn 30% so với AI. Trong khi các chuyên gia mất 2 giờ đồng hồ để xử lý 50 văn tự, Pythia chỉ mất vài giây để xử lý lượng văn bản tương đương.

Hiểu rằng việc khôi phục văn tự cổ là một nhiệm vụ đòi hỏi nhiều thời gian – kể cả với những chuyên gia nghiên cứu văn khắc, các tác giả nghiên cứu tiến hành đánh giá độ khó của việc khôi phục thủ công, từ đó rút ra nhận xét về tầm ảnh hưởng của công trình. Hai nghiên cứu sinh tiến sĩ có chuyên môn về văn khắc học đã tham gia hỗ trợ nghiên cứu và được cho phép sử dụng mô hình huấn luyện học máy để tìm các điểm tương đồng.

Mặc dù AI có biểu hiện tốt hơn con người trong việc tìm được các từ còn thiếu, song không hề có sự cạnh tranh nào ở đây. Thay vào đó, kỹ thuật của AI có thể được phát huy tốt nhất như một công cụ bổ trợ, giúp các nhà nghiên cứu thu hẹp phạm vi lựa chọn.

Qua nhiều thế kỉ, rất nhiều các văn khắc cổ đại đã bị bào mòn hoặc không còn nguyên vẹn và chỉ còn một số ít là hoàn thiện và có thể đọc được. Do đó, để tìm được các ký tự bị mất, cần phải xét toàn bộ nội dung văn khắc và nghiên cứu các văn bản tương tự.

Theo báo cáo trên New Scientist, Pythia có khả năng nhận diện các xu hướng chung trong số 3 triệu từ trên các văn bản thuộc 35000 di tích khác nhau. Các xu hướng này bao gồm bối cảnh xuất hiện của các từ khác nhau, ngữ pháp, cũng như hình dạng và bố cục của chữ khắc.

Thành tựu nghiên cứu được nhấn mạnh trên tiêu đề: “Khôi phục văn tự cổ bằng học sâu (deep learning): một nghiên cứu trên văn khắc Hi Lạp.” Pythia, với nhiệm vụ hỗ trợ các nhà nghiên cứu văn khắc, đưa ra không chỉ một mà nhiều dự đoán kèm theo ước đoán mức độ chính xác với từng kết quả hiển thị. Cụ thể, công cụ trí tuệ nhân tạo sẽ cung cấp Top 20 bản dự đoán được giải mã bằng thuật toán tìm kiếm beam (beam search) và để con người tự quyết định chọn bản phù hợp nhất.

Nhóm nghiên cứu cũng đề cập đến tiềm năng trong tương lai của Pythia, đồng thời nhấn mạnh ý nghĩa của sự kết hợp giữa học máy (machine learning) và văn khắc học tới việc nghiên cứu các nền văn hóa cổ đại.

Nguồn: https://techxplore.com/news/2019-10-deep-enlightens-scholars-puzzling-ancient.html