Công cụ tìm kiếm học thuật lớn nhất đang kỷ niệm 20 năm thành lập, nhưng các đối thủ cạnh tranh dựa trên AI cũng đang nổi lên với ngày càng nhiều lợi thế hơn.

Google Scholar - công cụ tìm kiếm học thuật lớn nhất và toàn diện nhất - vừa tròn 20 tuổi vào trung tuần tháng 11. Hai thập kỷ qua, công cụ này đã trở thành một trong những công cụ quan trọng nhất trong lĩnh vực khoa học, theo nhận định của nhiều nhà nghiên cứu. Tuy nhiên, những năm gần đây, các đối thủ cạnh tranh đã xuất hiện với các nền tảng dựa trên trí tuệ nhân tạo (AI), cho phép người dùng tải dữ liệu xuống, điều mà Google không cho phép.

Hình minh họa. Nguồn: IB Photography/Alamy

Jevin West - nhà khoa học xã hội tính toán tại Đại học Washington, Seattle, cho biết tác động của Google Scholar đối với khoa học là rất đáng kể. Ông sử dụng cơ sở dữ liệu này hằng ngày và nhận xét: “Nếu có một thời điểm Google Scholar có thể bị lật đổ, thì thời điểm đó có lẽ là bây giờ, với những công cụ mới và đổi mới đang diễn ra.”

Alberto Martín Martín - nhà nghiên cứu về trắc lượng thư mục (bibliometrics) tại Đại học Granada, Tây Ban Nha, nhận định rằng nhiều lợi thế của Google Scholar - như truy cập miễn phí, lượng thông tin phong phú và tùy chọn tìm kiếm tinh vi - “đang dần xuất hiện ở các nền tảng khác”.

Các chatbot dựa trên AI như ChatGPT và các công cụ sử dụng mô hình ngôn ngữ lớn (large language models - LLMs) đã trở thành ứng dụng quen thuộc với nhiều nhà khoa học khi tìm kiếm, đánh giá và tóm tắt tài liệu. Một số nhà nghiên cứu đã chuyển từ Google Scholar sang sử dụng các công cụ này. Aaron Tay - thủ thư học thuật tại Đại học Quản lý Singapore, chia sẻ: “Cho đến gần đây, Google Scholar vẫn là công cụ tìm kiếm mặc định của tôi.” Tuy nhiên, ông cho biết đã bắt đầu sử dụng các công cụ AI khác.

Song với quy mô khổng lồ và mức độ gắn bó sâu sắc trong cộng đồng khoa học, Google Scholar vẫn rất khó bị lật đổ, West nói.

Anurag Acharya - đồng sáng lập Google Scholar tại Google, khẳng định ông hoan nghênh mọi nỗ lực nhằm giúp thông tin học thuật dễ dàng được tìm kiếm, hiểu rõ và ứng dụng. “[Các công cụ tìm kiếm] càng làm được nhiều điều thì sự tiến bộ của khoa học càng tốt đẹp hơn,” ông nói.

Google Scholar xuất hiện vào năm 2004 và đã thay đổi toàn bộ lĩnh vực tìm kiếm tài liệu học thuật. Vào thời điểm đó, các nhà nghiên cứu thường tìm kiếm thông tin tại thư viện hoặc thông qua các dịch vụ trực tuyến trả phí như cơ sở dữ liệu Web of Science. Một dịch vụ trả phí khác, Scopus của Elsevier, cũng ra mắt cùng tháng với Google Scholar, cung cấp cơ sở dữ liệu lớn về tài liệu khoa học.

Google Scholar thu thập từ internet tất cả các loại tài liệu học thuật, bao gồm chương sách, báo cáo, bản thảo trước khi xuất bản (preprints) và tài liệu trên web, kể cả những tài liệu không viết bằng tiếng Anh. Theo Acharya - mục tiêu là giúp “các nhà nghiên cứu trên toàn thế giới làm việc hiệu quả hơn và đứng trên nền tảng khoa học chung”.

Google Scholar có các thỏa thuận với các nhà xuất bản, cho phép nó truy cập nội dung đầy đủ của các bài báo nằm sau tường phí (paywall), không chỉ tiêu đề và tóm tắt như nhiều công cụ tìm kiếm khác. Công cụ này xếp hạng bài báo theo mức độ liên quan với truy vấn tìm kiếm, và thường đưa các bài báo được trích dẫn nhiều nhất lên đầu. Ngoài ra, nó còn gợi ý các truy vấn tìm kiếm bổ sung và hỗ trợ tìm kiếm rất cụ thể.

Theo Similarweb, một công cụ đo lường lưu lượng truy cập, Google Scholar nhận được hơn 100 triệu lượt truy cập mỗi tháng, dù Google từ chối chia sẻ dữ liệu sử dụng cụ thể.

Martín Martín nhận xét, Google Scholar rất hữu ích trong việc chỉ dẫn người dùng đến các phiên bản miễn phí của bài báo. Điều này thúc đẩy phong trào truy cập mở (open-access), theo José Luis Ortega - nhà trắc lượng thư mục họctại Viện Nghiên cứu Xã hội Cao cấp thuộc Hội đồng Nghiên cứu Quốc gia Tây Ban Nha.

Tuy nhiên, Google Scholar cũng có điểm mờ. Một trong những quan ngại chính là thiếu thông tin về nội dung, bao gồm những tạp chí nào, mà nó tìm kiếm, và thuật toán được sử dụng để gợi ý bài báo. Ngoài ra, công cụ này cũng giới hạn việc tải xuống hàng loạt kết quả tìm kiếm, có thể sử dụng chophân tích trắc lượng thư mục hoặc các công việc khác.

Những năm gần đây, các đối thủ cạnh tranh đã xuất hiện, cung cấp các loại dữ liệu trắc lượng thư mục mà Google Scholar thiếu, mặc dù không nền tảng nào có thể vượt qua quy mô và khả năng truy cập nội dung toàn văn của Google Scholar. Ví dụ, OpenAlex - ra mắt năm 2022 - cho phép người dùng tìm kiếm theo tác giả, tổ chức và trích dẫn, đồng thời tải xuống toàn bộ cơ sở dữ liệu miễn phí. “Họ đang làm những gì mà chúng tôi muốn Google Scholar làm,” Martín Martín nói.

Một công cụ khác, Semantic Scholar, ra mắt năm 2015, sử dụng AI để tạo các bản tóm tắt dễ đọc và xác định các trích dẫn liên quan nhất. Công cụ Consensus, ra mắt năm 2022, dựa trên cơ sở dữ liệu của Semantic Scholar để trả lời các câu hỏi bằng thông tin nghiên cứu.

Undermind, một công cụ khác, sử dụng phương pháp tìm kiếm agent-based search. [Đây là một mô hình được lập trình để thu thập thông tin từ cơ sở dữ liệu hoặc các nguồn tài nguyên trực tuyến. Dựa trên thông tin tìm được, mô hình sẽ điều chỉnh chiến lược tìm kiếm của nó, chẳng hạn như mở rộng tìm kiếm với các thuật ngữ liên quan hoặc giảm trọng số khi thấy nội dung không phù hợp, hiểu ngữ cảnh và nội dung. Cách này mô phỏng cách con người quét tài liệu khoa học.] Tay nhận xét rằng kết quả từ Undermind thường chất lượng cao hơn Google Scholar, dù mất vài phút để xử lý.

Google Scholar cũng đã ứng dụng AI, chẳng hạn để xếp hạng bài báo, gợi ý truy vấn tìm kiếm và đề xuất bài liên quan. Gần đây, Google giới thiệu tính năng tạo phác thảo bài báo bằng AI trên trình đọc PDF của mình. Tuy nhiên, Acharya cho biết việc tóm tắt kết luận từ nhiều bài báo một cách ngắn gọn và đầy đủ bối cảnh vẫn là thách thức chưa có giải pháp hiệu quả.

Mặc dù các đối thủ cạnh tranh dựa trên AI đang phát triển, Google Scholar vẫn giữ vị thế vững chắc nhờ quy mô và ảnh hưởng sâu rộng trong cộng đồng khoa học. Những đổi mới và cải tiến liên tục sẽ quyết định liệu công cụ này có duy trì được vị trí dẫn đầu hay không.

Nguồn: