Để phát hiện hành vi đạo văn trong các văn bản học thuật, nhất là trong khoa học xã hội nếu chỉ sử dụng kiến thức, kinh nghiệm thì giới chuyên môn khó có thể kiểm tra và phát hiện hết các lỗi, bởi ngày nay nguồn thông tin tham khảo rất rộng lớn.

Do đó, một phần mềm chuyên dụng giúp kiểm tra hiện tượng đạo văn này là rất hữu ích và gần đây mới được áp dụng trong một số trường đại học ở Việt Nam.

“Trước đây, thông thường để phát hiện hành vi đạo văn, chúng tôi sử dụng cách rất đơn giản là google search, chỉ cần điền những đoạn văn bất kỳ hoặc thấy có nghi ngờ vào google để tìm xem có những nội dung tương tự trên Internet không. Thứ hai là chúng tôi tìm kiếm trong cơ sở dữ liệu của trường có những văn bản nào có nội dung tương tự với đoạn mà chúng tôi cần kiểm chứng không”, TS. Nguyễn Lưu Bảo Đoan, Khoa Kinh tế, ĐH Kinh tế TP Hồ Chí Minh cho biết.

Nhưng cách làm này có hạn chế, đó là người kiểm tra sẽ chỉ rà soát được những đoạn nào cảm thấy có dấu hiệu ‘nghi ngờ’ trong khi trên thực tế các văn bản học thuật như luận văn, luận án, công trình nghiên cứu khoa học thường rất dài, khó lòng thực hiện thao tác “copy” và “paste” từng đoạn bằng tay để kiểm tra toàn văn. Trong khi đó, các trường đại học, tạp chí và nhà xuất bản trên thế giới hiện nay cũng sử dụng công cụ độc lập, giúp kiểm tra tự động trên văn bản và có những quy định chặt chẽ về tỉ lệ trùng lắp trong các văn bản học thuật một cách rất phổ biến.

“Do đó, từ năm 2017, trường chúng tôi quyết định sử dụng phần mềm Turnitin, một trong số rất ít công cụ độc lập được sử dụng phổ biến nhằm phát hiện, kiểm tra các lỗi đạo văn một cách tốt nhất”, TS. Nguyễn Lưu Bảo Đoan nói. Ưu điểm của phần mềm Turnitin này là có thể tự động kiểm tra, xác minh việc trích dẫn không đúng cách hay khả năng đạo văn bằng cách so sánh văn bản với cơ sở dữ liệu học thuật rất lớn, bao gồm dữ liệu từ các nhà xuất bản, tạp chí trên thế giới, dữ liệu từ các website (tổng cộng có khoảng 45 tỷ trang web, hơn 337 triệu bài làm của sinh viên và hơn 130 triệu bài viết từ các cuốn sách và các ấn bản học thuật). Ngoài ra, Turnitin cũng kết nối với toàn bộ cơ sở dữ liệu của tất cả các trường đại học đã mua bản quyền sử dụng Turnitin.

Đại học Kinh tế TP. Hồ Chí Minh đã có quy định: Các sản phẩm học thuật được xem là phạm lỗi đạo văn nếu theo kết quả kiểm tra của Turnitin, có ít nhất sao chép nguyên văn một đoạn văn có 100 từ trở lên; hoặc có từ 20% văn bản giống với các nguồn dữ liệu của các tác giả khác hoặc chỉ thay đổi tên đề tài, từ ngữ, số liệu nhưng giữ nguyên cấu trúc và nội dung tương tự các công trình khác. Một số trường đại học khác như ĐH Hoa Sen, ĐH Tôn Đức Thắng, ĐH Hàng hải Việt Nam cũng có các quy định chặt chẽ về hành vi đạo văn, cách thức kiểm soát và xử lý đạo văn các sản phẩm học thuật tương tự như vậy.

Ảnh minh họa. Nguồn: The-Scientist

Cần tránh máy móc

Turnitin cũng được một số nhà nghiên cứu trong lĩnh vực khoa học xã hội và nhân văn ở Việt Nam sử dụng nhằm giúp phát hiện lỗi trùng lắp khi viết bài công bố quốc tế. TS Trần Quang Tuyến, ĐH Kinh tế, ĐH Quốc gia Hà Nội, nhà nghiên cứu được dự án nghiên cứu kinh tế học RePEc (Research Papers in Economics) xếp vào top 10 nhà nghiên cứu kinh tế có nhiều xuất bản quốc tế nhất ở Việt Nam cho biết, anh cũng đã từng sử dụng Turnitin để phát hiện các lỗi trùng lắp.

“Cách đây cũng khá nhiều năm rồi, khi gửi bài cho tạp chí “Review of Development Economic”, tôi kiểm tra và phát hiện thấy lỗi trùng lắp lên tới 30%. Tôi khá ngạc nhiên vì mình không sao chép của bất kỳ ai cả. Sau đó tôi rà soát lại và phát hiện có những khái niệm rất phổ biến, các đoạn trích dẫn về lý thuyết, tên của tác giả cũng được Turnitin tính là trùng nhau”. Sau đó, TS Trần Quang Tuyến đã sửa lại bài viết của mình, đồng thời rút kinh nghiệm để tránh lỗi trùng lắp khi viết các bài tạp chí tiếp theo.

Tuy nhiên, lỗi mà TS. Trần Quang Tuyến vô tình mắc phải cũng cho thấy một vấn đề mà các cơ quan quản lý sử dụng Turnitin cần phải tính đến, đó là tính máy móc của phần mềm. “Đây là công cụ đếm các từ, cụm từ một cách cứng nhắc, cho nên người chấm luận văn, luận án phải thực hiện thêm một số động tác nữa là kiểm tra xem liệu những từ, cụm từ bị thống kê là trùng lắp có phải là những khái niệm phổ biến hay không, từ đó đánh giá tác giả vi phạm lỗi một cách vô tình hay cố ý”, TS. Nguyễn Lưu Bảo Đoan cho biết.

Cân nhắc tới khả năng đó nên ĐH Kinh tế TP. Hồ Chí Minh cũng quy định cho phép các tác giả được quyền sửa lại văn bản học thuật đã bị phát hiện có dấu hiệu trùng lắp trên 30%. Nếu sau lần kiểm tra thứ hai mà Turnitin vẫn phát hiện các lỗi trùng lắp thì đơn vị quản lý trực tiếp sẽ không công nhận các sản phẩm học thuật, không được bảo vệ, không được báo cáo, không đăng bài, chấm dứt hợp đồng.

Bên cạnh đó, theo TS. Nguyễn Lưu Bảo Đoan, việc sử dụng Turnitin trong bối cảnh của Việt Nam vẫn còn có hạn chế nhất định. Đó là hiện nay Turnitin không thể cập nhật cơ sở dữ liệu của tất cả các trường đại học, cơ sở nghiên cứu trong nước bởi vì vẫn có quá ít các đơn vị sử dụng Turnitin (tính đến tháng 10/2017 cả nước mới chỉ có vỏn vẹn 13 trường đại học sử dụng Turnitin). Khi đó, có thể các tác giả sao chép từ nguồn ở các cơ sở dữ liệu mà Turnitin chưa được cập nhật nên cũng không thể phát hiện ra.

Mặt khác, Turnitin cũng chỉ phát huy khả năng “giám sát” một cách tốt nhất khi các trường đại học, cơ sở nghiên cứu số hóa tài liệu thay vì cất trong các kho lưu trữ làm “của riêng”. “Nếu càng có nhiều trường đại học số hóa dữ liệu tốt và mua bản quyền sử dụng Turnitin thì phần mềm này càng phát hiện tốt hơn”, TS. Nguyễn Lưu Bảo Đoan nói.