Trong hơn hai thập kỷ qua, danh sách Các nhà nghiên cứu được trích dẫn nhiều nhất (Highly Cited Researchers - HCR) đã giúp vinh danh những đóng góp khoa học có ảnh hưởng toàn cầu. Nhưng đằng sau báo cáo ra mắt hằng năm này là một câu chuyện đang thay đổi về quyền sở hữu, các phương pháp luận, và cách nó được sử dụng, khai thác.
Trong suốt 20 năm, tháng 11 luôn đánh dấu một sự kiện thu hút sự chú ý đáng kể từ cộng đồng khoa học, đó là việc công bố danh sách HCR. Danh sách này xác định các nhà nghiên cứu có ảnh hưởng nhất thông qua việc đã xuất bản nhiều bài báo nhất thuộc 1% bài báo được trích dẫn thường xuyên nhất trong một lĩnh vực, xem xét ở quy mô toàn cầu trong 11 năm liên tiếp. Mỗi năm, HCR có từ 6.000 đến 7.000 nhà nghiên cứu trên 22 lĩnh vực chính.
Giống như các chỉ số đánh giá hiệu suất nghiên cứu định lượng khác, HCR không tránh khỏi các nhận xét trái chiều về mặt phương pháp luận cũng như khả năng bị lạm dụng. Stuart Macdonald, Giáo sư thỉnh giảng, Khoa Quản lý, Đại học Leicester (Anh), qua một bản thảo (preprint) đã chia sẻ quan ngại về việc một số cơ sở giáo dục đại học và một số nhà khoa học lạm dụng việc có thể ghi danh nhiều cơ sở liên kết và ghi danh nhiều tác giả vào một nghiên cứu để thao túng lượng trích dẫn của một nhà khoa học cũng như cơ sở khoa học đi kèm. Hai nhà nghiên cứu đến từ Đại họcFreiburg (Đức) trong một bài báo công bố trên Scientometrics lại bày tỏ lo lắng rằng việc Clarivate không tiết lộ các bộ lọc bổ sung để loại trừ các tác giả có hoạt động trích dẫn đáng ngờ là không minh bạch, khiến cho việc kiểm chứng các kết quả của danh sách HCR trở nên khó khăn.
Nghiên cứu gần đây trên tạp chí Quantitative Science Studies của Lauranne Chaignon, nhà trắc lượng thư mục học ở Đại học PSL (Pháp), đã xem xét lại sự phát triển của danh sách HCR và cho thấy, theo thời gian, danh sách này đã biến đổi đáng kể cả về nhà sản xuất cũng như cách nó được tạo ra và sử dụng. Được hình thành như một công cụ mô tả, giám sát, HCR dần dần trở thành đối tượng bị thao túng, và cần phải đặt câu hỏi về sự phù hợp của việc sử dụng nó trong các mục đích như xếp hạng đại học hay đánh giá cá nhân nhà nghiên cứu để tuyển dụng, bổ nhiệm.
Lược sử về HCR
Lịch sử của danh sách HCR ban đầu gắn liền với Viện Thông tin Khoa học (ISI). Được Eugene Garfield thành lập vào năm 1960, ISI đứng sau việc tạo ra các chỉ số trích dẫn đầu tiên và từ đó là sự ra đời của cơ sở dữ liệu thư mục Web of Science.
Ngay từ những năm 1980, Garfield đã công bố nhiều công trình, trong đó ông tìm cách xác định “1.000 nhà khoa học đương đại được trích dẫn nhiều nhất từ năm 1965 đến năm 1978”. 20 năm sau, nhóm của ông ra mắt cổng Highlycited.com, được coi là danh sách HCR đầu tiên, với mục tiêu tiếp tục các nỗ lực của ông. ISI vẫn phụ trách việc sản xuất danh sách này, mặc dù đã được JPT Publishing mua lại vào năm 1988 và sau đó là Thomson Corporation vào năm 1992.
Năm 2008, Thomson hợp nhất với Reuters. ISI được sáp nhập vào bộ phận Kinh doanh Sở hữu Trí tuệ & Khoa học của Thomson Reuters. Cùng lúc, cổng HighlyCited.com bị đóng cửa. Dữ liệu không còn được cập nhật, và danh sách bị bỏ quên cho đến khi nó xuất hiện trở lại vào cuối năm 2012, với một phương pháp luận hoàn toàn mới.
Cuối cùng, vào năm 2016, bộ phận Kinh doanh Sở hữu Trí tuệ & Khoa học của Thomson Reuters trở thành một phần của Clarivate Analytics, một công ty đã quyết định tái thành lập Viện Thông tin Khoa học vào năm 2018. Ngày nay, danh sách HCR tiếp tục được xuất bản, và phương pháp luận của nó tiếp tục phát triển.
Những thay đổi lớn về phương pháp luận
Trong suốt lịch sử của mình, danh sách HCR đã trải qua một số thay đổi về phương pháp luận, đi kèm với đó là sự thay đổi không ngừng về định nghĩa “các nhà nghiên cứu được trích dẫn nhiều nhất”.
Những thay đổi này bao gồm khung thời gian của các ấn phẩm và trích dẫn liên quan, số lượng tác giả được chọn, cũng như cách tính các bài báo được trích dẫn nhiều, cách tính lượng công bố từ các nhóm nghiên cứu lớn và cách quản lý các hồ sơ liên ngành.
Chẳng hạn, danh sách đầu tiên vào năm 2001 chỉ đơn giản chọn ra 250 nhà nghiên cứu có trích dẫn cao nhất trong mỗi lĩnh vực. Từ năm 2014, Clarivate bắt đầu sử dụng một phương pháp phức tạp hơn: họ xác định các tác giả có bài báo nằm trong top 1% được trích dẫn nhiều nhất trong từng lĩnh vực và năm xuất bản (xét trong khoảng thời gian 11 năm). Các nhà nghiên cứu được xếp hạng dựa trên số lượng bài báo được trích dẫn nhiều mà họ sở hữu. Để lọt vào danh sách HCR cuối cùng, nhà nghiên cứu cần thỏa mãn một trong hai tiêu chí: (1) có thứ hạng cao trong lĩnh vực của mình, hoặc (2) tổng số trích dẫn từ các bài báo được trích dẫn nhiều của họ phải nằm trong top 1% của tất cả các tác giả trong lĩnh vực đó. Các công thức và ngưỡng cụ thể cho việc này là phức tạp và có các thay đổi theo từng năm.
Hay về mặt lĩnh vực nghiên cứu, từ năm 2014 đến 2018, Clarivate gán một lĩnh vực duy nhất cho mỗi tạp chí, sau đó chọn ra các bài báo được trích dẫn nhiều nhất và xem xét các tác giả trong lĩnh vực đó. Một thay đổi quan trọng khác diễn ra từ năm 2018 trở đi, khi Clarivate mở rộng việc xác định các HCR sang cả những nhà nghiên cứu có đóng góp trên nhiều lĩnh vực khác nhau, bằng cách thêm hạng mục “đa ngành” vào danh mục các lĩnh vực đã có.
Chaignon nhận định rằng có hai diễn biến lớn đã làm thay đổi sâu sắc danh sách HCR. Khi cổng HighlyCited.com được tạo ra vào năm 2001, nó ở dạng một cơ sở dữ liệu: danh sách được bổ sung dần dần và thường xuyên với các tên tuổi và lĩnh vực mới, bổ sung vào dữ liệu có sẵn mà không thay thế. Hơn nữa, cơ sở dữ liệu cung cấp tiểu sử (các nghiên cứu đã thực hiện, công việc đã đảm nhiệm, tư cách thành viên của các hiệp hội học thuật, định hướng nghiên cứu, học hàm học vị và giải thưởng đã đạt được) và thông tin thư mục lượng (danh sách các bài báo đã công bố, sách hoặc chương sách, bài viết trên các tạp chí phổ thông, trang web hoặc các nguồn Internet khác liên quan,...) phong phú cho mỗi nhà nghiên cứu. Tuy nhiên, khi danh sách xuất hiện trở lại vào cuối năm 2012, nó đã áp dụng một cách tiếp cận khác: chỉ cung cấp tên, lĩnh vực nghiên cứu và cơ quan liên kết của các nhà nghiên cứu, và điều thú vị là giờ đây nó được xuất bản hằng năm, biến nó thành một sự kiện.
Từ năm 2021 trở đi, một phần bổ sung được gọi là đánh giá “định tính” đi kèm với phương pháp định lượng. Điều này liên quan đến việc kiểm tra kỹ lưỡng hoạt động xuất bản của các nhà nghiên cứu ứng viên để đảm bảo rằng họ tuân thủ các tiêu chuẩn về quyền tác giả và công nhận. Bằng cách này, danh sách quan tâm đến cả năng suất của nhà nghiên cứu, việc họ sử dụng tự trích dẫn và mạng lưới trích dẫn của họ. Phân tích nhằm xác định và loại trừ các nhà nghiên cứu có tác động bị thổi phồng hoặc được tạo ra một cách giả tạo, dựa trên các hành vi được cho là hành vi sai phạm trong khoa học, chẳng hạn như sử dụng tự trích dẫn quá mức hoặc mua trích dẫn từ các “xưởng sản xuất bài báo” (papermills). Phương pháp luận mới này liên quan trực tiếp đến những thay đổi trong cách sử dụng danh sách.
Những thay đổi trong cách sử dụng
Khi danh sách được đề xuất dưới dạng cơ sở dữ liệu vào đầu những năm 2000, nó trước hết là một công cụ giám sát. HCR được thể hiện như một phương tiện để xác định các hợp tác tiềm năng, tìm hiểu về công việc của các nhà khoa học xuất sắc và cập nhật những phát triển hoặc khám phá lớn trong các lĩnh vực khác nhau. Nhiều nhà khoa học đã coi cơ sở dữ liệu này như một nguồn dữ liệu tiềm năng để tiến hành các nghiên cứu có ý nghĩa về chính sách giáo dục, phân bổ nguồn lực nghiên cứu hay so sánh tiềm lực nghiên cứu giữa các quốc gia. Vào thời điểm đó, trang web mới ở giai đoạn đầu, miễn phí và dễ dàng truy cập, đại diện cho một kho thông tin mà chỉ Viện Thông tin Khoa học mới có thể cung cấp, nhờ vào chỉ mục trích dẫn của nó.
Danh sách HCR nhanh chóng trở thành một công cụ mang nhiều chức năng hơn là giám sát, được sử dụng trong các phân tích thư mục khác nhau, ở cả cấp độ nhà nghiên cứu và tổ chức. Từ năm 2003, nó được Xếp hạng Đại học Thượng Hải (ARWU) sử dụng như một tiêu chí tính điểm cho các trường đại học, với số lượng nhà nghiên cứu được trích dẫn nhiều chiếm 20% điểm số của một tổ chức. Và việc trở thành một chỉ số về sự xuất sắc trong khoa học chắc chắn đã thay đổi vai trò của danh sách HCR: đối với một số cá nhân/tổ chức, việc có mặt trong danh sách trở thành một mục tiêu lớn.
Giống như nhiều công cụ khác trước đó – chẳng hạn như chỉ số tác động tạp chí (IF) ban đầu được thiết kế bởi và dành cho các thủ thư – một khi danh sách HCR trở thành mục tiêu, các hành vi gian lận bắt đầu xuất hiện, đặc biệt là để gia tăng lượng trích dẫn. Trong các vụ việc, đáng chú ý nhất là vào đầu năm 2023, tờ El País cùng một số nhà khoa học ở Saudi Arabia đã công bố kết quả điều tra trong nhiều năm cho thấy một số trường đại học ở quốc gia này đã trả tiền cho các nhà khoa học có tên trong danh sách HCR để họ khai báo các trường đó là đơn vị công tác của mình, do việc có các nhà khoa học thuộc HCR là một tiêu chí để tăng điểm trong Xếp hạng Đại học Thượng Hải. Trong lần trao đổi với Retraction Watch (trang blog và cơ sở dữ liệu chuyên theo dõi và báo cáo các bài báo khoa học bị rút lại, cùng với các vấn đề liên quan đến liêm chính nghiên cứu) vào năm 2022, Giám đốc Viện Thông tin khoa học tại Clarivate cũng chỉ ra một dạng hành vi thao túng tinh vi như khi một cá nhân công bố hai hoặc ba bài mỗi tuần trong thời gian dài, dựa vào mạng lưới đồng tác giả quốc tế, tức có khả năng rằng số lượng trích dẫn cao của một cá nhân có thể chỉ đến từ các đồng tác giả, và do đó lượng trích dẫn lớn không phản ánh được tác động rộng rãi lên cộng đồng học thuật. Các hành vi thao túng đã quá rõ ràng và quy mô lớn đến mức, vào năm 2024, hơn 2.000 nhà nghiên cứu đã bị xóa khỏi danh sách HCR vốn chỉ gồm khoảng 6.600 cái tên.
Những thay đổi như vậy đã làm suy yếu chính nguyên tắc của danh sách: bằng cách dựa vào các trích dẫn, các nhà sản xuất HCR đã cố gắng làm nổi bật những nhà nghiên cứu được cộng đồng khoa học công nhận. Nhưng hệ thống này đang đánh mất một phần ý nghĩa khi các trích dẫn bị thao túng, thay vì được tạo ra thông qua những đóng góp nghiên cứu có giá trị.
Mấy năm gần đây, danh sách HCR cũng nhận được nhiều sự quan tâm ở Việt Nam, đặc biệt là với việc GS Nguyễn Xuân Hùng (Viện Công nghệ liên ngành, Trường ĐH Công nghệ TPHCM) chín năm liên tiếp có tên trong danh sách. Năm 2023, Việt Nam có bốn nhà khoa học trong danh sách, gồm PGS.TS Hoàng Anh Tuấn (Trường ĐH Đông Á); GS.TS Trần Xuân Bách (Đại học Y Hà Nội); TS Võ Nguyễn Đại Việt (Trường ĐH Nguyễn Tất Thành); và GS.TS Võ Xuân Vinh (Trường ĐH Kinh tế TPHCM). Năm 2024, tức báo cáo mới nhất của danh sách HCR, Việt Nam không có đại diện nào.
|
Nguồn tham khảo:
Chaignon, L. (2025). Highly Cited Researchers: anatomy of a list. Quantitative Science Studies, 1-26.
Klein, A. M., & Kranke, N. (2023). Some thoughts on transparency of the data and analysis behind the Highly Cited Researchers list. Scientometrics, 128(12), 6773-6780.
Szomszor, M., Pendlebury, D. A., & Adams, J. (2020). How much is too much? The difference between research influence and self-citation excess. Scientometrics, 123(2), 1119-1147.
Teixeira da Silva, J. A., & Bernès, S. (2018). Clarivate Analytics: continued omnia vanitas impact factor culture. Science and Engineering Ethics, 24, 291-297.
Bài đăng KH&PT số 1347 (số 23/2025)