Năm 1991, Paul Ginsparg - một nhà vật lý đam mê lập trình đã vô tình tạo ra một cuộc cách mạng âm thầm trong giới học thuật, thông qua một website trông chẳng có gì đặc biệt - arXiv.org (đọc là "archive"). Giao diện khiêm tốn, nhưng sức ảnh hưởng của nó đã âm thầm đảo lộn ngành xuất bản khoa học.
Xuất bản học thuật từ lâu được xem là một hệ thống nhiều bất cập, do các nhà xuất bản lớn vì lợi nhuận như Elsevier và Springer chi phối. Các nhà nghiên cứu gửi bài viết miễn phí cho các tạp chí khoa học. Tạp chí sau đó mời các chuyên gia phản biện (peer-review) – cũng làm việc không thù lao – để đánh giá chất lượng bài viết và đề xuất chỉnh sửa khi cần thiết. Tất cả điều này để đảm bảo tính liêm chính và các chuẩn mực đạo đức trong khoa học. Tuy nhiên, sản phẩm cuối cùng – tức các bài báo nghiên cứu – lại được nhà xuất bản bán ra với giá rất cao, khiến nhiều độc giả cá nhân không thể tiếp cận. Ngay cả các tổ chức như viện nghiên cứu hay trường đại học cũng phải trả những khoản phí khổng lồ để được truy cập những bài viết đó.
arXiv đã tạo ra một sự thay đổi lớn. Nền tảng này cho phép các nhà nghiên cứu đăng tải miễn phí bản thảo nghiên cứu (preprint) của họ trực tiếp lên mạng, giúp cộng đồng tiếp cận ngay lập tức. Điều này tách rời quá trình công bố khỏi vòng phản biện học thuật truyền thống, từ đó đẩy nhanh tốc độ lan tỏa tri thức.
Dù các bài nộp lên arXiv không trải qua quy trình phản biện học thuật nghiêm ngặt như ở Elsevier hay Springer, chúng vẫn được rà soát bởi các chuyên gia trong từng lĩnh vực.
Những người này tình nguyện dành thời gian để đảm bảo bài viết đáp ứng các tiêu chuẩn học thuật cơ bản và tuân thủ hướng dẫn của arXiv - chỉ chấp nhận nghiên cứu gốc, không sử dụng dữ liệu giả mạo, và ngôn ngữ phải đủ trung lập. Các bài nộp lên cũng được hệ thống tự động kiểm tra để đảm bảo chất lượng cơ bản. Nếu không có các lớp “gác cổng” này, arXiv sẽ bị tràn ngập bởi các bài viết ngụy khoa học, thiếu chuyên môn và dễ gây nhiễu thông tin.
Gần 35 năm trôi qua, arXiv không chỉ đơn thuần là một công cụ, mà đã trở thành “huyết mạch” của vật lý hiện đại, toán học, khoa học máy tính và nhiều lĩnh vực khác. Đây là nơi đăng tải các kết quả nghiên cứu khoa học nóng hổi, vừa mới ra lò từ phòng thí nghiệm trước khi chúng được phản biện, định dạng hoặc biên tập để xuất hiện trên các tạp chí học thuật. Đại dịch COVID-19 đã cho thế giới thấy tốc độ công khai tri thức ấy quan trọng đến mức nào. Hai người “em họ” của arXiv là BioRxiv và medRxiv đã kịp thời đăng tải những nghiên cứu khẩn cấp về virus và vaccine, góp phần định hướng phản ứng y tế và chính sách toàn cầu — và có thể nói, đã cứu sống nhiều người. Nếu theo đúng quy trình xuất bản học thuật thông thường, các công trình nghiên cứu này phải mất ít nhất từ một đến hai năm mới được biết đến.
Nếu arXiv ngừng hoạt động, các nhà khoa học từ khắp nơi trên thế giới sẽ lập tức bị gián đoạn. Scott Aaronson, một nhà khoa học máy tính tại Đại học Texas ở Austin, nói rằng tất cả mọi người trong ngành toán và lý mà anh biết đều sử dụng trang web này: “Tôi lên lướt nó mỗi đêm.” Với một số người, tưởng tượng thế giới không có arXiv cũng giống như tưởng tượng một thế giới không có thư viện công cộng hay GPS.
Nhưng ban đầu, Paul Ginsparg không nghĩ rằng mình đang tạo ra điều gì lớn lao. Ông khi ấy đang làm việc tại Phòng Thí nghiệm Quốc gia Los Alamos và chỉ xem đây như một dự án nhỏ bên lề nhằm giảm bớt việc gửi bản thảo nghiên cứu qua email giữa các nhà nghiên cứu. Một đồng nghiệp của ông, Joanne Cohn, đề xuất: “Hay là mình tự động hóa danh sách gửi mail này đi?”. Ông cũng tình cờ nghe một nhà khoa học khác than thở rằng anh ta lo lắng bộ nhớ máy tính của mình sẽ bị đầy bởi các bài báo gửi tới, giá mà có nơi nào lưu trữ tập trung hơn. Thế là Ginsparg viết ra một bản thử nghiệm chỉ trong vòng một ngày.
Chỉ với vài đoạn mã chạy trên máy tính NeXT, arXiv ra đời — ban đầu tiếp nhận khoảng 100 bài mỗi tháng, rồi nhanh chóng bùng nổ thành một nền tảng khoa học toàn cầu. Tính đến năm 2023, arXiv đã lưu trữ hơn 2,6 triệu bài báo, với tốc độ tăng hơn 20.000 bài mỗi tháng và phục vụ 5 triệu người dùng.
Trên arXiv, không thiếu những nghiên cứu đã đi vào lịch sử — như bài viết giới thiệu kỹ thuật transformers, công trình khởi đầu làn sóng AI hiện đại, hay bài báo chứng minh giả thuyết Poincaré — một trong bảy bài toán Thiên niên kỷ nổi tiếng vì độ khó và phần thưởng một triệu đô la. Việc một nghiên cứu được đưa lên arXiv không có nghĩa là nó sẽ không được xuất bản ở các tạp chí danh giá sau này, nhưng arXiv thường là nơi các công trình ra mắt lần đầu và luôn được truy cập công khai.
Tổng kết lại, có ba lý do để arXiv thành công, đó là tốc độ đăng bài nhanh chóng, tính mở (không cần đến danh tiếng từ Harvard hay MIT, ai cũng có cơ hội chia sẻ nghiên cứu nếu đạt chuẩn cơ bản) và miễn phí.
Tuy nhiên, tự do luôn đi kèm hệ lụy. arXiv không phải thiên đường học thuật. Dù có đội ngũ tình nguyện kiểm duyệt, vẫn có những bài “rác” lọt qua, hoặc ngược lại, những nghiên cứu tốt nhưng gây tranh cãi lại bị chặn lại. arXiv cũng từng trải qua những giai đoạn hỗn loạn - từ sự cố kỹ thuật đến kiện tụng đạo văn, những lời phàn nàn từ người dùng rằng những người kiểm duyệt nắm giữ quá nhiều quyền lực, thậm chí có người lập còn lập ra một trang web tương tự tên là viXra (viết ngược của từ arXiv) để đăng bất kỳ thứ gì, từ lượng tử-vật lý-vi lượng đồng căn đến thần số học.
Ban đầu, nền tảng này vận hành hoàn toàn tự động. Nhưng vì quá bận rộn, Ginsparg đã chuyển giao việc quản lý hằng ngày của arXiv cho đội ngũ tại Thư viện Đại học Cornell. Căng thẳng lên đến đỉnh điểm khi Thư viện Cornell (nơi arXiv đặt trụ sở) gặp khó khăn trong việc mở rộng quy mô. arXivbị đưa qua đưa lại trong các bộ phận và thay đổi giám đốc, thậm chí đã từng gặp phải những người có mâu thuẫn lợi ích. Phải đến năm 2022, khi Quỹ Simons và Quỹ Khoa học Quốc gia Mỹ (NSF) tài trợ gần 10 triệu USD, arXiv mới có nguồn lực ổn định để đưa hệ thống lên đám mây, nâng cấp mã nguồn, và xây dựng một đội ngũ vận hành chuyên nghiệp hơn.
Điều bí ẩn lớn nhất không phải là vì sao arXiv thành công, mà là vì sao nó không bị các nhóm lợi ích tìm cách tiêu diệt. Có lẽ lý do nằm ở một quyết định chiến lược mà Ginsparg đưa ra từ sớm: khi nộp bản thảo, người dùng đồng ý cho arXiv quyền phân phối bài viết vĩnh viễn, dù sau này bài đó có được xuất bản ở nơi khác hay không. Chính bước đi pháp lý khôn ngoan này đã giúp arXiv miễn nhiễm với sự đe dọa từ các nhà xuất bản lớn, vốn nổi tiếng với những hành động quyết liệt để duy trì quyền lực kiểu phong kiến trong giới học thuật.
arXiv còn thay đổi quan niệm về “giá trị” trong khoa học. Các bản thảo nghiên cứu (preprint) không còn là hàng thứ cấp. Nó trở thành nguồn tham khảo chính, được trích dẫn rộng rãi, và kết nối các ngành. Với nhà khoa học trẻ, đây là nơi để được chú ý. Với thế hệ cũ, là cách để vẫn còn chỗ đứng.
Nguồn: Wired, Nature
Bài đăng KH&PT số 1340 (số 16/2025)