Hàng trăm nhà khoa học đang kêu gọi chia sẻ công khai dữ liệu bộ gen của SARS-CoV-2 để giúp cộng đồng nghiên cứu dễ phân tích cách các biến thể của virus đang lây lan trên khắp thế giới.
Các nhà nghiên cứu đã đăng một số lượng lớn trình tự bộ gen SARS-CoV-2 lên mạng kể từ tháng 1/2020. Nền tảng chia sẻ dữ liệu phổ biến nhất, GISAID, hiện lưu trữ hơn 450.000 bộ gen virus. Soumya Swaminathan, nhà khoa học của Tổ chức Y tế Thế giới (WHO), gọi dữ liệu này là 'nhân tố quyết định' trong đại dịch. Nhưng GISAIDkhông cho phép người xem chia sẻ công khai hoặc đăng tải lại các trình tự trên các nền tảng hoặc xuất bản phẩm khác - điều này đang cản trở nỗ lực tìm hiểu về virus và các chủng biến thể mới, theo Rolf Apweiler, đồng giám đốc của Viện Tin sinh học Châu Âu (EBI).
Theo Apweiler, “Dữ liệu này cần được công khai để giúp phản ứng nhanh chóng với mối đe dọa sức khỏe lớn nhất cho nhân loại".
Trong một bức thư kêu gọi công bố ngày 29/1, Apweiler và các đồng nghiệp kêu gọi giới nghiên cứu đăng dữ liệu bộ gen mà họ có lên một trong bộ ba cơ sở dữ liệu cho phép người dùng chia sẻ tự do: Ngân hàng gen Hoa Kỳ, Kho lưu trữ Nucleotide Châu Âu (ENA) của EBI và Ngân hàng Dữ liệu DNA của Nhật Bản. Ba nơi này được gọi chung là Hợp tác Cơ sở Dữ liệu Trình tự Nucleotide Quốc tế (INSDC).
Bất kỳ ai cũng có thể truy cập ẩn danh vào dữ liệu của INSDC và sử dụng tùy ý, trong khi GISAID yêu cầu người dùng xác nhận danh tính và đồng ý không xuất bản lại dữ liệu ở nơi khác. Có nghĩa là các nghiên cứu xây dựng dựa trên dữ liệu GISAID - chẳng hạn như những nghiên cứu tạo cây tiến hóa phân tích mối liên hệ của các biến thể SARS-CoV-2 - không thể xuất bản dữ liệu đầy đủ để những người khác có thể dễ dàng kiểm tra phân tích hoặc xây dựng thêm trên tập dữ liệu của họ, mà phải hướng người đọc quay lại trang GISAID.
Bức thư kêu gọi nên "loại bỏ các rào cản hạn chế việc chia sẻ dữ liệu", nhưng cũng không đề cập cụ thể đến GISAID. Hơn 500 nhà khoa học đã ký bức thư này, bao gồm cả người đoạt giải Nobel Hóa học năm 2020 - Emmanuelle Charpentier - và người đứng đầu Tổ chức Covid-19 Genomics UK - Sharon Peacock.
Hình ảnh của 56 bộ gen SARS-CoV-2.
Vấn đề chủ quyền và công bằng
Nhiều nhà nghiên cứu làm việc với GISAID nói rằng các điều khoản truy cập có lợi ích của nó: khuyến khích các nhà nghiên cứu chia sẻ dữ liệu trực tuyến mà không sợ người khác sử dụng mà không dẫn nguồn. "Lý do rất nhiều phòng thí nghiệm cung cấp bộ gen SARS-CoV-2 cho GISAID là vì thỏa thuận hạn chế chia sẻ lại dữ liệu," Sebastian Maurer-Stroh - nhà tin sinh học tại Cơ quan Khoa học, Công nghệ và Nghiên cứu của Singapore - cho biết.
GISAID - viết tắt của Sáng kiến Toàn cầu về Chia sẻ Dữ liệu Cúm Gia cầm - hoạt động như một tổ chức phi lợi nhuận từ năm 2008 nhằm giải quyết tình trạng các nhà nghiên cứu do dự trong việc chia sẻ dữ liệu về các chủng cúm. Một số quốc gia, bao gồm Indonesia, một điểm nóng về dịch cúm gia cầm, lo ngại rằng các công ty dược phẩm trên thế giới sẽ tạo ra thuốc và vaccine dựa trên các dữ liệu trình tự của họ mà không ghi nhận công sức của những người cung cấp dữ liệu gốc, và do đó sẽ không chia sẻ lợi ích. Nhưng Indonesia đã bị thuyết phục chia sẻ dữ liệu trên GISAID. Tháng 3/2013, Trung Quốc đã công bố các chuỗi dịch cúm gia cầm H7N9 trong cơ sở dữ liệu này, cùng ngày nước này thông báo với WHO về ba trường hợp lây nhiễm ở người. Người phát ngôn của GISAID cho biết: “GISAID khuyến khích các bên không muốn chia sẻ chia sẻ dữ liệu của họ, bằng cách đảm bảo rằng họ giữ được quyền sở hữu với dữ liệu của mình".
“Đây không chỉ là vấn đề khoa học, mà còn về chủ quyền và công bằng," Marie-Paule Kieny, nhà nghiên cứu vắc xin tại viện nghiên cứu sức khỏe quốc gia INSERM của Pháp, Paris, lý giải, vì các nhà khoa học đăng tải trình tự có thể yên tâm rằng quyền của họ sẽ được người dùng dữ liệu tôn trọng.
Senjuti Saha, nhà vi sinh vật học làm việc trên bộ gen SARS-CoV-2 tại Quỹ Nghiên cứu Sức khỏe Trẻ em ở Dhaka, nói, bà đánh giá cao lời kêu gọi về dữ liệu mở, nhưng cũng lo ngại, nếu dữ liệu mở hoàn toàn. Saha cho biết đã chứng kiến dữ liệu về SARS-CoV-2 của các nhà nghiên cứu ở các nước thu nhập thấp và trung bình bị các học giả ở các nước giàu có hơn sử dụng mà không dẫn nguồn hay hỏi ý kiến. “Chúng tôi thực sự muốn chia sẻ dữ liệu của mình, nhưng thật nản lòng chúng tôi đã làm việc rất vất vả để tạo ra dữ liệu mà không được ghi nhận".
Một số nhà nghiên cứu nói với Nature rằng bên cạnh những tranh luận về tính công bằng, còn có một vấn đề khác với cách GISAID kiểm soát dữ liệu. Ví dụ: một số người dùng phải tải dữ liệu xuống theo từng tệp nhỏ, trong khi những người khác lại được phép tải hàng loạt tệp.
Về vấn đề này, người phát ngôn của GISAID lý giải là do GISAID cần biết ai đang sử dụng dữ liệu của mình và với mục đích gì, để không phân phối dữ liệu bất hợp lý.
Nguồn: