Nhiều nơi trên thế giới không đủ điều kiện giải trình tự bộ gen để theo dõi biến thể Omicron, do đó khó xác định biến thể này đang lây lan như thế nào và ở đâu.
Các nhà nghiên cứu đang giải trình tự các bộ gen SARS-CoV-2 với tốc độ nhanh chưa từng có. Từ khi đại dịch bắt đầu cho đến tháng 4 năm nay (khoảng 16 tháng), có một triệu chuỗi trình tự gen SARS-CoV-2 được tải lên cơ sở dữ liệu trực tuyến của GISAID. Nhưng từ tháng 4 đến tháng 12 (8 tháng), đã có thêm năm triệu chuỗi mới. Cũng nhờ tốc độ giải trình tự này, các nhà khoa học đã phát hiện Omicron tương đối sớm.
Phòng thí nghiệm ở New Delhi, Ấn Độ, đang giải trình tự bộ gen của các mẫu SARS-CoV-2.
Tuy nhiên, vẫn còn những khoảng trống nghiêm trọng trong dữ liệu giải trình tự. "Thứ nhất, một số quốc gia không có năng lực phòng thí nghiệm để giải trình tự bộ gen của mầm bệnh. Vì vậy theo dữ liệu thu được thì có vẻ như những nơi đó không có biến thể, trong khi trên thực tế, biến thể đang âm thầm lây lan," Kelly Wroblewski, giám đốc phụ trách các bệnh truyền nhiễm tại Hiệp hội các phòng thí nghiệm y tế công cộng, Silver Spring, Maryland, nói.
Thứ hai, tỷ lệ mẫu bệnh phẩm được giải trình tự cũng khác nhau giữa các vùng trong một quốc gia, tạo ra bức tranh không đồng đều về cách một biến thể đang lan truyền ở quốc gia đó. Ví dụ, 10 bang của Mỹ đã giải trình tự dưới 2% những trường hợp dương tính với COVID-19 trong tháng vừa qua. Ngược lại, các bang Wyoming, Colorado và Vermont giải trình tự hơn 10% trong cùng một khung thời gian. Vì vậy dữ liệu giải trình tự có thể phản ánh không chính xác biến thể đang lây lan ở những vùng nào.
Và ngay cả khi một vùng giải trình tự nhiều trường hợp dương tính, họ vẫn có thể bỏ sót các biến thể nếu xét nghiệm quá ít hoặc xét nghiệm thiên lệch. “Ví dụ, một số quốc gia chủ yếu xét nghiệm khách du lịch quốc tế. Ngay cả khi họ trình tự tất cả các mẫu đó, họ vẫn bỏ sót một biến thể đang lưu hành trong nước," Jennifer Nuzzo, nhà dịch tễ học tại Đại học Johns Hopkins, Baltimore, Maryland, giải thích.
Xử lý khoảng trống dữ liệu
Đối mặt với vấn đề khoảng trống dữ liệu, nhà dịch tễ học Sam Scarpino và các đồng nghiệp tại Viện Phòng chống Đại dịch thuộc Quỹ Rockefeller ở Washington DC, Mỹ, đã tìm kiếm những phương pháp mới để phân tích cách biến thể lây lan. Một phương pháp là sử dụng mô hình để ước tính mức độ phổ biến tối thiểu của Omicron trong một khu vực cụ thể để các cơ quan y tế khu vực đó có thể phát hiện ra biến thể - dựa trên số lượng xét nghiệm và giải trình tự ở khu vực đó. Ví dụ, Omicron sẽ cần trở nên rất phổ biến thì cơ quan y tế ở một khu vực ít xét nghiệm, ít giải trình tự, mới phát hiện ra.
Dựa trên dữ liệu GISAID, nhóm Scarpino đang xây dựng dòng thời gian Omicron lây nhiễm dựa trên ngày tháng thu thập mẫu bệnh phẩm - thay vì ngày đăng tải chuỗi gen đã được giải trình tự.
Dave Luo, nhà khoa học dữ liệu cố vấn cho Viện Phòng chống đại dịch của Quỹ Rockefeller, cảnh báo rằng chỉ riêng dòng thời gian này không đủ để xác định Omicron lây lan như thế nào. Còn cần so sánh mã di truyền của các chuỗi trình tự SARS-CoV-2 khác nhau để xây dựng một cây tiến hóa cho thấy biển thể này có liên quan như thế nào với biển thể khác. Và số lượng chuỗi trình tự Omicron được đăng tải lên GISAID ngày càng tăng - nhưng Luo cảnh báo, những dữ liệu này không nhất thiết đại diện cho tốc độ lan truyền của biến thể. Nhiều trung tâm xét nghiệm ưu tiên giải trình tự các mẫu đã qua sàng lọc gen để chọn ra các mẫu có khả năng cao là Omicron, do đó, Omicron hiện nay có thể không phổ biến đến mức dữ liệu giải trình tự phản ánh, theo Luo.
Theo Luo, nhìn chung, thông tin giải trình tự gen bị sai lệch và lộn xộn theo nhiều cách, và "phải cẩn thận khi suy luận về bất kỳ nguồn dữ liệu nào".
Nguồn: