Sự kiện giải trình tự toàn bộ hệ gene người của nhóm các nhà khoa học Mỹ không chỉ đánh dấu một đột phá mới trên tiến trình nghiên cứu về hệ gene người mà còn gợi mở rất nhiều vấn đề sâu sắc và hứa hẹn những đột phá mới trong tiên lượng, chẩn đoán và điều trị bệnh.

Không nằm ngoài phạm vi ảnh hưởng đó, Việt Nam có nhiều cơ hội đón nhận thành tựu, nếu có được một sự đầu tư xứng đáng.TS. Nguyễn Đăng Tôn (Viện nghiên cứu hệ gene, Viện Hàn lâm KH&CN Việt Nam) đã trao đổi với báo KH&PT về vấn đề này.

TS. Nguyễn Đăng Tôn.

Tại sao sau 20 năm có trong tay hệ gene tham chiếu từ Dự án giải mã hệ gene người, các nhà khoa học lại phải tiếp tục bổ sung và cập nhật những thông tin mới về hệ gene này?

Chúng ta biết rằng năm 2001, sau 10 năm tiến hành nghiên cứu, các nhà khoa học thuộc Dự án giải mã hệ gene người và công ty Celera Genomics cùng công bố hai bản phác thảo về trình tự bộ gene người đầu tiên. Hai năm sau, trình tự bộ gene tham chiếu được hoàn thiện thêm và đến năm 2013, các nhà khoa học đã công bố hg38/GRCh38, bản cập nhật của bộ gen tham chiếu đã bổ sung, hiệu chỉnh cho chính xác hơn. Từ đó đến nay, bộ gene tham chiếu này được sử dụng rộng rãi cho các nghiên cứu y sinh – di truyền và chăm sóc sức khỏe con người.

Vào thời điểm đó, trình tự bộ gene tham chiếu mới xác định và lập bản đồ được vùng nhiễm sắc trên các nhiễm sắc thể, chiếm khoảng 92% kích thước bộ gene người. Phần chưa lập được bản đồ là vùng lặp phức tạp, chủ yếu tập trung ở khu vực quanh tâm động - nơi tham gia phân chia vật chất di truyền cho các tế bào con trong quá trình phân bào, và hai đầu mút trên các nhiễm sắc thể. Có vai trò quan trọng như vậy nhưng do hạn chế của công nghệ giải trình tự đoạn ngắn trước đây không xác định được, nếu có thì độ chính xác thấp, nên vùng lặp này đã bị loại bỏ trong trình tự tham chiếu GRCh38.

Giải mã trình tự hệ gene người giống như một trò chơi ghép hình. Trước đây, các nhà khoa học phải chia hệ gene người thành các phần nhỏ hơn và sau đó sử dụng máy giải trình tự giải từng đoạn nhỏ một, để ghép chúng lại với nhau theo đúng thứ tự. Mặt khác, công nghệ đọc trình tự cũ chỉ đọc được 1000 nucleotit mỗi lượt trên tổng cộng khoảng 3 tỉ nucleotit nên kết quả thu được sau khi lắp ráp không tránh khỏi những sai sót.

Hiện tại, công nghệ giải trình tự thế hệ mới của PacBio và Oxford Nanopore kết hợp với Illumina cho phép các nhà khoa học ở tổ hợp nghiên cứu Telomere to Telomere (T2T) (Viện Nghiên cứu Bộ gen Người Quốc gia (NHGRI), Viện Y tế Quốc gia, Đại học California, Santa Cruz và Đại học Washington, Seattle) đọc được các đoạn rất dài mới giải được trình tự gene của 8% còn lại, chủ yếu ở vùng tâm động phức tạp. Do đó, so với trình tự tham chiếu GRCh38, bộ gene T2T-CHM13 bổ sung gần 200 triệu cặp trình tự nucleotit, sửa hàng nghìn lỗi cấu trúc và xác định được các vùng phức tạp nhất của bộ gene người. Nhờ vậy, các nhà khoa học đã xác định thêm hàng trăm nghìn biến thể trên mỗi cá thể ở những vùng trước đây chưa xác định được. Những dữ liệu biến thể được bổ sung giúp các nghiên cứu về sinh y và tiến hóa trong tương lai có được những kết quả chính xác hơn.

Xử lý mẫu trước khi đưa vào phân tích, tại trung tâm giám định ADN hài cốt liệt sĩ, Viện Hàn lâm KH&CN Việt Nam.

Việc bổ sung 8% trình tự bộ gene còn lại có ý nghĩa gì trong nghiên cứu và ứng dụng trong y học khiến TS. Charles Rotimi, giám đốc khoa học của Viện Nghiên cứu bộ gene người quốc gia Mỹ đánh giá thành tựu khoa học này “đưa chúng ta đến gần hơn với y học cá thể hóa cho toàn nhân loại”?

Về mặt khoa học, đây là một bước tiến rất dài, vì nó giải quyết được những tồn đọng, hạn chế của công nghệ cũ bằng công nghệ đọc được các đoạn dài, loại bỏ được hầu hết các lỗi kỹ thuật – gần 1 triệu điểm đa hình đã được loại bỏ, thêm vào hoặc sửa lỗi, hoặc xác định lại được (so với trước đây không xác định được, hoặc vị trí đọc bị lỗi). Những điểm đấy rất có ý nghĩa cho nghiên cứu cơ bản, cho các ứng dụng trong y học hoặc cho nghiên cứu văn hóa vì có thể từ đây xác định được có thể những điểm đó ảnh hưởng đến chức năng của tế bào.

Chúng ta có thể hình dung, việc xác định được các biến thể di truyền bao gồm các đa hình nucleotit đơn, các biến thể chèn hoặc mất đoạn, thay đổi ở mức độ cấu trúc hay sự khác biệt về số lần lặp lại của một đoạn trình tự nhất định cũng có thể góp phần vào sự đa dạng giữa các cá thể và cũng là nguyên nhân gây bệnh ở người. Dựa trên trình tự bộ gene tham chiếu mới, chúng ta có thể xác định được thêm và chính xác hơn đặc điểm hệ gene của mỗi cá thể giúp xác định được các nguy cơ bất thường về sức khỏe của mỗi cá nhân.

Trong số 8% đó, các nhà khoa học đã xác định được gần 2000 gene ứng cử viên. Cho đến thời điểm này người ta mới biết được thêm khoảng 100 gene có thể mã hóa cho các protein tham gia các hoạt động chức năng trong cơ thể, qua đó có thể giúp chẩn đoán mối quan hệ gene- bệnh. Dĩ nhiên, đó mới chỉ là bước đầu tiên, còn việc xác định khả năng điều trị sẽ còn là câu chuyện rất dài.

Tương tự, trong nghiên cứu về nhân chủng học tiến hóa, người ta cũng dựa trên các điểm đa hình hoặc những điểm lặp lại để phân biệt giữa các cá thể, giữa các nhóm cá thể, các chủng tộc. Phát hiện mới này có ý nghĩa cho việc phát hiện, có thông tin chính xác hơn về đặc điểm nhân chủng học, quá trình di cư của các nhóm, góp phần vào việc làm sáng tỏ hơn lịch sử của các tộc người.

Đối với các ngành hẹp như khoa học hình sự thì phát hiện mới này cũng rất có ý nghĩa, vì những vùng lặp lại dài hoặc ngắn giúp xác định khác biệt cá thể, nhận dạng cá thể. Khi nhận dạng cá thể, người ta dựa trên sự khác biệt của những đoạn lặp lại. Khi mình có dữ liệu của các phần lặp lại thì các nhà khoa học hình sự có được dữ liệu tốt hơn trong quá trình nhận dạng, nhận dạng chính xác hơn.

Những ý nghĩa lớn lao của thành tựu mới về hệ gene người này có tác động đến Việt Nam không, thưa ông?

Trước dòng chảy mới của khoa học thế giới, Việt Nam không thể đứng ngoài cuộc. Điều đó đã thể hiện một cách rõ nét trong quá trình phát triển của khoa học hệ gene người Việt Nam. Khi nhìn lại những tác động trong vòng 20 năm qua, có thể thấy Việt Nam đã bắt nhịp theo hướng nghiên cứu về hệ gene từ rất sớm, vừa để trả lời những câu hỏi của khoa học cơ bản trong nghiên cứu hệ gene tham chiếu của người Việt vừa giúp ứng dụng trong thực tiễn. Từ năm 2000, chúng ta đã có các nhiệm vụ giải trình tự các gene trên người, giải mã hệ gene ty thể tại Viện Công nghệ sinh học, Viện KH&CN Việt Nam (nay là Viện Hàn lâm KH&CN VN) và các cơ sở đào tạo và nghiên cứu khác như Đại học Quốc gia Hà Nội, Đại học Y Hà Nội, Đại học Quốc gia TP.HCM… Đây là những nền móng đầu tiên để sau này chúng ta tiếp tục giải mã được hệ gene tham chiếu của người Việt, qua đó giúp trả lời nhiều câu hỏi về y học cá thể, nhân chủng học tiến hóa của người Việt.

Nhờ vậy, chúng ta cũng có những nghiên cứu mang tính ứng dụng, có thể giúp giảm gánh nặng bệnh tật rất lớn như nghiên cứu giải mã gene của những nạn nhân bị chất độc màu da cam, giải mã hệ gene mã hóa của nhiều nhóm bệnh như các bệnh di truyền, tim mạch, thần kinh như Parkinson, Alzheimer...

Về hướng nghiên cứu nhân chủng học tiến hóa, các nhà khoa học trong nước cũng đã công bố kết quả dự án nghiên cứu ở mức độ toàn bộ hệ gene của 22 dân tộc và đang tiếp tục nghiên cứu thêm một số dân tộc nữa. Các nghiên cứu này giúp lấy đầy khoảng trống do trước đây chưa có nghiên cứu đa dạng di truyền ở mức hệ gene và địa lý phát sinh, tức phân bố địa lý của các kiểu gene và ước lượng niên đại xuất hiện của chúng trên các vùng lãnh thổ của quần thể người Việt Nam.

Việc nghiên cứu hệ gene người đã mở ra nhiều ứng dụng trong nghiên cứu mối liên quan giữa gene và bệnh. Vậy Việt Nam đã tận dụng điều này như thế nào?

Chúng ta đã tận dụng các thành tựu từ các nghiên cứu của các nhà khoa học trên thế giới đã thực hiện như các liệu pháp điều trị hướng đích nhờ vào việc nghiên cứu cơ bản phát hiện ra những điểm biến đổi cụ thể trong gene để có cách tiếp cận thuốc phù hợp hơn. Các cơ quan nghiên cứu như Viện Công nghệ sinh học, Viện Nghiên cứu hệ gene, Đại học Y Hà Nội... đã kết hợp với các cơ sở khám chữa bệnh để sàng lọc trước sinh, sàng lọc các bệnh di truyền, các bệnh hiếm, bệnh tim mạch: hỗ trợ tìm nguyên nhân gây bệnh và khi có nguyên nhân gây bệnh rồi thì các bác sĩ có thể tư vấn cho các gia đình người bệnh có mang gene đó biết để tránh.

Đó là hướng phát triển rất tốt, không chỉ có ý nghĩa y tế mà còn có ý nghĩa với xã hội để giúp tránh cho những gánh nặng bệnh tật, ví dụ sàng lọc sơ sinh giúp sàng lọc được những bệnh nguy hiểm cho trẻ sơ sinh. Đơn giản như bệnh bại não do vàng da, hay rối loạn chuyển hóa bẩm sinh nếu biết được trong gia đình mang biến thể có nguy cơ gây bệnh, bác sỹ có thể theo dõi và có phương pháp phòng trừ hiệu quả.

Nghĩa là rất nhiều cơ hội mới sẽ tới?

Chúng ta đang có rất nhiều hy vọng cho lộ trình phát triển tiếp theo của nghiên cứu về gene người. Ai làm nghiên cứu về gene người mà lại chẳng mong muốn xây dựng được trình tự gene tham chiếu của người Việt với 8% thông tin mới bổ sung. Tuy nhiên, chúng ta phải đứng trước thực tại là muốn thực hiện điều này thì chi phí để đọc được 8% ấy là tương đối lớn, bởi thực ra, phải đọc lại hoàn toàn cả hệ gene chứ không chỉ là 8%.

Ở đây, bài toán phát triển rất thách thức bởi việc nghiên cứu về hệ gene người đòi hỏi rất nhiều nguồn lực đầu tư. Nếu hạn chế về nguồn lực thì sẽ dễ dẫn đến đến hạn chế trong hiệu quả nghiên cứu. Vì sao lại nói như vậy?

Thứ nhất, nếu xét riêng về mặt công nghệ thì công nghệ ở thời điểm hiện nay thế giới đã thay đổi nhiều lắm rồi, ví dụ máy giải trình tự thế hệ mới có công suất lớn nhất có thể giải được trình tự gene của mấy chục cá thể trong một lần vận hành trong khi thiết bị của Việt Nam, tại các cơ sở đào tạo và nghiên cứu công lập, chẳng hạn như của Viện Nghiên cứu hệ gen hiện nay thì một lần chỉ giải trình tự cho một cá thể.

Thứ hai, việc tổ chức các nghiên cứu lớn và có ý nghĩa cũng khó thực hiện trong khi với đặc điểm của nghiên cứu về gene người, chỉ kết quả rút ra từ những dự án ở quy mô đủ lớn mới có đủ cơ sở để rút ra kết luận một cách chắc chắn. Ở các nhóm nghiên cứu quốc tế mà chúng tôi hợp tác, họ làm các nghiên cứu về hệ gene của các nhóm bệnh nhân đái tháo đường, bệnh nhân tự kỷ hoặc các bệnh nhân khác với cỡ mẫu có thể lên tới vài nghìn bệnh nhân trong khi Việt Nam chúng ta khó mà có kinh phí để triển khai nghiên cứu đến vài trăm bệnh nhân chứ không thể tới vài nghìn trong khi phải làm cỡ mẫu lớn mới phát hiện được nhiều nguyên nhân gây bệnh. Tất nhiên là khi thực hiện nghiên cứu, mình vẫn tìm ra tính mới tuy nhiên do số lượng mẫu còn ít nên kết luận của mình không đủ mạnh.

Vậy trong điều kiện nguồn lực còn hạn chế thì đâu là giải pháp để Việt Nam thực hiện được những nghiên cứu có ý nghĩa?

Hiện tại, chúng tôi vẫn sử dụng các mối quan hệ hợp tác khoa học với các phòng thí nghiệm quốc tế để từng bước giải quyết khó khăn về cơ sở vật chất. Cách này thì vẫn có thể giúp chúng ta giải quyết được khó khăn trước mắt nhưng về lâu dài, điều chúng tôi trăn trở nhất là chúng ta có thể nghiên cứu được về các đặc trưng của chính hệ gene người Việt Nam để có đóng góp cho khoa học hay không. Chúng ta không thể chạy đua về nguồn lực với quốc tế được nên có lẽ phải lựa chọn cách tiếp cận. Tôi cho rằng, nên đi sâu khai thác những nét đặc trưng của hệ gene người Việt, phát hiện ra được những điểm mới về nhân chủng học tiến hóa hoặc về những bệnh tật liên quan đến người Việt thì chúng ta mới có thể hy vọng có đóng góp mới cho khoa học cũng như có ý nghĩa ứng dụng hữu ích để giảm gánh nặng bệnh tật trong xã hội.

Trân trọng cảm ơn ông về cuộc trao đổi!


Hiện tại, công nghệ giải trình tự thế hệ mới của PacBio và Oxford Nanopore kết hợp với Illumina cho phép các nhà khoa học ở tổ hợp nghiên cứu Telomere to Telomere (T2T) (Viện Nghiên cứu Bộ gene Người Quốc gia (NHGRI), Viện Y tế Quốc gia, Đại học California, Santa Cruz và Đại học Washington, Seattle) đọc được các đoạn rất dài mới giải được trình tự gene của 8% còn lại, chủ yếu ở vùng tâm động phức tạp. Do đó, so với trình tự tham chiếu GRCh38, bộ gene T2T-CHM13 bổ sung gần 200 triệu cặp trình tự nucleotit, sửa hàng nghìn lỗi cấu trúc và xác định được các vùng phức tạp nhất của bộ gene người. Nhờ vậy, các nhà khoa học đã xác định thêm hàng trăm nghìn biến thể trên mỗi cá thể ở những vùng trước đây chưa xác định được. Những dữ liệu biến thể được bổ sung giúp các nghiên cứu về sinh y và tiến hóa trong tương lai có được những kết quả chính xác hơn.