Một phân tích có hệ thống về “hệ protein tối" cho thấy giới khoa học có thể đã bỏ sót hàng nghìn gen phi truyền thống ẩn náu trong các đoạn bị ngó lơ của hệ gen và tạo ra các protein nhỏ.

Một trong những bất ngờ lớn nhất khi hệ gen người lần đầu được giải mã cách đây hơn 20 năm là số lượng gen ít hơn ⅓ so với dự đoán của giới khoa học. Nhưng một phân tích có hệ thống về “hệ protein tối" cho thấy giới khoa học có thể đã bỏ sót hàng nghìn gen phi truyền thống ẩn náu trong những đoạn bị ngó lơ của hệ gen và tạo ra các protein nhỏ hơn mức trung bình.

John Prensner, nhà thần kinh học tại Khoa Nhi, Trường Đại học Y Michigan, bắt đầu nghiên cứu “hệ protein tối” khi cuộc tìm kiếm các gen liên quan đến ung thư trong số các gen đã biết của ông không đưa đến kết quả khả quan. “Hệ protein tối” (dark proteome) là thuật ngữ dùng để chỉ phần thuộc về hệ protein nhưng chưa được con người khám phá hoặc hiểu rõ.

Prensner và các đồng nghiệp đã mở rộng định nghĩa về gen. Gen, theo cách hiểu truyền thống, là các đoạn DNA dài có nhiệm vụ mã hóa các protein. Những đoạn này được gọi là khung đọc mở (ORF), chứa thông tin giúp tế bào biết khi nào bắt đầu và kết thúc quá trình tạo ra protein.

Tế bào tạo ra protein bằng cách 'chép lại' đoạn mã ORF trong gen vào một "tin nhắn" gọi là RNA thông tin. "Tin nhắn" này di chuyển đến ribosome - các nhà máy sản xuất protein trong tế bào, từ đó ribosome ráp các axit amin lại thành protein hoàn chỉnh. Mỗi đoạn mã ORF thường có một DNA đặc biệt ở phía trước để thu hút các protein cần thiết đến để bắt đầu quá trình giải mã.

Với hầu hết các nhà nghiên cứu, một ORF chỉ được coi là một gen nếu nó mã hóa một protein có ít nhất 100 axit amin.

Tuy nhiên, cách tiếp cận này đã bỏ qua những ORF ngắn hơn, vốn cũng có thể tạo ra các protein quan trọng.

Các nhà khoa học đã nghiên cứu trên nhiều sinh vật, từ nấm men, rắn đến con người, và phát hiện có rất nhiều ORF phi chuẩn. Đây là các đoạn ngắn hơn bình thường và không có cấu trúc DNA đặc biệt ở đầu, nhưng chúng vẫn được "phiên mã" thành RNA.

Sử dụng phương pháp theo dõi quá trình sản xuất protein có tên profiling ribosome (hoặc Ribo-Seq), các nhà khoa học nhận thấy những RNA này, dù ngắn hơn tiêu chuẩn và chỉ chứa vài chục axit amin, vẫn có thể gắn vào ribosome. Có nghĩa là ngay cả những đoạn DNA “phi chuẩn” cũng có thể tham gia vào việc sản xuất protein.

Cấu trúc giả định của ba loại protein nhỏ mới được phát hiện. Ảnh: scicence.org
Cấu trúc giả định của ba loại protein nhỏ mới được phát hiện. Ảnh: scicence.org

Đứng trước các kết quả nghiên cứu đó, nhiều nhà khoa học vẫn coi các protein nhỏ là không quan trọng và nhanh chóng bị phân hủy. Rất khó thuyết phục họ rằng những ORF này cần được xem xét nghiêm túc.

Nhưng khoảng ba năm trước, Prensner và cộng sự đã chứng minh tế bào ung thư chứa khoảng 550 protein nhỏ. Hai năm trước, Sebastiaan van Heesch, nhà sinh học tại Trung tâm Ung thư Nhi khoa Princess Máxima, cũng tìm thấy số lượng tương tự các protein nhỏ trong mô tim.

Hai nhà nghiên cứu đã hợp tác với Jonathan Mudge - chuyên gia của GENCODE - một cơ sở dữ liệu về các gen được công nhận chính thức, và cuối cùng đã tuyển dụng hàng chục nhà nghiên cứu khác để đánh giá có bao nhiêu ORF phi chuẩn tồn tại ở người.

Nhóm nghiên cứu không chỉ tiến hành các thí nghiệm mới mà còn tìm hiểu những nghiên cứu trước đó, đầu tiên là xem xét các tài liệu về ribosome. Đến năm 2022, họ đã tìm ra 7.264 ORF phi chuẩn trong bộ gen người. Với sự giúp đỡ của Tổ chức Human Proteome - tổ chức chuyên lập danh mục các protein của người, họ bắt đầu chứng minh rằng các ORF phi chuẩn có thể tạo ra protein.

Nhóm nghiên cứu đã tìm kiếm trong kho dữ liệu của Peptide Atlas các protein nhỏ phù hợp với các chuỗi ORF và xem xét các nghiên cứu đã công bố về các mảnh protein được phát hiện trong hệ miễn dịch. Tổng cộng, họ đã xác nhận một phần tư trong số 7.264 ORF phi chuẩn mà họ tìm thấy thực sự tạo ra tổng cộng khoảng 3.000 protein. (Một ORF có thể được đọc theo nhiều cách để tạo ra nhiều protein khác nhau).

Các protein nhỏ mới được phát hiện này “cung cấp một bức tranh hoàn chỉnh hơn về phần phiên mã của hệ gen,” theo nhà di truyền học Ami Bhatt từ Đại học Stanford, một thành viên của nhóm nghiên cứu.

Kết quả này cũng cung cấp cho các nhà khoa học những mục tiêu nghiên cứu mới. Prensner và van Heesch đã bắt đầu theo dõi một ORF và protein nhỏ mà họ phát hiện trong nghiên cứu về “hệ protein tối”. Bằng cách sử dụng công cụ chỉnh sửa gen CRISPR để tạo ra các đột biến trong ORF, họ có thể kiểm tra vai trò của protein này trong các tế bào ung thư. Mặc dù kích thước nhỏ, sản phẩm của ORF này lại rất quan trọng cho sự sống còn của các khối u medulloblastoma - một loại ung thư não ảnh hưởng đến trẻ em.

Prensner hiện là cố vấn cho công ty ProFound Therapeutics - công ty hợp tác với hãng dược Pfizer để phát triển các phương pháp điều trị béo phì dựa trên các protein nhỏ. Một thành viên khác trong nhóm nghiên cứu, nhà hóa sinh học Thomas Martinez tại Đại học California, đang cùng cộng sự nghiên cứu các protein nhỏ liên quan đến ung thư tuyến tụy và bệnh chuyển hóa.

Vậy tất cả những điều nêu trên ảnh hưởng gì đến số lượng gene của con người? “Hệ protein tối” rõ ràng đã làm tăng con số này, nhưng không ai biết con số chính xác là bao nhiêu. “Tôi linh cảm rằng con số này có lẽ không đến 100.000, nhưng 50.000 thì hoàn toàn có thể,” Martinez nói.

Nguồn: