Phần mềm của Viện Big Data (Vingroup) đang đứng top 5 trong tổng số khoảng 1.200 đội trên thế giới tham dự cuộc thi chẩn đoán bệnh tràn khí màng phổi (Pneumothorax Segmentation) do Hiệp hội Tin học Hình ảnh Y tế Hoa Kỳ (SIIM) tổ chức - Giáo sư, Viện trưởng Vũ Hà Văn cho biết tại buổi nói chuyện ở Hà Nội mới đây.


GS Vũ Hà Văn nói chuyện tại Viện Toán học, Hà Nội, 31/7/2019. Ảnh: TT

“Còn khoảng một tháng nữa cuộc thi mới kết thúc, lúc đó chưa biết thế nào, nhưng kết quả này cho thấy nếu tập trung, chúng ta có thể làm ra các sản phẩm tương đương thế giới” - GS Vũ Hà Văn nói.

Theo GS Vũ Hà Văn, việc phát triển các thuật toán nhận diện hình ảnh y tế ở Mỹ và một số nước khác thường được tiến hành dưới dạng cuộc thi, trong đó các nhóm nghiên cứu dùng cơ sở dữ liệu do Ban tổ chức cung cấp để xây dựng thuật toán. Ban tổ chức sẽ chấm điểm và công bố mô hình của người chiến thắng.

Với một tấm ảnh X quang chuẩn mực, phần mềm nói trên của Viện Big Data không chỉ xác định chủ nhân tấm ảnh có mắc bệnh hay không mà còn có thể khoanh vùng được 90% vùng phổi nghi vấn bị tổn thương để bác sĩ có thể tập trung vào đó - GS Văn thông tin.

Trong cuộc thi chẩn đoán 12 bệnh phổi phổ biến qua ảnh X quang lồng ngực (CheXpert) do Đại học Stanford tổ chức, Viện Big Data cũng đang đứng ở vị trí thứ 5 trong tổng số 40 đội. “Đặc biệt, kết quả chẩn đoán của thuật toán tốt hơn hoặc tương đương khi so sánh với với hội đồng các bác sĩ chẩn đoán hình ảnh do Stanford tổ chức để đánh giá cuộc thi, trên một bộ ảnh X quang cụ thể,” thông cáo báo chí của Vingroup dẫn lời GS Văn.

TS Nguyễn Quý Hà, Trưởng nhóm Phân tích Hình ảnh Y tế của Viện Big Data, cho biết, để đọc một ảnh chụp X quang đúng tiêu chuẩn, bác sĩ sẽ cần 5-10 phút; nhưng máy đọc chỉ mất 2-5 giây, tùy theo cấu hình phần cứng. Còn theo GS Văn, số liệu thống kê cho thấy, các phần mềm phân tích hình ảnh y tế giúp bác sĩ tăng độ chính xác trong chẩn đoán thêm 10%.

Sử dụng dữ liệu của người Việt, khả năng ứng dụng sẽ thật sự cao

Có nhiều khả năng phần mềm tự động đọc và hỗ trợ chẩn đoán bệnh qua ảnh X quang lồng ngực của Viện Big Data sẽ được thử nghiệm tại Bệnh viện Bạch Mai và Bệnh viện Trung ương Quân đội 108 sau khi các bên đã ký biên bản ghi nhớ. Tuy nhiên, theo TS Hà, thuật toán hiện đang được xây dựng dựa trên nguồn dữ liệu mở của nước ngoài; muốn độ chính xác và khả năng ứng dụng trong thực tế Việt Nam thật sự cao, phải thu thập dữ liệu ảnh y tế của người Việt.

TS Hà ước tính, với mỗi loại bệnh, thuật toán cần có ảnh chụp từ khoảng 100.000 - 200.000 bệnh nhân, một con số không hề nhỏ và không dễ mà có được. “Dữ liệu đầu vào càng lớn càng tốt. Giống như bác sĩ càng tiếp xúc nhiều ca bệnh đa dạng thì kinh nghiệm càng nhiều và chẩn đoán càng chính xác hơn.”

Mới đây, Viện Big Data cũng đã ký Biên bản ghi nhớ Hợp tác với Cục Công nghệ thông Thông tin – Bộ Y tế, theo đó hai bên thống nhất phối hợp trong việc xây dựng các quy định về trao đổi dữ liệu khám bệnh, chữa bệnh của người dân giữa các cơ sở khám bệnh, chữa bệnh và các tổ chức, cá nhân phục vụ cho việc nghiên cứu phát triển các sản phẩm ứng dụng trí tuệ nhân tạo trong y tế.

“Dữ liệu sau khi được chuẩn hóa và chú giải đầy đủ sẽ không mang bất kỳ thông tin cá nhân nào và sẽ được chia sẻ rộng rãi cho cộng đồng. Khi phần mềm hoàn thiện, các bệnh viện có thể được sử dụng miễn phí,” GS Vũ Hà Văn khẳng định. “Ở các bệnh viện tuyến dưới, nơi không có nhiều chuyên gia, thì việc áp dụng AI sẽ tăng đáng kể cơ hội cho người bệnh được tiếp cận với phương pháp chẩn đoán hiện đại, giúp các bác sĩ có thêm thông tin hữu ích để quyết định liệu pháp điều trị.”

Khi hoàn thành sản phẩm, một phương án khả thi là triển khai hệ thống chẩn đoán từ xa áp dụng công nghệ điện toán đám mây. Người dùng sẽ được cấp tài khoản và chỉ cần gửi hình ảnh đến sẽ có kết quả đọc gửi lại ngay sau đó. Cách làm này có lợi là chi phí rẻ và các bệnh viện không cần đầu tư cơ sở hạ tầng riêng.

Đầu tư bao nhiêu, tùy thuộc vào việc muốn đạt tới tầm mức nào

Phát triển các phần mềm phân tích hình ảnh y tế thuộc vào một trong hai hướng nghiên cứu chính của Viện Big Data là Thị giác máy tính (Computer Vision), bên cạnh hướng kia là giải mã bộ gene người Việt - GS Vũ Hà Văn chia sẻ với cử tọa tại Viện Toán học hôm 31/7.

Theo ông, bản thân những kiến thức dùng để giải quyết các bài toán về xử lý dữ liệu lớn mà ông biết không hẳn là sâu; cái khó ở đây là phải xác định đúng câu hỏi đáng giải quyết "trong hàng ti tỉ câu hỏi". GS Văn cũng nhấn mạnh, trong lĩnh vực dữ liệu lớn, ngoài trí thông minh của con người, còn đòi hỏi sự song hành của hệ thống lưu trữ và máy tính tương đối lớn. Những nghiên cứu lớn về big data hiện nay có thể dùng mấy chục nghìn giờ máy tính để chạy một model mới. Những tập đoàn như FB hay Google đang chiếm ưu thế không chỉ vì họ thông minh hơn mà còn vì họ có thể tập trung mấy nghìn máy tính cùng lúc.

Trong điều kiện Việt Nam, nên đầu tư bao nhiêu vào nghiên cứu dữ liệu lớn và trí tuệ nhân tạo, điều đó tùy thuộc vào việc chúng ta muốn đạt tới tầm mức nào, GS Văn nhận định. Nếu muốn làm ra những phần mềm như Deep Blue [máy tính chơi cờ vua do IBM phát triển] thì không khả thi, mà thế giới cũng chỉ cần một Deep Blue. Nhưng chúng ta có thể làm được không ít việc phục vụ cộng đồng chỉ với những khoản đầu tư không lớn lắm - GS Văn nói và dẫn chứng, Viện Big Data hiện đang đầu tư những cái máy trị giá khoảng 100 nghìn - 200 nghìn USD và chỉ 1-2 máy như vậy cũng đủ làm được nhiều việc, nếu sử dụng hết công suất. Ông cho hay, một nhóm nghiên cứu gồm 5 thành viên, làm việc trong khoảng 6-7 tháng, với sự hỗ trợ của một chiếc máy tính trị giá khoảng 100 nghìn USD, là có thể hoàn thành phần mềm phân tích hình ảnh đối với một bệnh.

GS Vũ Hà Văn cũng chia sẻ, để đưa phần mềm phân tích hình ảnh y tế vào sử dụng còn phải xây dựng quy trình pháp lý nhưng trước mắt, cứ phát triển những phần mềm đạt độ chính xác như của quốc tế đã. Và ông cho biết, Viện Big Data sẽ tiếp tục hướng đến xây dựng các phần mềm hỗ trợ chẩn đoán cho một số bệnh nguy hiểm và thường gặp tại Việt Nam như các loại ung thư hay các bệnh về tim mạch, thần kinh và tiểu đường.