Viện Nghiên cứu Dữ liệu lớn VinBigdata (Tập đoàn Vingroup) vừa công bố kết quả cuộc thi có dữ liệu đặc trưng người Việt, thu hút 1.277 đội thi đến từ hơn 60 quốc gia và vùng lãnh thổ, trong đó Việt Nam có 103 đội thi.

Cuộc thi Ứng dụng AI phát hiện điểm bất thường trên ảnh X-quang lồng ngực với tổng giải thưởng trị giá 50.000 USD được triển khai toàn cầu trên Kaggle.com từ 31/12/2020 đến 31/3/2021, theo thông cáo báo chí của Vingroup.

Kaggle.com, do Google phát triển, là nền tảng nổi tiếng nhất thế giới trong lĩnh vực Khoa học dữ liệu và AI với cộng đồng hơn 5 triệu thành viên. Là đơn vị đầu tiên tại Việt Nam tổ chức cuộc thi trên Kaggle, giải thưởng của VinBigdata nằm trong top 10 mức thưởng cao nhất hiện tại.

TS. Nguyễn Quý Hà, Trưởng phòng Xử lý ảnh y tế, VinBigdata, cho biết, hơn 10% số người dự thi là Kaggle Master hoặc Grandmaster - các Đại kiện tướng trên Kaggle về Khoa học dữ liệu và các chuyên gia đến từ các công ty công nghệ lớn trên thế giới như Google, NVIDIA, Intel, ABBYY, Oracle, Preferred Networks...

Sau 3 tháng tranh tài, Cuộc thi đã xác định được vị trí Nhất, Nhì, Ba cũng như giải đặc biệt dành cho đội Việt Nam có thành tích tốt nhất.

Theo kết quả được VinBigdata công bố sáng nay, 7/4, đứng thứ Nhất và nhận giải thưởng trị giá 20.000 USD là đội ℳS²Ƒ gồm các thành viên đến từ Ủy ban Năng lượng Nguyên tử Quốc gia Argentina, công ty công nghệ y tế Ấn Độ HealthGenYZ, Tập đoàn Intel, và H2O.ai thuộc Google.

SZI - đứng thứ Nhì với ba thành viên đến từ Nga.

Đội đứng thứ Ba - Scumed - là sự kết hợp của năm thành viên đến từ Trung Quốc và Malaysia.

Đây cũng là 3 đội luôn dẫn đầu trong suốt quá trình huấn luyện mô hình trên dữ liệu thử nghiệm.

Giải đặc biệt dành cho đội Việt Nam có thành tích tốt nhất Cuộc thi được trao cho Chu Tấn Kiệt, Khoa Khoa học máy tính, Đại học Drexel, Philadelphia, Pennsylvania (Mỹ), xếp hạng thứ 10 chung cuộc với giải thưởng trị giá 8.000 USD.


Kết thúc Cuộc thi, 18.000 ảnh X-quang được Tập đoàn Vingroup chia sẻ tới cộng đồng Khoa học dữ liệu. Ảnh: Vingroup

“Cuộc thi xử lý ảnh y tế do VinBigdata tổ chức có độ thực tiễn cao hơn so với hầu hết các cuộc thi về xử lý ảnh y tế hiện nay trên Kaggle khi đồng thời phải phân loại bất thường và khoanh vùng điểm bất thường cho 14 nhóm bệnh,” thông cáo báo chí dẫn lời Chu Tấn Kiệt. “Ngoài ra, với phần thưởng đặc biệt cho các đội thi đến từ Việt Nam, cuộc thi cũng thúc đẩy người Việt tham gia tìm hiểu và tiếp cận các bài toán y tế thực tiễn.”

Với thử thách xây dựng thuật toán học máy để phát hiện và khoanh vùng 14 loại bất thường tim – phổi phổ biến, cuộc thi cung cấp bộ dữ liệu gồm 18.000 ảnh y khoa đặc trưng của người Việt. Dữ liệu được thu thập và chú giải bởi các bác sĩ giàu kinh nghiệm của Bệnh viện Vinmec, Bệnh viện Trung ương Quân đội 108 và Bệnh viện Đại học Y Hà Nội. Bài toán mô phỏng công việc của các bác sĩ chẩn đoán ảnh y tế tại bệnh viện, với nguồn dữ liệu thực tế được chuẩn hóa, giúp người yêu công nghệ tiếp cận vấn đề thực tiễn để cùng phát triển giải pháp cho các bài toán y tế của Việt Nam. Một hệ thống tự động đánh giá độ chính xác của thuật toán mà các đội thi gửi về thông qua so sánh trực tiếp với kết quả mẫu của bác sĩ.

Kết thúc cuộc thi, bộ dữ liệu 18.000 ảnh X-quang được thu thập và gán nhãn bởi các bác sĩ chẩn đoán hình ảnh uy tín sẽ tiếp tục được VinBigdata chia sẻ trên Kaggle.

Đồng thời, từ ngày 1/4/2021, VinBigdata mở VinDr Lab, phần mềm gán nhãn được sử dụng để xây dựng bộ dữ liệu trên cho cộng đồng, nhằm chia sẻ dữ liệu, thúc đẩy nghiên cứu và phát triển ngành Khoa học dữ liệu và AI tại Việt Nam.

Theo đại diện của Vingroup, các thuật toán dự thi có nhiệm vụ phát hiện và khoanh vùng 14 loại bất thường tim – phổi phổ biến như: xẹp phổi, vôi hóa, bóng tim to, tràn dịch màng phổi, dày dính màng phổi, tràn khí màng phổi, xơ phổi...