Một nghiên cứu đánh giá cho thấy AI có thể giải thích các hình ảnh y tế với độ chính xác tương đương các chuyên gia chăm sóc sức khỏe.
Một nghiên cứu trên Lancet Digital Health cho thấy AI đạt trình độ tương đương với các chuyên gia trong việc đưa ra các chẩn đoán y khoa dựa trên hình ảnh. Tiềm năng của AI trong chăm sóc sức khỏe là chủ đề luôn gây hứng thú, nhiều ý kiến cho rằng AI sẽ tiết kiệm nguồn lực ngành y, thu ngắn thời gian tương tác bác sĩ - bệnh nhân và thậm chí hỗ trợ phát triển nhiều phương pháp điều trị. Tháng trước, chính phủ Anh đã công bố sẽ tài trợ 250 triệu bảng cho một phòng thí nghiệm trí tuệ nhân tạo mới tại trường Đại học Bệnh viện Birmingham.
Một ứng dụng đang phát triển là sử dụng AI trong việc diễn giải các hình ảnh y tế dựa trên học sâu, một hình thức học máy tinh vi trong đó một loạt các hình ảnh được gắn nhãn được đưa vào các thuật toán để chọn ra các đặc tính và tìm hiểu cách phân loại những hình ảnh tương tự. Cách tiếp cận này đã cho thấy tiềm năng trong chẩn đoán các bệnh từ ung thư đến các bệnh về mắt. Tuy nhiên vẫn còn những câu hỏi đặt ra: liệu các hệ thống học sâu có thể so sánh được với các kĩ năng của con người. Mới đây, các nhà nghiên cứu đã tiến hành một đánh giá toàn diện đầu tiên về các nghiên cứu được công bố trong chủ đề này, và thấy rằng con người và máy móc có độ chính xác tương đương nhau.
Giáo sư Alastair Denniston ở Đại học Bệnh viện Birmingham, và là đồng tác giả của nghiên cứu, cho biết, nghiên cứu này cũng là cái nhìn thực tế giữa rất nhiều quảng cáo thổi phồng về AI.
Tiến sĩ Xiaoxuan Liu, tác giả chính của nghiên cứu, đồng ý với nhận định này: “Có rất nhiều quảng cáo rầm rộ về khả năng vượt trội của AI, nhưng chúng tôi cho rằng AI mới chỉ ở mức độ tương đương với con người".
Trong công bố trênLancet Digital Health,Denniston, Liu và các đồng nghiệp đã báo cáo cách họ tập trung vào các tài liệu nghiên cứu được xuất bản từ năm 2012 - năm bản lề với học sâu. Tìm kiếm ban đầu đã cho ra hơn 20.000 nghiên cứu có liên quan. Tuy nhiên, chỉ có 14 nghiên cứu - tất cả dựa trên bệnh ở người - có đủ các điều kiện: (i) dữ liệu chất lượng tốt, (ii) thử nghiệm hệ thống học sâu bằng những hình ảnh từ một bộ dữ liệu riêng (thay vì thử nghiệm bằng cùng bộ dữ liệu dùng để huấn luyện) và (iii) cho các chuyên gia y khoa xem cùng các hình ảnh đó.
Các kết quả hứa hẹn nhất từ 14 nghiên cứu cho thấy các hệ thống học sâu đã phát hiện chính xác tình trạng bệnh trong 87% số trường hợp, các chuyên gia chăm sóc sức khỏe phát hiện chính xác 86%. 93% chẩn đoán hoàn toàn an toàn của máy là chính xác, so với 91% của các chuyên gia. Tuy nhiên, các chuyên gia chăm sóc sức khỏe trong các thử nghiệm này không được cung cấp thêm thông tin về bệnh nhân – thông tin mà họ được tiếp cận trong khám chữa bệnh thực tế và có thể cải thiện chẩn đoán.
Giáo sư David Spiegelhalter, Chủ tịch Trung tâm Winton về truyền thông rủi ro & bằng chứng tại Đại học Cambridge, cho biết lĩnh vực này đầy rẫy những nghiên cứu kém chất lượng. "Đánh giá xuất sắc này chứng minh rằng sự cường điệu về khả năng của AI trong y tế đang làm mờ đi sự kém chất lượng của hầu hết các nghiên cứu đánh giá", ông nói. "Học sâu có thể là một kỹ thuật hiệu quả và ấn tượng, nhưng các bác sĩ lâm sàng nên đặt câu hỏi: nó thực sự hỗ trợ gì trong thực hành lâm sàng?"
Tuy nhiên, Denniston vẫn lạc quan về tiềm năng của AI trong chăm sóc sức khỏe, cho rằng các hệ thống học sâu như vậy có thể hoạt động như một công cụ chẩn đoán và giải quyết vấn đề tồn đọng các bản scan, hình ảnh. Liu nói thêm, chúng sẽ phát huy hiệu quả ở những nơi thiếu chuyên gia giải thích hình ảnh, quan trọng là phải sử dụng các hệ thống học sâu trong các thử nghiệm lâm sàng để đánh giá liệu kết quả của bệnh nhân có được cải thiện so với cách thực hành hiện tại hay không.