Báo động quốc tế đầu tiên về đại dịch COVID-19 không được đưa ra bởi con người, mà bởi máy tính.
Đó là HealthMap, một trang web được điều hành bởi Bệnh viện Nhi Boston, sử dụng trí thông minh nhân tạo (AI) để quét các phương tiện truyền thông xã hội, bản tin, truy vấn tìm kiếm trên internet và các luồng thông tin khác để tìm dấu hiệu bùng phát dịch bệnh.
Vào ngày 30/12/2019, chương trình khai thác dữ liệu này đã phát hiện một bản tin về một loại viêm phổi mới ở Vũ Hán, Trung Quốc. Tin vắn này lưu ý rằng bảy bệnh nhân lúc đó đang trong tình trạng nguy kịch và đánh giá mức độ khẩn cấp của dịch bệnh ở mức 3 trên thang điểm 5.
Ngay sau đó, các đồng nghiệp ở Đài Loan của Marjorie Pollack, nhà dịch tễ học y tế ở thành phố New York, đã cảnh báo cô về tình hình dịch bệnh đang được chia sẻ trên Weibo. Chưa đầy 1 giờ sau khi HealthMap cảnh báo, cô đã đăng một thông báo chi tiết hơn lên Chương trình theo dõi các bệnh mới nổi có 85.000 người theo dõi.
HealthMap sử dụng trí tuệ nhân tạo và khai thác dữ liệu để phát hiện dịch bệnh và đưa ra cảnh báo cụ thể theo vị trí (chấm màu) đối với COVID-19 và các bệnh khác. Đây là chương trình đã báo động sớm về đại dịch.
Báo động sớm từ HeathMap cho thấy tiềm năng của AI, hoặc học máy, trong việc theo dõi lây nhiễm.
Từ lâu trước khi COVID-19 lây lan, Trung tâm Kiểm soát và Phòng ngừa dịch bệnh Hoa Kỳ (CDC) đã bắt đầu một cuộc thi thường niên dự đoán chính xác nhất mức độ nghiêm trọng và lây lan của bệnh cúm trên khắp nước Mỹ. Cuộc thi, bắt đầu từ năm 2013, nhận được hàng chục bài dự thi mỗi năm. Matthew Biggerstaff, nhà dịch tễ học tại CDC, cho biết, khoảng một nửa trong số đó liên quan đến các thuật toán học máy, các mô hình được đào tạo trên các tập dữ liệu lớn để học cách phát hiện các mối tương quan. Ví dụ, Roni Rosenfeld, nhà khoa học máy tính tại Đại học Carnegie Mellon và các đồng nghiệp đã 5 lần chiến thắng cuộc thi của CDC với các thuật toán khai thác dữ liệu từ tìm kiếm Google, bài đăng trên Twitter, lượt xem trang Wikipedia và lượt truy cập vào trang web của CDC.
Nhiều đội tham gia cuộc thi hiện đã chuyển sang theo dõi COVID-19. Họ đang áp dụng AI theo hai cách. Một là cố gắng phát hiện những dấu hiệu đầu tiên của một căn bệnh mới hoặc một đợt bùng phát bệnh dịch, giống như HealthMap đã làm. Điều này đòi hỏi các thuật toán tìm kiếm các tín hiệu mờ nhạt trong hàng loạt dữ liệu "nhiễu", tác vụ mà một con người được đào tạo tốt có lợi thế so với máy tính, Pollack nói.
Thứ hai, có thể dùng AI để đánh giá tình trạng hiện tại của một dịch bệnh đang diễn ra và dự đoán tương lai gần. Các nhóm tại Đại học Carnegie Mellon tìm cách dự đoán các biến số liên quan COVID-19 ở thời điểm hiện tại trên khắp nước Mỹ bằng cách sử dụng dữ liệu được thu thập qua các cuộc khảo sát dạng tự hiển thị (pop-up) về triệu chứng do Google và Facebook tiến hành, dữ liệu tìm kiếm của Google và các nguồn khác. Mục tiêu của họ là dự đoán nhu cầu của địa phương đối với giường bệnh và máy thở cho 4 tuần trong tương lai, Rosenfeld nói. "Chúng tôi đang cố gắng phát triển một công cụ cho các nhà hoạch định chính sách để họ có thể tinh chỉnh các hạn chế giãn cách xã hội mà không làm quá tải các nguồn lực của bệnh viện."
Mặc dù tự động hóa, các hệ thống AI vẫn cần nhiều nhân lực, theo Rozita Dara, nhà khoa học máy tính tại Đại học Guelph từng theo dõi bệnh cúm gia cầm và giờ chuyển sang COVID-19. Ví dụ: để đào tạo một chương trình quét Twitter, các nhà nghiên cứu phải cung cấp cho nó các ví dụ về các tweet (bài đăng) liên quan, và phải lướt Twitter trong nhiều giờ để chọn ra các tweet đó, Dara nói. AI cũng khó bắt kịp với một đại dịch đang phát triển nhanh chóng, khi các mối tương quan giữa hành vi trực tuyến và tình hình bệnh tật thực tế liên tục thay đổi, Jeffrey Shaman, nhà dịch tễ học tại Đại học Columbia nói.
AI cũng từng dự đoán sai. Từ năm 2009 đến 2015, Google đã thực hiện một dự án có tên Google Flu Trend, khai thác dữ liệu truy vấn tìm kiếm để theo dõi tỷ lệ lây nhiễm bệnh cúm ở Mỹ. Lúc đầu hệ thống đã hoạt động tốt, dự đoán chính xác chỉ số liên quan trước khoảng 2 tuần. Tuy nhiên, từ năm 2011 đến 2013, nó đã dự đoán tỷ lệ mắc bệnh cúm quá cao. Thất bại đó phát sinh phần lớn do các nhà nghiên cứu không tinh chỉnh hệ thống khi hành vi tìm kiếm của mọi người đã thay đổi, Yom-Tov nói, dẫn đến mô hình này diễn giải sai các tìm kiếm bản tin thành dấu hiệu lây nhiễm.
"Tôi không nghĩ rằng đó là một vấn đề cố hữu trong lĩnh vực này," Yom-Tov nói thêm. Trên thực tế, ông và các đồng nghiệp ở Đại học College London gần đây đã đăng một bài báo lên máy chủ arXiv cho thấy họ có thể tinh chỉnh các hiểu nhầm liên quan đến tìm kiếm tin tức.
Các quan chức ở các quốc gia đang thiếu năng lực xét nghiệm Covid-19, chẳng hạn như Mỹ, có thể sẽ muốn tìm đến các hệ thống giám sát tự động như biện pháp thay thế. Tuy nhiên, Biggerstaff nói rằng đó sẽ là một sai lầm: "Tôi không nghĩ cách làm này (các hệ thống học máy) có thể thay thế việc xét nghiệm." Cụ thể, ông nói, khi cúm xuất hiện trở lại vào mùa thu tới, cần có xét nghiệm trực tiếp để phân biệt dịch cúm với COVID-19. Nhưng AI có thể giúp các nhà hoạch định chính sách dành nhiều xét nghiệm hơn cho các điểm nóng. "Hy vọng là sẽ có cả hai biện pháp làm việc cùng nhau," John Brownstein, nhà dịch tễ học tại Bệnh viện Nhi Boston, người đồng sáng lập HealthMap vào năm 2006, cho biết.
Một số nhà nghiên cứu đặt câu hỏi liệu có phát triển kịp các hệ thống AI giúp giải quyết đại dịch COVID-19 hay không. "AI sẽ không hữu ích đối với COVID-19 so với các đại dịch trong tương lai," Dara nói. Dara dự kiến sẽ mất khoảng 6 tháng để phát triển hệ thống theo dõi bệnh của mình. Pollack, người đã cảnh báo về COVID-19 theo cách "lỗi thời", nói rằng cô cũng đang phát triển một chương trình AI chuyên quét Twitter để tìm các thông tin liên quan đến căn bệnh này.
Nguồn: