Một nhóm nghiên cứu quốc tế đã thiết kế một hệ thống học sâu có thể tự động phát hiện các thảm họa thiên nhiên từ việc phân tích các hình ảnh được đăng trên các mạng xã hội.

Công cụ mới được đào tạo bằng 1,7 triệu bức ảnh, và đã chứng tỏ khả năng phân tích, lọc và phát hiện các thảm họa thực sự. Bài báo mô tả được xuất bản trên tạp chí IEEE Transactions on Pattern Analysis and Machine Intelligence.

Khi Trái đất nóng lên, các thảm họa thiên nhiên như lũ lụt, lốc xoáy và cháy rừng xảy ra thường xuyên và tàn khốc hơn. Vì chưa có công cụ để dự đoán những sự cố như vậy sẽ xảy ra ở đâu hoặc khi nào, nên cách ứng phó tốt nhất là phát hiện sớm để các dịch vụ ứng cứu có thể phản ứng nhanh chóng, hiệu quả và cứu được nhiều người nhất có thể. "Công nghệ có thể đóng một vai trò quan trọng trong những tình huống này. Các bài đăng trên mạng xã hội có thể được sử dụng làm nguồn dữ liệu có độ trễ thấp phản ánh tiến trình và hậu quả của thảm họa" - Àgata Lapedriza, nhà nghiên cứu chuyên về trí tuệ nhân tạo vì sức khỏe con người tại Đại học Oberta de Catalunya (UOC), đồng tác giả nghiên cứu mới, cho biết.

Hình minh họa. Nguồn: CC0 Public Domain

Các nghiên cứu trước đây tập trung vào việc phân tích các bài đăng ở dạng văn bản, nhưng nghiên cứu mới đi xa hơn. Các nhà nghiên cứu đã tạo ra một danh sách gồm 43 loại sự cố, gồm thiên tai (tuyết lở, bão cát, động đất, núi lửa phun trào, hạn hán, v.v...) cũng như các sự cố liên quan đến con người (tai nạn máy bay, tai nạn xây dựng, v.v...). Dựa trên danh sách phân loại này, cùng với danh sách 49 loại địa điểm, các nhà nghiên cứu gán nhãn tập dữ liệu hình ảnh dùng để huấn luyện mô hình.

Tập dữ liệu có tên Incidents1M, gồm 1.787.154 hình ảnh. Trong số những hình ảnh này, 977.088 hình ảnh có ít nhất một nhãn xác định loại sự cố, trong khi 810.066 có nhãn dưới dạng phủ định (ví dụ như "không phải tuyết lở"). Về địa điểm, 764.124 hình ảnh có nhãn xác định loại địa điểm và 1.023.030 có nhãn phủ định địa điểm.

Mục đích của các nhãn phủ định là để mô hình học được cách loại bỏ các kết quả dương tính giả. Ví dụ, một bức ảnh chụp lò sưởi không có nghĩa là ngôi nhà đang cháy, mặc dù giữa ngôi nhà bị cháy và lò sưởi có một số điểm tương đồng về hình ảnh.

Sau khi hoàn thành đào tạo, nhóm nghiên cứu thử nghiệm mô hình trên một khối lượng lớn hình ảnh được tải xuống từ mạng xã hội, bao gồm cả Flickr và Twitter. Lapedriza cho biết: “Chúng tôi đã kiểm tra xem mô hình có thể dựa trên các hình ảnh này để phát hiện chính xác các sự cố cụ thể đã được ghi nhận trong quá khứ hay không, chẳng hạn như trận động đất năm 2015 ở Nepal và Chile”.

Từ dữ liệu thực này, nhóm tác giả đã chứng minh khả năng của mô hình - có thể chỉ ra thảm họa thiên nhiên và các sự cố cần viện trợ dựa trên thông tin từ mạng xã hội. “Điều này sẽ giúp các tổ chức cứu trợ nhân đạo biết điều gì đang xảy ra trong các thảm họa một cách hiệu quả hơn", nhóm nghiên cứu cho biết.

Sau thành tựu này, thách thức tiếp theo có thể là dựa trên cùng một hình ảnh lũ lụt, hỏa hoạn hoặc các sự cố khác để tự động xác định mức độ nghiêm trọng của sự cố hoặc thậm chí giám sát theo thời gian. Các tác giả cũng gợi ý rằng có thể phát triển mô hình theo hướng kết hợp phân tích hình ảnh với văn bản đi kèm, để phân loại chính xác hơn.

Nguồn: