Nhóm nghiên cứu ở ĐH Quốc gia TPHCM đã tuyển chọn được mô hình dự báo nồng độ PM2.5 trước hai ngày với độ chính xác trên 80%.

Một góc phố ở TPHCM | Ảnh: Thanh Tung/VNN
Một góc phố ở TPHCM | Ảnh: Thanh Tung/VNN

Ô nhiễm không khí gây ra ảnh hưởng xấu tới sức khỏe con người. Dự báo nồng độ PM2.5 là một trong những hoạt động quan trọng để chính quyền và người dân có thể lập kế hoạch ứng phó với tình trạng ô nhiễm hoặc có các biện pháp ngăn chặn gia tăng phát thải.

Tại Việt Nam nói chung và TPHCM nói riêng, các báo cáo về PM2.5 chủ yếu là kết quả quan trắc thực tế, trong khi rất hiếm nghiên cứu dự đoán nồng độ PM2.5.

Để góp phần lấp đầy khoảng trống này, một nhóm kết hợp giữa các nhà nghiên cứu thuộc Khoa Môi trường của Trường ĐH Khoa học tự nhiên và Khoa Công nghệ ứng dụng của Trường ĐH Bách khoa đã đào tạo 6 mô hình học máy để dự đoán nồng độ PM2.5 ở TPHCM và chọn ra mô hình tốt nhất là mô hình hồi quy cây phụ (Extra Trees Regression).

Nghiên cứu đã được công bố trên tạp chí Aerosol and Air Quality Research. Sử dụng dữ liệu khí tượng mô phỏng tạo ra bằng mô hình nghiên cứu và dự báo thời tiết (WRF) thông thường, các tác giả đã thử dự báo nồng độ PM2.5 ở thành phố trong ngắn hạn (24h, 48h và 72h) và dài hạn (7 ngày).

Kết quả khi đối chiếu với dữ liệu quan sát được thực tế cho thấy độ chính xác của kết quả dự báo 2 ngày là cao nhất, trên 80%.

Xem xét 6 thuật toán học máy khác nhau (Hồi quy tuyến tính, Hồi quy cây phụ, Thuật toán Xgboost, Hồi quy rừng ra quyết định, Mạng thần kinh hồi quy, Hồi quy Lasso) để dự báo nồng độ PM2.5 | Ảnh: nhóm nghiên cứu.
Nhóm nghiên cứu xem xét 6 thuật toán học máy khác nhau (Hồi quy tuyến tính, Hồi quy cây phụ, Thuật toán Xgboost, Hồi quy rừng ra quyết định, Mạng thần kinh hồi quy, Hồi quy Lasso) để dự báo nồng độ PM2.5 | Ảnh: nhóm nghiên cứu.

Các tác giả cho biết, các thuật toán để đào tạo mô hình đều là thuật toán đơn lẻ, không quá phức tạp. Tập dữ liệu đầu vào để đào tạo cũng chỉ khoảng 3 năm. Họ tin hiệu suất của mô hình sẽ tăng lên nếu dữ liệu nồng độ PM2.5 để đào tạo học máy được lấy theo phút hoặc giây, thay vì theo giờ như nghiên cứu trên. Việc kết hợp các thuật toán học máy đơn lẻ với nhau cũng hứa hẹn tăng hiệu suất dự đoán của mô hình.

Nhóm tác giả kì vọng phương pháp học máy hiệu quả, nhanh chóng và dễ tiếp cận này có thể được áp dụng để cảnh báo sớm ô nhiễm và cung cấp thông tin cho hệ thống quản lý chất lượng không khí tại các thành phố lớn.


Tham khảo:

Minh, V.T.T., Tin, T.T., Hien, T.T. (2021). PM2.5 Forecast System by Using Machine Learning and WRF Model, A Case Study: Ho Chi Minh City, Vietnam. Aerosol Air Qual. Res. 21, 210108. https://doi.org/10.4209/aaqr.210108