Trong tương lai, lĩnh vực phân tích dữ liệu lớn (big data analytics) – hướng tới xử lý dữ liệu ở những phạm vi, cấp độ siêu nhỏ và truyền tải thông tin tới cả chính phủ lẫn người dân trong khung thời gian giới hạn – nhiều khả năng sẽ nắm giữ vai trò chủ đạo đối với các thành phố.

Số người dùng Twee trong lễ hội

Số người dùngTweetertronglễ hội Carnival tại London. Nguồn:Suma et al

Khi số lượng người sử dụng các thiết bị kết nối internet để chia sẻ trải nghiệm cuộc sống trên mạng đang ngày càng tăng, trung bình cứ mỗi phút thế giới lại phải xử lý được một lượng dữ liệu khổng lồ, trong đó có không ít thông tin hữu ích. Nhiệm vụ này, nếu được thực hiện tốt, hoàn toàn có khả năng đóng góp vào việc cải thiện hoạt động của các thành phố, như đối với mạng lưới giao thông, các sự kiện hay trải nghiệm sống của dân cư.

Mới đây, các nhà khoa học tại Đại học King Abdulaziz (Arab Saudi) đã thử nghiệm công nghệ phân tích dữ liệu lớn dựa trên thông tin về không – thời gian đối với nhiều sự kiện diễn ra ở London nhằm xác định hiệu quả của chúng thông qua nền tảng mạng xã hội. Hai ứng dụng học máy (machine learning) là Spard và Tableau đã được sử dụng để phân tích hơn 3 triệu lượt tweet có liên quan đến London. Nhóm nghiên cứu kỳ vọng sẽ sử dụng kết quả thu được cho việc tham khảo để xây dựng và phát triển các cơ sở phân tích dữ liệu lớn hữu ích. “Đối tượng mà chúng tôi hướng tới ở đây là các cộng đồng dân cư thông minh, phần tử không thể thiếu làm nên những thành phố thông minh” - Sugimiyanto Suma, thành viên dự án, nói với Tech Xplore.

Đây là lần đầu tiên, nền tảng Apache Spark – cấu trúc tính toán tập hợp mã nguồn mở – được thử nghiệm để tìm kiếm thông tin về các sự kiện trên mạng xã hội, và cho kết quả khả quan. Bên cạnh đó, giao diện giao diện lập trình Google Maps Geocoding cũng được sử dụng để giúp xác định vị trí người dùng Tweeter ở khu vực London và phục vụ cho việc thực hiện những phân tích chuyên sâu. Kết quả thu được là khá ấn tượng khi hệ thống đã rất nhiều lần xác định chính xác những đoạn đường hay bị tắc nghẽn, hay lưu ý về những sự kiện vốn được ít người biết tới (như một lễ hội carnival tổ chức vào năm 2017)

Trong tương lai, hệ thống do Suma và đồng nghiệp phát triển hoàn toàn có khả năng sẽ được các nhóm nghiên cứu khác tiếp nhận và hoàn thiện nhằm thu được những kết quả mang tính chi tiết hơn. Thành tựu này cũng có thể hỗ trợ nhiều chính phủ và các tổ chức liên quan trong hoạt động quy hoạch và tổ chức sự kiện tại những thành phố. Hiện tại, nhóm của Suma cũng đang rất nỗ lực tìm cách cải thiện chất lượng kết quả phân tích, độ chính xác, cũng như mở rộng phạm vi dò tìm của hệ thống.

Nguồn: https://techxplore.com/news/2018-08-big-analytics-automatically-events-smart.html