Cần phải giải quyết được các vấn đề liên quan đến thu thập, tổ chức và phân tích dữ liệu.


Điện thoại di động thúc đẩy sử dụng dữ liệu lớn

Điện thoại di động đã được các tổ chức phi lợi nhuận bắt đầu tận dụng để thu thập dữ liệu lớn. Năm 2010, hơn 5 tỷ điện thoại di động đã được sử dụng, với hơn 80% là ở các nước đang phát triển. Tỷ lệ người sở hữu điện thoại di động ở vùng hạ Sahara châu Phi tăng từ 32,1% năm 2008 lên 57,1% năm 2012. Mức tăng trưởng này đã mang lại cho người dân ở các nước đang phát triển những cơ hội cải thiện chất lượng cuộc sống của họ.

Ví dụ, Cell Life, một tổ chức ở Nam Phi, đã tạo ra một dịch vụ di động nhắn tin đại chúng gọi là Communicate, nhắc nhở bệnh nhân dùng thuốc, liên kết bệnh nhân tới phòng khám và cung cấp các dịch vụ hỗ trợ ngang hàng như tư vấn và giám sát. Life cũng phát triển Capture, một dịch vụ giúp cho nhân viên y tế trong lĩnh vực này có thể thu thập và lưu thông tin dưới dạng kỹ thuật số bằng điện thoại di động của họ.

Sử dụng điện thoại di động và Internet ngày càng phổ biến cho phép thu được những lượng thông tin chưa từng có. Hầu hết các điện thoại di động hiện đại đều có công nghệ hệ thống định vị toàn cầu, xác định vị trí địa lý của điện thoại. Ngoài dữ liệu định vị, điện thoại di động còn chứa một kho tàng thông tin, chẳng hạn như nhật ký cuộc gọi, tin nhắn SMS và các bài đăng trên mạng xã hội. Điện thoại di động còn hoạt động như một cảm biến riêng lẻ thu thập thông tin từ môi trường, khi được tổng hợp và phân tích với thông tin từ hàng triệu chiếc điện thoại di động khác có thể dẫn đến những thông tin quan trọng để thông báo ngược lại cho chính người sử dụng chiếc điện thoại đó. Ví dụ, các nhà khoa học đang nghiên cứu các xu hướng chuyển động di cư sau thảm họa để tìm hiểu sự lây lan của bệnh truyền nhiễm. Caroline Buckee, nhà dịch tễ học tại đại học Harvard và cộng sự, đã sử dụng dữ liệu định vị từ điện thoại di động để tìm hiểu các mô hình di chuyển của con người ở Kenya nhằm giúp ngăn chặn bệnh sốt rét và các bệnh lây lan khác.

Các bước tăng cường sử dụng dữ liệu lớn

Dữ liệu lớn có tiềm năng to lớn để hình thành nên các quyết định nhằm giúp giải quyết các vấn đề xã hội nan giải nhất trên thế giới. Để thực hiện được, cần phải giải quyết được các vấn đề liên quan đến thu thập, tổ chức và phân tích dữ liệu. Bốn khuyến nghị sau đây có tiềm năng tạo ra các tập dữ liệu hữu ích cho việc hoạch định kế hoạch dựa trên số bằng chứng hoặc số liệu.

Xây dựng những ngân hàng dữ liệu toàn cầu về các vấn đề quan trọng: Cộng đồng toàn cầu cần tạo ra các ngân hàng dữ liệu lớn về các vấn đề phức tạp như nạn buôn người, nạn đói và nghèo đói toàn cầu. Ngân hàng dữ liệu sẽ có khả năng chứa nhiều loại dữ liệu khác nhau cùng với siêu dữ liệu mô tả các tập dữ liệu. Để thực hiện việc này, cần thành lập các liên minh đa ngành thúc đẩy chia sẻ dữ liệu về các vấn đề theo chủ đề. Tại Hội nghị thượng đỉnh G-8 năm 2012, lãnh đạo của các nền kinh tế lớn nhất thế giới và bốn nhà lãnh đạo châu Phi đã gặp, thảo luận và cam kết chống lại nạn đói và đảm bảo an ninh lương thực. Một số sáng kiến dựa trên công nghệ và dữ liệu đã được đưa ra. Trong đó, tiêu biểu là sáng kiến Agrilinks.org, một nền tảng chia sẻ dữ liệu được cập nhật nhất quán. Nông dân có thể truy cập vào Agrilinks.org để đọc về các phương thức thực hành nông nghiệp mới hoặc gửi tweet trực tiếp từ điện thoại di động của họ để đặt câu hỏi cho chuyên gia nông nghiệp.

Thu hút nhân dân và thúc đẩy công dân làm khoa học. Big data không phải là lĩnh vực chỉ dành riêng cho chuyên gia. Người dân cũng có thể góp phần tạo và phân tích các tập dữ liệu. Với sự gia tăng của dữ liệu thông qua các nền tảng dữ liệu mở, ngày càng có nhiều người dân đang tạo ra những ý tưởng và sản phẩm mới và hình thành nên xu thế “công dân làm khoa học” Năm 2010, London cung cấp dữ liệu của chính phủ cho công chúng bằng cách mở London Datastore. Được quản lý bởi Cơ quan Greater London, London Datastore tạo điều kiện cho người dân có cơ hội xem và sử dụng dữ liệu thô được các cơ quan thành phố và công chức tạo ra. Thông tin được công bố bao gồm dữ liệu về tội phạm, kinh tế và dữ liệu theo thời gian thực từ các hệ thống chuyển tuyến. Nhờ thế, Matthew Somerville, một nhà phát triển Web, đã tạo ra một ứng dụng bản đồ trực tuyến của hệ thống tàu điện ngầm City of London đạt hơn 250.000 lượt truy cập trong vài ngày. Tương tự như vậy, Ben Barker, một kỹ sư điện tử và là người đi xe đạp, đã tạo ra một bản đồ xe đạp với thông tin được lấy từ London Datastore.

Xây dựng đội ngũ các nhà phân tích và quản lý dữ liệu. Ngày nay, chúng ta không chỉ thiếu các nhà quản lý và phân tích dữ liệu có khả năng giải quyết các vấn đề xã hội mà còn hạn chế trong việc trang bị và đào tạo cho nhân viên những kỹ năng thích hợp. Các sinh viên thường chỉ được học những kiến thức cơ bản về thống kê. Cách tiếp cận này không còn đáp ứng được nếu muốn sử dụng lợi thế của dữ liệu lớn. Vì vậy, cần trang bị cho sinh viên và các nhà phân tích các kỹ năng cần thiết để sắp xếp dữ liệu để tạo ra các tập dữ liệu lớn. Những kỹ năng này thường có trong các chương trình tin học và thông tin thư viện. Trong những chương trình này, sinh viên sẽ được học về cách tổ chức dữ liệu, bảo quản, trực quan hóa, tìm kiếm và truy xuất và sử dụng dữ liệu.

Thúc đẩy các nền tảng thử nghiệm ảo. Để tăng cường hiểu biết về cách sử dụng dữ liệu lớn giải quyết các vấn đề xã hội, cần thúc đẩy nhiều thử nghiệm. Các nền tảng thử nghiệm ảo, cho phép các cá nhân chia sẻ ý tưởng, tương tác với ý tưởng của người khác và hợp tác để tìm giải pháp cho vấn đề hoặc tận dụng các cơ hội, sẽ có khả năng liên kết các bên để tạo các tập dữ liệu lớn, phát triển các thuật toán sáng tạo để phân tích và trực quan hóa dữ liệu và phát triển kiến thức mới. Một ví dụ là Kaggle, một trang web điều hành các cuộc thi phân tích dữ liệu. Tuy nhiên, các tổ chức đang giải quyết các vấn đề xã hội hiếm khi tham gia vào các nền tảng này.

Nền tảng thử nghiệm ảo rât cần thiết nếu sử dụng dữ liệu lớn để giải quyết các vấn đề xã hội. Đầu tiên, những nền tảng này sẽ tổ chức các cuộc thi để tạo ra các tập dữ liệu lớn về nhiều vấn đề khác nhau. Những cuộc thi tạo ra các tập dữ liệu lớn sẽ rất quan trọng để giúp cộng đồng nhận ra những thách thức xã hội. Khi các tập dữ liệu được tạo ra, có thể tổ chức các cuộc thi tập trung vào phân tích dự đoán và khám phá các mô hình mới. Việc sử dụng các diễn đàn mở như wiki và các nhóm thảo luận có thể giúp cộng đồng chia sẻ các bài học kinh nghiệm, cộng tác và tìm ra các giải pháp mới.

Tương lai của dữ liệu lớn

Lĩnh vực kinh doanh và khoa học đã chứng tỏ không thể phủ nhận được tầm quan trọng của Big data. Hiện tại, những tổ chức giải quyết các vấn đề xã hội cần phải tìm cách kết hợp năng lực sử dụng big data trong việc đề ra quyết định vào hoạt động của mình. Tiềm năng tăng cường sử dụng Big data để giải quyết các vấn đề xã hội rất lớn, nhưng cũng còn phải vượt qua rất nhiều trở ngại nghiêm trọng. Lý do là những vấn đề xã hội thường được giải quyết theo nhiều cách phức tạp hơn rất nhiều so với trong kinh doanh hay khoa học, khiến cho việc sử dụng dữ liệu lớn gặp khó khăn hơn. Ngoài ra, quyền lợi, sự riêng tư và phẩm giá của các đối tượng trong các vấn đề xã hội đang được giải quyết cũng cần phải hết sức chú ý.

Bất chấp những trở ngại này, rất nhiều nỗ lực đang được thực hiện. Các cơ quan nhà nước đều nhận thức rõ dữ liệu là một yếu tố quan trọng của sự đổi mới xã hội. Nhiều tổ chức như Ngân hàng Thế giới đã công khai dữ liệu của họ cho công chúng khai thác và sử dụng. Có rất nhiều cá nhân đang sử dụng dữ liệu để tạo ra những đổi mới, chủ yếu là ứng dụng, nhằm giải quyết một vấn đề xã hội cụ thể.

Bên cạnh đó, có những tổ chức được thành lập để góp phần sử dụng dữ liệu lớn giải quyết các vấn đề xã hội một cách tốt hơn. Ví dụ, DataKind, là tổ chức giúp kết nối các nhà khoa học và thống kê với các tổ chức phi lợi nhuận để giúp khắc phục tình trạng thiếu nhân viên công nghệ có khả năng xử lý các dự án dữ liệu lớn. Trên toàn cầu, rất nhiều tổ chức cũng đang nỗ lực sử dụng dữ liệu mở và dữ liệu lớn để phát triển các giải pháp cho các vấn đề xã hội theo những cách sáng tạo và hợp tác.

Phương Anh tổng hợp (Theo Big data for social innovation, Standford Social Innovation Review)