Ngày 28/06/2017, Bộ Khoa học và Công nghệ đã ban hành Thông tư số 10/2017/TT-BKHCN, quy định về xây dựng, quản lý, khai thác, sử dụng, duy trì và phát triển cơ sở dữ liệu quốc gia về khoa học và công nghệ.

Chắc chắn, các cơ sở dữ liệu thành phần của cơ sở dữ liệu quốc gia này sẽ góp phần không nhỏ trong việc quản lý tốt hơn các thông tin - dữ liệu có liên quan tới khoa học và công nghệ và góp phần vào việc cải thiện năng lực chính phủ điện tử ở Việt Nam.

Để cơ sở dữ liệu quốc gia này không chỉ góp phần cải thiện chính phủ điện tử ở Việt Nam, mà còn góp phần và có khả năng tiệm cận tới những yêu cầu mới của CMCN4, bài viết này mong muốn đưa ra vài gợi ý.

A. Cơ sở dữ liệu quốc gia về KH&CN có khả năng và nên là MỞ

Cơ sở dữ liệu quốc gia về khoa học và công nghệ có những điều kiện cơ bản để trở thành một cơ sở dữ liệu cung cấp các dữ liệu của nó như là các dữ liệu mở thông qua các điều khoản, hạng mục sau đây được nêu trong thông tư:

Dữ liệu không là các dữ liệu bí mật quốc gia. ‘Thông tư này không áp dụng với các tài liệu thuộc danh mục bí mật nhà nước’ và ‘Thông tư này không áp dụng với Bộ Quốc phòng và Bộ Công an’.

Các nguyên tắc dữ liệu FAIR.

Cơ sở dữ liệu được xây dựng bằng tiền ngân sách do nhà nước cấp. ‘Kinh phí xây dựng, duy trì và phát triển cơ sở dữ liệu quốc gia về khoa học và công nghệ được bảo đảm bằng ngân sách nhà nước dành cho khoa học và công nghệ (ngân sách trung ương, ngân sách địa phương) và huy động từ các nguồn kinh phí khác’.

Mọi thành phần trong xã hội có khả năng truy cập tới cơ sở dữ liệu. ‘Bảo đảm quyền của các tổ chức, cá nhân được tiếp cận, khai thác, sử dụng thông tin trong Cơ sở dữ liệu quốc gia về khoa học và công nghệ phù hợp với quy định của pháp luật.’

B. Hướng tới đáp ứng các yêu cầu của CMCN4

Để cơ sở dữ liệu quốc gia về khoa học và công nghệ trở thành MỞ và có khả năng tiệm cận được tới các yêu cầu mới của CMCN4, ngoài những điều đã được nêu trong thông tư, có lẽ những điều sau đây là những ưu tiên hàng đầu, cần thiết triển khai thực hiện càng sớm có thể càng tốt để dữ liệu không chỉ dành cho con người đọc/hiểu, mà còn cho máy đọc/hiểu được. Vì lý do này, cần thiết:

1- Đưa ra/Xây dựng và/hoặc thừa nhận các nguyên tắc dữ liệu tìm kiếm được, truy cập được, tương hợp được và sử dụng lại được – FAIR (Findable, Accessible, Interoperable, Re-usable). Đây là các nguyên tắc đã được các bộ trưởng khoa học các quốc gia G7 thống nhất và đã và đang được triển khai tại châu Âu dưới cái ô của Khoa học Mở và Dữ liệu Mở.

2- Đưa ra/Xây dựng chính sách chung cho nội dung, nhấn mạnh tới việc tuân thủ các tiêu chuẩn mở quốc tế và mã nhận diện vĩnh viễn được thừa nhận cho việc truy cập và sử dụng lại dữ liệu; việc loại bỏ bản ghi khỏi cơ sở dữ liệu; và sự trường tồn của dữ liệu.

Cả 2 nội dung được nêu ở đây đều là các yêu cầu cơ bản được áp dụng cho các dữ liệu của các dự án được nhà nước cấp vốn ở châu Âu hiện nay, ví dụ như trên trang Zenodo, một trang quản lý các dữ liệu, với hơn 90% là các dữ liệu mở, của Ủy ban châu Âu mà Việt Nam rất nên học tập.

Cả 2 nội dung được nêu ở đây, nếu được thực hiện, thì không chỉ có khả năng áp dụng cho cơ sở dữ liệu quốc gia về khoa học mở, mà còn cho tất cả các cơ sở dữ liệu nào muốn tiệm cận tới việc đáp ứng các yêu cầu của CMCN4. Còn với những gì được nêu như trong thông tư ở trên, cho dù được làm hoàn chỉnh và hoàn hảo, cũng chỉ thuần túy là nhập dữ liệu vào và truy xuất dữ liệu ra từ các cơ sở dữ liệu thành phần để phục vụ cho mục đích quản lý và sử dụng thông thường của con người, còn máy không có khả năng để đọc/hiểu được.

Trong khuôn khổ của một bài báo, là không thể nêu chi tiết nội dung 2 mục được nêu này. Hy vọng chúng sẽ được nêu cụ thể trong một bài báo khác.