Nguồn thông tin quý mà Cục Thông tin KH&CN quốc gia (Bộ KH&CN) đang xây dựng và quản lý sẽ là cơ sở để các nhà khoa học Việt Nam ở các trường đại học và viện nghiên cứu trên cả nước sử dụng và khai thác hiệu quả trong hoạt động nghiên cứu cũng như đào tạo.

Xây dựng cơ sở dữ liệu quốc gia góp phần tránh trùng lặp, chồng chép đề tài, dự án
Xây dựng cơ sở dữ liệu quốc gia góp phần tránh trùng lặp, chồng chép đề tài, dự án

“Kho tri thức” KH&CN hỗ trợ nghiên cứu

Trong cuộc hội thảo “Bảo đảm thông tin KH&CN phục vụ nghiên cứu và đào tạo tại Việt Nam” diễn ra vào ngày 12/11/2019, tại Hà Nội, TS. Trần Đắc Hiến, Cục trưởng Cục Thông tin KH&CN quốc gia (NASATI) đã nhấn mạnh đến những nỗ lực của đơn vị mình khi xây dựng và vận hành nguồn tin KH&CN quốc gia nhằm đảm bảo dữ liệu luôn đạt “ngưỡng an toàn” cho các nhà khoa học có thể truy cập thuận tiện và dễ dàng. Với thế mạnh là một cơ sở dữ liệu về KH&CN lớn bậc nhất Việt Nam, nơi đây sở hữu một lượng thông tin phong phú và đa dạng gồm hơn 34.000 bài viết ở dạng toàn văn, các đề tài dự án, kết quả nghiên cứu; 260.000 bài báo, công bố kết quả nghiên cứu khoa học trong nước.

Bên cạnh đó, hằng năm NASATI còn mua quyền truy cập tới các cơ sở dữ liệu khoa học quốc tế uy tín và có giá trị học thuật như ScienceDirect, Springer Nature, IEEE, ACS, Scopus, ISI-Web of Science… với đường kết nối quốc tế tốc độ cao, dung lượng 1 Gbps dành riêng cho cộng đồng nghiên cứu. Do đó, khi được cấp các tài khoản truy cập vào kho dữ liệu này, các nhà khoa học và giảng viên các trường đại học sẽ có điều kiện tra cứu thông tin cần thiết về các bài báo đăng tải trên các tạp chí trong nước, những đề tài cấp bộ và cấp quốc gia cũng như bài báo trên các tạp chí quốc tế thuộc những lĩnh vực mình quan tâm nghiên cứu.

Đây là một nguồn thông tin đáng quý và thiết thực cho các nhà khoa học, không chỉ giúp họ cập nhật được tình hình nghiên cứu quốc tế mà còn biết được những đề tài và dự án trong nước nào đã được thực hiện để tránh trùng lặp, chồng chéo đề tài. Trong nhiều buổi làm việc với Bộ KH&CN và Viện Hàn lâm KH&CN Việt Nam, Phó Thủ tướng Vũ Đức Đam từng nhấn mạnh đến ý nghĩa của công tác thông tin tư liệu trong việc tránh xảy ra tình trạng trùng lặp đề tài trong nghiên cứu cũng quan trọng như việc công khai minh bạch quá trình thẩm định, bỏ phiếu kết quả đề tài. Ví dụ tham dự cuộc đối thoại của Bộ trưởng Bộ KH&CN Chu Ngọc Anh với các nhà khoa học vào sáng 11/4/2018, Phó Thủ tướng Vũ Đức Đam cho rằng, cần kết nối các cơ sở dữ liệu khoa học trong nước và thế giới để các nhà khoa học Việt Nam không mất thời gian, công sức giải quyết những vấn đề mà trong nước hoặc quốc tế đã từng nghiên cứu, hoặc nếu nghiên cứu tiếp thì xác định được những góc độ nghiên cứu, hướng nghiên cứu khác. “Chỉ cần công khai nhiều đề tài ở cấp cơ sở lên sẽ thấy ngay có những đề tài trùng nhau”, ông lưu ý.

Trong bối cảnh nguồn lực đầu tư cho KH&CN của Việt Nam còn hạn chế thì việc tránh xảy ra đề tài trùng lặp sẽ góp phần giảm bớt lãng phí ngân sách, tạp điều kiện tập trung kinh phí vào những đề tài thiết thực, có thể giúp giải quyết những vấn đề cấp thiết ở cấp địa phương, quốc gia hoặc nâng cao năng lực nghiên cứu của nhà khoa học. Do đó, việc có được kho dữ liệu như ở NASATI thực sự hữu ích cho cộng đồng khoa học cũng như các nhà quản lý khoa học.

Nhiều đổi mới trong xây dựng cơ sở dữ liệu

Việc xây dựng cơ sở dữ liệu KH&CN đã được NASATI tiến hành từ năm 1987 với hai mảng dữ liệu chính là nhiệm vụ KH&CN và công bố KH&CN Việt Nam. Tuy nhiên trong thời gian gần đây, kho dữ liệu này mới được dần hoàn thiện với nhiều nét đổi mới thông qua việc thực hiện dự án “Hoàn thiện hệ thống thống kê, đánh giá, đo lường KH&CN và đổi mới sáng tạo” (FIRST-NASATI), một phần trong Tiểu dự án có nội dung xây dựng CSDL quốc gia về KH&CN. Trong một buổi làm việc với báo KH&PT vào tháng 6/2018, TS. Trần Đắc Hiến đã kỳ vọng vào ba vấn đề ở nhiều quy mô và cấp độ khác nhau mà dự án có thể mang lại: thông tin từ cơ sở dữ liệu quốc gia về KH&CN trở thành nguồn thông tin chính thức để phục vụ công tác hoạch định chiến lược, chính sách, quản lý và điều hành hoạt động KH&CN của các bộ, ngành, địa phương; nguồn thông tin tham khảo chính thức và quan trọng phục vụ các tổ chức, cá nhân hoạt động KH&CN nói chung, nhất là hoạt động nghiên cứu khoa học và phát triển công nghệ, ứng dụng công nghệ; góp phần minh bạch hóa việc tài trợ công cho hoạt động nghiên cứu triển khai cũng như kết quả của hoạt động này, đồng thời chấm dứt tình trạng “đạo văn” trong nghiên cứu khoa học hoặc cho phép thực hiện những nhiệm vụ không có ý nghĩa lý luận và thực tiễn chủ yếu là để tạo công ăn việc làm, cải thiện đời sống cho cán bộ nghiên cứu, qua đó sẽ góp phần quan trọng để nâng cao chất lượng hoạt động R&D và tăng hiệu quả sử dụng ngân sách đầu tư cho KH&CN.

NASATI đã hình thành được cơ sở dữ liệu về nhiệm vụ KH&CN với trên 25.000 nhiệm vụ các cấp đã thực hiện; trên 4.000 nhiệm vụ đang thực hiện và khoảng 1.000 nhiệm vụ có kết quả được ứng dụng vào thực tiễn; CSDL về công bố KH&CN với trên 260.000 bài báo khoa học tập hợp từ 236 tạp chí KH&CN (chiếm khoảng 70% tổng số tạp chí KH&CN trong cả nước).

Đây cũng là quan điểm mà Bộ KH&CN thống nhất chỉ đạo NASATI trong quá trình đề xuất ý tưởng và thực hiện dự án. Do đó, trong cơ sở dữ liệu của NASATI, ngoài các nội dung thuần túy về KH&CN còn có cả những nội dung dữ liệu chuyên ngành của các đơn vị khác trực thuộc Bộ như Cục Sở hữu Trí tuệ, Tổng cục Tiêu chuẩn Đo lường Chất lượng, Cục Phát triển thị trường và doanh nghiệp KH&CN... Những người được cấp tài khoản truy cập vào cơ sở dữ liệu “một cửa” của NASATI sẽ có điều kiện tra cứu rất nhiều thông tin quý ở nhiều mảng hoạt động khác nhau mà không phải mất thời gian tra cứu ở một cơ sở dữ liệu khác ngoài NASATI.

Mặt khác, việc triển khai đổi mới trong xây dựng các cơ sở dữ liệu này cũng đem lại những tính năng mới như tính năng PlumX Metrics của CSDL ScienceDirect giúp tổng quan về cách thức mọi người tương tác với bài nghiên cứu trong môi trường trực tuyến với năm thước đo: Trích dẫn (Citation), Lượt sử dụng (Usage), Capture (như bookmark, đưa vào mục yêu thích), Mention: tính các hoạt động về của bài báo trên các phương tiện truyền thông, Truyền thông xã hội (Social Media): sự quảng bá của bài viết trên các trang mạng xã hội.

Với mục tiêu hỗ trợ công việc quản lý khoa học và công việc nghiên cứu – đào tạo, NASATI đặt kỳ vọng những nét đổi mới trong xây dựng và quản lý cơ sở dữ liệu quốc gia sẽ được cộng đồng khoa học đón nhận. TS. Trần Đắc Hiến mong muốn các nhà khoa học tham dự Hội thảo sẽ là những hạt nhân nòng cốt để giới thiệu về cơ sở dữ liệu mới tới các cộng đồng nghiên cứu và cùng với NASATI phát triển, khai thác hiệu quả nguồn tin khoa học này.

Không chỉ hữu ích với các nhà khoa học ở các trung tâm lớn, những nhà nghiên cứu và các nhà quản lý ở các địa phương cũng sẽ thấy lợi ích của cơ sở dữ liệu quốc gia này. Trong một buổi làm việc với Sở KH&CN Lâm Đồng, giám đốc Võ Thị Hảo từng đề cập đến vấn đề này và cho biết, Sở cũng phải có một dữ liệu “riêng” để kiểm tra, tránh trường hợp thực hiện dự án và đề tài mà nhiều nơi đã từng làm. Nay với kho dữ liệu của NASATI, không chỉ Lâm Đồng mà cả các địa phương khác trong cả nước đều có thể dễ dàng tìm hiểu và xác định được đề tài mà tới đây mình sẽ xét chọn và phê duyệt cấp kinh phí triển khai có thực sự mới hay không.