Tại sao khoa học mở, truy cập mở, dữ liệu mở, và tài nguyên giáo dục mở lại cần thiết để Việt Nam có thể nâng cao năng lực tiếp cận trong cuộc CMCN4.0?
Với Việt Nam bây giờ và có lẽ trong vài thập kỷ tới, câu hỏi lớn được đặt ra: Làm thế nào để đổi mới sáng tạo khi mà nhân lực, vật lực và tiền bạc đều rất ít và rất hiếm?
Vô số các ví dụ ở các quốc gia như Mỹ và châu Âu hiện nay, những nơi đang phất cao ngọn cờ khoa học mở, truy cập mở, giáo dục mở và dữ liệu mở, có lẽ là tấm gương sáng để Việt Nam nhận thức ra được con đường tất yếu phải đi nếu thực sự Việt Nam muốn tiếp cận và làm được gì đó trong cuộc CMCN4.0.
Khoa học mởĐịnh nghĩa khoa học mở2: Khoa học Mở (Open Science) là thực hành khoa học theo cách thức sao cho những người khác có thể cộng tác và đóng góp, nơi mà các dữ liệu nghiên cứu, các ghi chép trong phòng thí nghiệm và các quy trình nghiên cứu khác là sẵn sàng tự do, theo các điều khoản cho phép sử dụng lại, phân phối lại và tái tạo lại nghiên cứu đó và các dữ liệu và phương pháp nằm bên dưới của nó.
Tuy nhiên, ở Việt Nam hiện tại, không khó để thấy rằng, các tài liệu và dữ liệu khoa học là kết quả của các nghiên cứu khoa học, nhất là các nghiên cứu khoa học được nhà nước cấp tiền, hầu hết, nếu không muốn nói là tất cả, chưa mang/với tới được các tiêu chuẩn của bất kỳ đặc tính nào của khoa học mở như: (1) Khả năng tìm kiếm, phát hiện ra được (Findable) trên Internet; (2) Truy cập được (Accessible) trên/qua Internet; (3) Tương hợp được (Interoperable) - khả năng trao đổi và pha trộn thông tin và/hoặc dữ liệu với nhau nhờ sử dụng các tiêu chuẩn mở; (4) Sử dụng lại được (Re-usable); (5) Lần vết được (Traceable), ví dụ trích dẫn từ đâu, có rõ ràng và minh bạch hay không, có ‘đạo văn’ hay không?; (6) Được cấp phép mở (Licensed), ví dụ như Creative Commons; (7) Được kết nốli với nhau (Connected).
Truy cập mởUNESCO định nghĩa truy cập mở (http://en.unesco.org/open-access/what-open-access) như sau: “Truy cập mở tới tư liệu ngụ ý tính sẵn sàng tự do trên Internet công khai, cho phép bất kỳ người sử dụng nào để đọc, tải về, sao chép, phân phối, in, tìm kiếm, hoặc liên kết tới toàn văn các bài báo đó, đi sâu vào chúng để đánh chỉ mục, truyền chúng như là dữ liệu tới phần mềm, hoặc sử dụng chúng vì bất kỳ mục đích hợp pháp nào khác, mà không có các rào cản về tài chính, pháp lý hoặc kỹ thuật ngoại trừ những rào cản gắn liền với sự truy cập tới bản thân Internet”.
Triết lý của truy cập mở là để cung cấp sự truy cập miễn phí và không có rào cản tới nghiên cứu và các xuất bản phẩm của nó mà không có các hạn chế về bản quyền.
Để làm thỏa mãn những gì được nêu trong định nghĩa của truy cập mở, công việc cốt lõi là chuyển đổi hệ thống truyền thông nghiên cứu từ hệ thống người sử dụng trả tiền thành hệ thống truyền thông nghiên cứu tác giả trả tiền, đặc biệt đối với các nghiên cứu có sử dụng tiền từ nhà nước cấp (từ những người đóng thuế). Sự thay đổi này kéo theo sự thay đổi của quy trình xuất bản các kết quả nghiên cứu và mô hình kinh doanh của tất cả các bên tham gia đóng góp trong hệ thống truyền thông nghiên cứu, bao gồm cả các nhà nghiên cứu, các nhà xuất bản, các nhà cấp vốn nghiên cứu, các trường đại học/ các viện nghiên cứu và các thư viện, và xã hội học tập.
Đây là công việc rất khó, mất nhiều công sức và thời gian, vì cần phải làm hài hòa lợi ích của nhiều bên, trong khi các lợi ích của từng bên là khác nhau, đôi khi trái ngược nhau. Thực thể có khả năng nhất để kết nối để làm hài hòa hóa các lợi ích của các bên chính là nhà nước - thực thể thay mặt cho những người dân đóng thuế.
Có thể dễ dàng để thấy, các dạng truy cập mở là chưa tồn tại ở Việt Nam, trong khi nó là phổ biến hiện nay trên thế giới, với các chính sách truy cập mở ở nhiều mức, như ở mức nhóm các quốc gia, quốc gia, tổ chức quốc tế, trường đại học khắp nơi trên thế giới.
Dữ liệu mở và dữ liệu mở liên kếtDữ liệu mở (Open Data) được định nghĩa như sau: Dữ liệu mở là dữ liệu có thể được bất kỳ ai tự do sử dụng, sử dụng lại và phân phối lại - nhiều nhất, chỉ tuân thủ yêu cầu ghi công và chia sẻ tương tự. (http://opendatahandbook.org/guide/en/what-is-open-data/)
Dữ liệu mở liên kết là sự liên kết chỉ của các dữ liệu mở với nhau tạo thành.
Nếu sử dụng hệ thống giấy phép Creative Commons để cấp phép cho dữ liệu mở, thì chỉ có 3 loại giấy phép ở khoang trên cùng phần bên trái của Hình 3 là đáp ứng được định nghĩa của dữ liệu mở. Dữ liệu mở cũng có thể sử dụng các giấy phép mở tương đương với 3 giấy phép ở trên nhưng của các hệ thống giấy phép mở khác3.
Để có thể làm cho máy đọc/hiểu được và có được sự thông minh, kể cả ở mức cao nhất, từ năm 2006, nhà phát minh ra World Wide Web, ngài Tim - Berners Lee đã đưa ra (https://www.w3.org/DesignIssues/LinkedData.html) nguyên tắc 4 điểm và lược đồ tiêu chuẩn 5 sao của dữ liệu mở liên kết.
Với nguyên tắc 4 điểm, ông chỉ ra rằng, nếu như Internet trước đây là web của các tài liệu được liên kết với nhau, thì Internet của ngày nay là web của các dữ liệu được liên kết với nhau; nếu Internet của trước đây sử dụng bộ định vị tài nguyên thống nhất - URL (Uniform Resource Locator) để định vị tài nguyên thì Internet của ngày nay sử dụng mã nhận diện tài nguyên thống nhất - URI (Uniform Resource Identifier) để không chỉ con người, mà cả máy cũng có thể đọc/hiểu được và có thể không chỉ dừng lại ở mức biết được tri thức về tài nguyên được định vị như trước kia, mà quan trọng hơn nhiều, là để sinh ra được các tri thức mới.
Với lược đồ tiêu chuẩn 5 sao: Để có thể đạt tới mức 5 sao, dữ liệu cần phải tuân thủ một số yêu cầu nhất định:
* Mức 1 sao là thấp nhất, yêu cầu dữ liệu phải được cấp phép mở để trở thành dữ liệu mở, như được nêu ở phần định nghĩa dữ liệu mở ở trên, vì thế bất kỳ doanh nghiệp nào, đặc biệt là các doanh nghiệp khởi nghiệp, đều có thể sử dụng các dữ liệu mở đó để tạo ra các ứng dụng/dịch vụ được phép thương mại hóa. Ở Việt Nam hiện chưa ở đâu có các dữ liệu được cấp phép mở để đạt được mức 1 sao này.
* Mức 2 sao yêu cầu dữ liệu phải đạt được mức 1 sao cộng thêm yêu cầu dữ liệu đó phải có cấu trúc để máy còn có khả năng đọc được.
* Mức 3 sao yêu cầu dữ liệu phải đạt được mức 2 sao cộng thêm yêu cầu dữ liệu phải ở định dạng mở (tiêu chuẩn mở), điều rất khó cho Việt Nam đạt được, khi mà thực tế hiện nay trong các cơ quan nhà nước và trong giáo dục, hầu như chỉ sử dụng các định dạng và tiêu chuẩn đóng, từ một nhà cung cấp độc quyền duy nhất.
* Mức 4 sao yêu cầu dữ liệu phải đạt được mức 3 sao cộng thêm yêu cầu dữ liệu đi với URI cho các các đối tượng hữu hình và/hoặc vô hình. Điều này đòi hỏi Việt Nam phải xây dựng kho từ vựng tiêu chuẩn để dựa vào đó xây dựng các bộ mã URI cho Việt Nam, ví dụ như các bộ từ vựng được chuẩn hóa để làm URI của Eurovoc (http://eurovoc.europa. eu/) của châu Âu, hay tìm hiểu cách tham gia sử dụng các hệ thống mã khác của thế giới, như ORCID (https://orcid.org/) để cấp mã nhận diện cho từng nhà nghiên cứu hiện nay, hay mã nhận diện đối tượng số DOI (https://www.doi.org/) cho các bài báo hay dữ liệu nghiên cứu... Lưu ý là ở Việt Nam hiện nay còn chưa xây dựng xong hệ thống mã nhận diện các tỉnh, thành phố để sử dụng trong hệ thống chính phủ điện tử. Vì vậy, có khả năng Việt Nam sẽ phải cần nhiều năm để xây dựng được hệ thống mã dạng như của Eurovoc.
*Mức 5 sao yêu cầu dữ liệu phải đạt được mức 4 sao cộng thêm yêu cầu dữ liệu phải được kết nối theo nghĩa toàn cầu. Việt Nam bây giờ, dữ liệu còn chưa có, các cơ sở dữ liệu quốc gia vẫn ở giai đoạn chuẩn bị làm và/hoặc đang làm như từ thời kỳ IT-2000 của những năm 1996-2000, chưa thể nói gì tới việc kết nối toàn cầu.
Nếu đi theo tiếp cận dữ liệu mở, thì bạn thu được các ứng dụng thông minh, còn nếu đi theo tiếp cận dữ liệu mở liên kết, thì ngoài các ứng dụng thông minh ra, bạn còn có khả năng có được các sản phẩm thông minh và các hệ thống thông minh.
Tài nguyên giáo dục được cấp phép mở / Tài nguyên giáo dục mở (OER)
Bộ Giáo dục Mỹ (https://tech.ed.gov/open/) định nghĩa tài nguyên giáo dục được cấp phép mở (hay tài nguyên giáo dục mở - Open Educational Resource, viết tắt là OER) là các tài nguyên học tập, giảng dạy, và nghiên cứu nằm trong phạm vi công cộng hoặc đã được phát hành theo giấy phép cho phép tự do sử dụng, sử dụng lại, sửa đổi và chia sẻ chúng với những người khác. Các tài nguyên số được cấp phép mở có thể gồm các khóa học đầy đủ trên trực tuyến, các sách giáo khoa số theo module cũng như các tài nguyên khác như các hình ảnh, video và các hạng mục đánh giá.
Khác với dữ liệu mở, tài nguyên giáo dục mở có thể được gán bất kỳ giấy phép Creative Commons nào như phần bên trái của Hình 3 ở trên, và/hoặc bất kỳ giấy phép mở nào tương đương từ các hệ thống giấy phép mở khác với Creative Commons.
Theo thống kê của Creative Commons (https://stateof.creativecommons.org/), năm 2016, trên thế giới có 1 tỷ 200 triệu tư liệu được cấp phép mở Creative Commons, nghĩa là từng công dân Việt Nam, nếu có đủ các kỹ năng và khả năng, đều có thể khai thác và sử dụng được hàng tỷ tư liệu được cấp phép mở nêu trên, mà không vi phạm các luật bản quyền.
Một câu hỏi lớn cho giáo dục Việt Nam là: ở đâu đang sản xuất và tiêu dùng OER ở Việt Nam?, bằng tiếng Việt hay tiếng nước ngoài. Trong khi đó, tại nước Mỹ, có các trang web về OER cho cả bậc đại học như MERLOT (https://www.merlot.org/merlot/index.htm), cũng như giáo dục phổ thông 12 lớp như CK-12 (https://www.ck12.org/) cung cấp nội dung OER, kể cả bằng tiếng Việt. Điều đó có nghĩa là, từ giờ trở đi, mọi học sinh phổ thông và sinh viên đại học của Việt Nam hoàn toàn có khả năng ngồi ở Việt Nam và học các sách giáo khoa và các nội dung giáo dục của nước Mỹ bằng tiếng Việt mà không mất đồng xu nào ngoài việc phải có kết nối Internet. Không rõ, các giáo viên và các cơ sở giáo dục của Việt Nam rồi sẽ ra sao khi việc sử dụng đó trở nên dễ dàng, thuận tiện và phổ cập hơn?
Lời kết
Với những gì được nêu sơ lược ở trên về một vài thành phần của khoa học mở, có thể nói ngắn gọn rằng, để có thể tiếp cận được CMCN4.0, trước hết cần phải có tri thức! Với nguyên tắc cộng lực của “NGUỒN MỞ”, thì đi với “NGUỒN MỞ” là cách để vừa có được nhiều tri thức nhất với giá thành thấp nhất và số lượng người tham gia truy cập tới tri thức lớn nhất và không có giới hạn, vừa phù hợp với xu thế phát triển của thế giới!
Trên tinh thần đó, một vài gợi ý cho Việt Nam như sau:
* Việt Nam cần một thế hệ trẻ các nhà khoa học có định hướng khoa học mở.
* Việt Nam cần hệ thống chính sách để khoa học mở/truy cập mở/giáo dục mở - tài nguyên giáo dục được cấp phép mở/dữ liệu mở phát triển.
* Việt Nam cần các hệ thống thư viện số, mở, kết nối được với nhau theo các tiêu chuẩn mở quốc tế với lực lượng các thủ thư thế hệ mới với đủ các kỹ năng và khả năng để quản lý toàn bộ vòng đời dữ liệu nghiên cứu.
* Việt Nam thời gian tới cần tập trung vào xây dựng các cơ sở hạ tầng phục vụ cho CMCN4.0 theo cách thức của khoa học mở, từng bước một để với tới được đầy đủ các đặc tính FAIR+TLC, bao gồm: (1) Các hệ thống cơ sở dữ liệu quốc gia và khác; (2) Các hệ thống mã nhận diện duy nhất, phù hợp với các tiêu chuẩn quốc tế.
* Việt Nam cần bỏ hoàn toàn giáo dục CNTT phụ thuộc vào một nhà cung cấp nguồn đóng độc quyền từ bậc tiểu học, để tránh sau này tạo gánh nặng cho việc chuyển đổi các dữ liệu từ đóng sang mở để đạt được mức 3 sao theo lược đồ tiêu chuẩn 5 sao về dữ liệu mở liên kết của Tim - Berners Lee, một công việc được biết trước, vừa tốn công, tốn sức, tốn tiền và tốn thời gian một cách vô ích. Trong khi, đối với các học sinh bậc tiểu học, thầy cô giáo dạy cái gì thì cái đó nhiều khả năng sẽ trở thành thói quen đi với chúng suốt cuộc đời. Mặt khác, đừng để trẻ em Việt Nam được giáo dục về CNTT để trở thành công dân của quốc gia là thuộc địa số của một công ty4 nguồn đóng độc quyền nào!!!
* Các nhà khoa học trẻ Việt Nam có quan tâm tới khoa học mở có thể tìm thấy cơ hội cho mình tại châu Âu ngay lúc này, với hy vọng là lực lượng đó sau này có thể giúp cho Việt Nam tiếp cận và làm được gì đó đúng với các yêu cầu của CMCN4.0, biết rằng, trong vòng 10 năm tới, châu Âu thiếu nửa triệu nhân viên dữ liệu cốt lõi5, một triệu nhà nghiên cứu khoa học6 để hiện thực hóa được ‘Đám mây khoa học mở châu Âu’.