Ngày càng có nhiều trường đại học Việt Nam quan tâm đến đào tạo nhân lực cho ngành Khoa học dữ liệu. Nhưng thực tế dường như đang đòi hỏi hơn thế đối với công tác đào tạo nhân lực cho một ngành được coi là công cụ chính để thực hiện công cuộc chuyển đổi số.

Chương trình cử nhân Khoa học dữ liệu và Trí tuệ nhân tạo ở Viện Công nghệ thông tin và Truyền thông, ĐH Bách khoa Hà Nội, tuyển sinh lần đầu vào năm ngoái, với 40 sinh viên được tuyển từ khoảng 900 hồ sơ đăng ký. Ảnh: HUST
Chương trình cử nhân Khoa học dữ liệu và Trí tuệ nhân tạo ở Viện Công nghệ thông tin và Truyền thông, ĐH Bách khoa Hà Nội, tuyển sinh lần đầu vào năm ngoái, với 40 sinh viên được tuyển từ khoảng 900 hồ sơ đăng ký. Ảnh: HUST

Tự tin trong cuộc đua Khoa học dữ liệu, tại sao không?

Ngày nay, hầu hết mọi thực thể đều có xu hướng được số hóa, dẫn đến lượng dữ liệu (tồn tại dưới nhiều dạng cấu trúc khác nhau như số liệu, văn bản, hình ảnh, âm thanh) được sản sinh trở nên khổng lồ. Trình độ quản trị và phân tích dữ liệu để tìm ra tri thức mới - hay chính là trình độ về khoa học dữ liệu - sẽ quyết định việc phát triển thành công những sản phẩm, dịch vụ thông minh như phân tích hình ảnh y tế, nền tảng mua sắm trực tuyến, xe tự hành, dịch máy, nhận diện mặt…

Phát biểu tại một buổi tọa đàm mới đây, GS Vũ Hà Văn – Giám đốc Khoa học tại Viện Nghiên cứu Dữ liệu lớn VinBDI thuộc tập đoàn Vingroup - nói, tuy chúng ta “đã nhiều lần có cảm giác lỡ tàu trong các cuộc đua công nghệ”, nhưng riêng ở lĩnh vực Khoa học dữ liệu, chúng ta có hy vọng bước được vào cuộc đua của thế giới vì đã có sẵn nguồn tài nguyên dữ liệu dồi dào.

Ông dẫn chứng, Viện VinBDI đã làm ra một số sản phẩm như nhận diện tiếng nói hay ứng dụng AI trong phân tích hình ảnh y tế “không thua kém sản phẩm của các tập đoàn lớn như Samsung hay Google, thậm chí còn tốt hơn”. Theo GS Văn, với những sản phẩm dựa trên dữ liệu tự có như nhận diện tiếng nói của người Việt thì chúng ta hoàn toàn có khả năng làm tốt hơn nước ngoài vì sản phẩm, chẳng hạn của Google, chỉ tập trung vào tiếng Anh và một số ngôn ngữ lớn khác. “Nếu chúng ta sử dụng nguồn tài nguyên của mình để đào tạo lớp trí thức mới, lớp lao động chất lượng cao mới thì không có lý do gì phải đi mua sản phẩm của nước ngoài với giá rất đắt,” ông nói và nhấn mạnh, “Trong cuộc đua này, yếu tố quan trọng nhất là con người được đào tạo đủ tốt”.

Kể từ khi Trường ĐH Khoa học tự nhiên, ĐH Quốc gia Hà Nội, mở khóa đào tạo thạc sĩ Khoa học dữ liệu đầu tiên ở Việt Nam cách đây 3 năm, đến nay, chúng ta đã có thêm hơn một chục chương trình đào tạo thạc sĩ và cử nhân Khoa học dữ liệu khác; đặc biệt, bắt đầu xuất hiện những chương trình đào tạo Khoa học dữ liệu trong lĩnh vực cụ thể như Khoa học dữ liệu trong kinh tế và kinh doanh ở Trường ĐH Kinh tế Quốc dân hay Phân tích dữ liệu Kinh doanh ở Khoa Quốc tế, ĐH Quốc gia Hà Nội, ...

Bản thân Trường ĐH Khoa học tự nhiên cũng vừa mở chương trình đào tạo cử nhân Khoa học dữ liệu và dự kiến tuyển 50 sinh viên cho khóa đầu vào tháng 9 tới. TS Đỗ Thanh Hà, Phó trưởng khoa Toán - Cơ - Tin học và trưởng bộ môn Tin học, cho biết, theo khung chương trình, sinh viên sẽ được cung cấp các kiến thức nền tảng về khai phá dữ liệu để sau khi tốt nghiệp có thể đi làm ngay. Ngoài lý thuyết cơ bản đủ rộng, chương trình còn liên kết với các khoa khác trong trường có thế mạnh về dữ liệu như Hóa, Môi trường, Địa chất… để bảo đảm sinh viên không phải “học gạo” mà được thực hành, làm bài tập ngay trên những tập dữ liệu đủ sâu và thực tế. Từ năm thứ hai, các em sẽ đi thực tập tại doanh nghiệp để làm quen dần với việc giải các bài toán thật liên quan đến dữ liệu.

Gắn với thực tế chính là nét đặc thù lớn nhất của Khoa học dữ liệu. Theo GS Hồ Tú Bảo - Giám đốc Phòng thí nghiệm Khoa học Dữ liệu thuộc Viện Nghiên cứu cao cấp về Toán và Giám đốc Khoa học tại Viện John von Neumann thuộc ĐH Quốc gia TPHCM - người học nên “dành nửa thời gian làm việc trên máy tính với các tập dữ liệu cụ thể để hiểu được nếu tính theo vector riêng, giá trị riêng thì dữ liệu gắn với ý nghĩa thực tế gì.”

Câu chuyện của mọi người, mọi nghề

Do hoạt động sản xuất ngày càng được điều hành và quyết định một cách thông minh từ không gian số, nên tới đây, hầu hết những người lao động phải rèn luyện kỹ năng hiểu về các con số, nói cách khác là kỹ năng phân tích và sử dụng dữ liệu, vốn được hình thành từ ba nguồn tri thức: toán học, công nghệ thông tin và tri thức của lĩnh vực ứng dụng cụ thể.

Khoa học dữ liệu là câu chuyện của mọi người, mọi nghề ở nhiều mức khác nhau, trong đó một số ít người làm công việc tạo ra các hệ thống xử lý dữ liệu (nền tảng, ứng dụng, web…) để cho số đông người khác sử dụng - GS Bảo nói.

Như vậy, chỉ đào tạo cử nhân, thạc sĩ, tiến sĩ ngành Khoa học dữ liệu hay những ngành gần với nó như Toán, Khoa học máy tính, Kỹ thuật máy tính, Khoa học thông tin... không thôi là chưa đủ - GS Bảo nhận định. Một số kiến thức cơ bản về xác suất, thống kê, tin học, và đặc biệt là ý thức sử dụng dữ liệu trong việc ra các quyết định dẫn dắt hành động, cần được truyền đạt rộng rãi ở bậc học phổ thông và học nghề. Các ngành nghề đại học khác cũng cần được đào tạo về Khoa học dữ liệu; trong khi những người đang làm việc cần các khóa học cấp chứng chỉ, đào tạo lại hoặc đào tạo nâng cao.

Đây là công việc đòi hỏi sự vào cuộc của Bộ Giáo dục và Đào tạo và Bộ Lao động - Thương binh và Xã hội dưới sự điều hành của Nhà nước, ông nhấn mạnh. “Tuy nhiên, bây giờ có lẽ chúng ta mới đang ở giai đoạn đầu tiên, nói để cho mọi người nhận thức được đã, rằng Khoa học dữ liệu chính là công cụ lao động thời đại số.”

Trong bối cảnh đó, sự tham gia chủ động của các doanh nghiệp thời gian gần đây rất đáng được ghi nhận. Chẳng hạn, Công ty cổ phần Giải pháp phần mềm tài chính FSS cam kết cung cấp dữ liệu cho chương trình đào tạo của Trường ĐH Khoa học tự nhiên; hay IBM tài trợ một số platform bao gồm cả dữ liệu mẫu cho chương trình đào tạo của ĐH Bách khoa Hà Nội.

Mới đây nhất, Quỹ Đổi mới sáng tạo VinIF (thuộc Viện VinBDI) đã tài trợ gói 2 tỷ đồng/năm và tối đa trong ba năm cho mỗi chương trình đào tạo thạc sĩ Khoa học dữ liệu ở 5 trường đại học/viện nghiên cứu, bao gồm: Trường ĐH Quy Nhơn, Trường ĐH Bách khoa Hà Nội, Viện Toán học - Viện Hàn lâm KH&CN Việt Nam, Viện John von Neumann - ĐH Quốc gia TPHCM, và Trường ĐH Khoa học Tự nhiên - Đại học Quốc gia Hà Nội. Mục đích của hợp tác này nhằm góp phần đưa các chương trình đào tạo thạc sĩ Khoa học dữ liệu trong nước tiến tới đạt trình độ quốc tế. Bản thân Quỹ VinIF cũng có một chương trình đào tạo từ 6 tháng đến 1 năm dành cho sinh viên năm cuối hoặc mới tốt nghiệp có định hướng theo đuổi ngành Khoa học dữ liệu nhưng không muốn học lên thạc sĩ. Trong thời gian đó, họ được đào tạo những kiến thức toán học hoặc lập trình cần thiết và có cơ hội làm việc trong các nhóm chế tạo sản phẩm thật chứ không phải sản phẩm prototype ở Viện VinBDI. Người học được trả lương từ khoảng 7 đến 20 triệu đồng/tháng và không bị ràng buộc bởi cam kết nào cả.