Đó là nền tảng chuyển đổi giọng nói thành văn bản VAIS và nền tảng chuyển đổi văn bản thành giọng nói Vbee hoàn toàn do các kỹ sư Việt Nam xây dựng.

Chiều 19/6, Bộ Thông tin và Truyền thông (Bộ TT&TT) đã tổ chức ra mắt nền tảng công nghệ xử lý giọng nói tiếng Việt ứng dụng trí tuệ nhân tạo VAIS và Vbee.

Phát biểu tại lễ ra mắt, Thứ trưởng Bộ TT&TT Nguyễn Thành Hưng cho biết: “VAIS và Vbee là hai nền tảng số “Make in Việt Nam” được Bộ TT&TT lựa chọn giới thiệu và bảo trợ về truyền thông trong khuôn khổ Chương trình chuyển đổi số quốc gia”.

Trong đó, VAIS hiện đã được nhiều cơ quan nhà nước ở Trung ương và địa phương sử dụng như Văn phòng Trung ương Đảng, Văn phòng Chính phủ, Văn phòng Quốc hội, Bộ TT&TT, UBND TP. Hà Nội, cùng cùng hơn 50 đơn vị báo chí, truyền hình sử dụng, phục vụ gỡ băng các bài phát biểu tại nhiều kỳ họp, sự kiện.

Thứ trưởng Bộ TT&TT Nguyễn Thành Hưng phát biểu tại buổi lễ. Ảnh: GP
Thứ trưởng Bộ TT&TT Nguyễn Thành Hưng phát biểu tại buổi lễ. Ảnh: GP

Còn nền tảng Vbee hiện được 20.000 khách hàng cá nhân, hơn 500 doanh nghiệp, Tổng công ty sử dụng rộng rãi trong 3 lĩnh vực chính là Tổng đài tự động, giải pháp tương tác thiết bị thông minh nội dung số tự động.

Theo thông cáo báo chí của Bộ TT&TT, VAIS là nền tảng công nghệ lõi chuyển giọng nói tiếng Việt thành văn bản (Speech to Text) với những đặc trưng: Nhận dạng được đầy đủ giọng nói cả ba miền Bắc, Trung, Nam với độ chính xác lên đến 95%; Chuyển đổi giọng nói tiếng Việt thành văn bản với kết quả tức thì; Nhận dạng tốt trong môi trường nhiễu và ở khoảng cách xa. Nền tảng này cũng khả năng tính năng chuẩn hóa văn bản đầu ra: tên riêng, ngày, tháng, số…, hỗ trợ nhiều loại định dạng âm thanh đầu vào; Cung cấp giải pháp cho người dùng trực tiếp hoặc kết nối thông qua API tại: https://vais.vn/.

VAIS do Công ty TNHH Hệ thống trí thông minh nhân tạo Việt Nam nghiên cứu và tạo phát triển. Sản phẩm này từng 2 năm liên tiếp đạt giải Nhất cuộc thi Vietnamese Language & Speech Processing 2018/ 2019 với độ chính xác lên tới 95.2% ứng dụng cho việc gỡ băng khối Chính phủ và báo Chí/truyền hình cũng như đạt giải Nhất Nhân Tài Đất Việt 2019 với phần mềm chuyển giọng nói thành văn bản Origin-STT.

Giao diện của VAIS. Ảnh chụp màn hình.
Giao diện của VAIS. Ảnh chụp màn hình.

Được nghiên cứu và phát triển bởi Công ty CTCP Dịch vụ và Giải pháp xử lý dữ liệu Vbee, ĐH Bách Khoa Hà Nội, với 2 founder là TS Nguyễn Thị Thu Trang và ông Hồ Minh Đức, Vbee là nền tảng công nghệ lõi về giọng nói nhân tạo Việt có cảm xúc (chuyển đổi văn bản thành giọng nói trí tuệ nhân tạo tiếng Việt có cảm xúc – Text to Speech) tiên phong tại Việt Nam. Vbee có những đặc trưng sau: Có thể học theo bất kỳ giọng của một người nào đó trong vòng bốn giờ đồng hồ với độ tương tự trên 95%; Giọng nói Vbee đa dạng vùng miền (Bắc, Trung, Nam...), giới tính và độ tuổi.

Giao diện của Vbee
Giao diện của Vbee. Ảnh chụp màn hình.

Ngoài ra, công nghệ giọng nói nhân tạo Vbee có thể dự đoán cách đọc, các từ viết tắt, từ vay mượn, các từ ngữ đặc trưng của tiếng Việt mà các giải pháp nước ngoài không thể.

Vbee xây dựng thành công nền tảng Vbee cloud (https://www.vbee.vn), cho phép người sử dụng, doanh nghiệp, lập trình viên có thể sử dụng trực tiếp hoặc qua tích hợp (API) một cách dễ dàng và thuận tiện.

Hiện, Vbee đã đóng gói thành công giải pháp toàn diện trong các lĩnh vực sử dụng giọng nói nhân tạo của Vbee như: giải pháp về nội dung nhân tạo (sách nói, báo nói, lồng tiếng phim tự động, thu âm tự động…), giải pháp về tổng đài nhân tạo (vận tải, tài chính, thương mại điện tử…), giải pháp nhà thông minh (giao tiếp với thiết bị qua ngôn ngữ), giải pháp chatbot chăm sóc, tư vấn khách hàng.