Khi gắn TranscribeGlass lên cặp kính, người sử dụng sẽ nhìn thấy lời nói của người đối thoại được chuyển thành văn bản và chiếu trong tầm nhìn của họ theo thời gian thực.

Bước ngoặt cuộc đời

Vào năm học lớp 11, Madhav Lavakare đã buồn bã chia tay một người bạn phải nghỉ học vì mất thính lực, cậu bé ấy cảm thấy khó mà hiểu được lời giảng của giáo viên, cũng như chẳng nghe được bạn bè nói gì. Sự kiện này đã trở thành bước ngoặt trong cuộc đời cậu học sinh Ấn Độ, nung nấu trong cậu ước mơ chế tạo ra một thiết bị để giúp đỡ cho những người gặp khó khăn như bạn mình.

Lavakare bắt tay vào mày mò và nghiên cứu sản phẩm mà sau này anh đặt tên là TranscribeGlass – một thiết bị trợ thính có thể gắn vào bất kỳ cặp kính nào và chiếu phụ đề theo thời gian thực trong tầm nhìn của người dùng. Ban đầu, nó chỉ gồm phần chứa cắt từ mặt trước hộp đựng đĩa CD trong suốt, cùng bộ tách chùm tia hiệu quả để chiếu hình ảnh văn bản. Để có tiền nghiên cứu, Lavakare phát động một chiến dịch trên Ketto, nền tảng huy động vốn ở Ấn Độ, và nhận được tiền quyên góp từ bạn bè và gia đình. Số tiền nhỏ nhoi thu về không đủ để cậu tiếp tục ước mơ. Chẳng nản chí, Lavakare không ngừng đi xin tài trợ và nhận được khoản tiền 7.000 USD từ Pfizer, thông qua Quỹ tài trợ Khoa học và Công nghệ Hoa Kỳ-Ấn Độ, một chương trình đài thọ cho đổi mới công nghệ có tầm ảnh hưởng ở cả hai quốc gia. Cậu vẫn theo đuổi dự án này kể cả khi trở thành sinh viên ngành khoa học máy tính tại Đại học Yale.

Bức tranh thị trường

Trên thực tế, công nghệ hỗ trợ người khiếm thính đã có nhiều tiến bộ đáng kể trong những năm gần đây. Họ có thể chọn lựa giữa nhiều biện pháp như sử dụng máy trợ thính, cấy ốc tai điện tử, ghép tai giữa, phần mềm cung cấp phụ đề hay chú thích, cũng như nhiều thiết bị cảnh báo hay viễn thông. Tuy nhiên, biện pháp nào cũng có những thiếu sót và hạn chế riêng.

Chẳng hạn, máy trợ thính không hoạt động hiệu quả trong những tình huống có nhiều tiếng ồn xung quanh hoặc nhiều người nói chuyện cùng lúc. Hơn nữa, chi phí của một số thiết bị rất đắt đỏ. Ví dụ, để mua một máy trợ thính tốt người dùng sẽ cần bỏ ra hàng chục triệu đồng, còn nếu lựa chọn phương án cấy ốc tai điện tử thì con số này sẽ lên tới đơn vị trăm triệu.

Thiết bị hỗ trợ cung cấp chú thích theo thời gian thực cũng đã xuất hiện trên thị trường. Đây là một phương tiện giao tiếp quan trọng dành cho người khiếm thính. Theo một cuộc khảo sát năm 2013 do Collaborative for Communication Access via Captioning thực hiện, 70% trong số 220 người được hỏi “cảm thấy hòa nhập, ít căng thẳng hơn do mất thính lực và có nhiều khả năng tham gia hơn khi họ có phụ đề”. Chúng xuất hiện dưới dạng kính thông minh, hay thiết bị đính kèm yêu cầu người sử dụng mang theo micro, đòi hỏi người đối thoại nói vào micro hay điện thoại thông minh. Và dĩ nhiên, giá của nó cũng không hề rẻ. Chẳng hạn, một chiếc kính phiên âm của Công ty XRAI và Xander có giá 4.999 USD (gần 125 triệu VND). Trong khi đó, phần mềm phụ đề trên điện thoại di động tuy cho phép người dùng hiểu được đối phương nói gì, nhưng lại tước mất khả năng nhìn thấy nét mặt, đọc môi và các tín hiệu giao tiếp phi ngôn ngữ khác từ người nói, khi họ buộc phải dán mắt vào màn hình điện thoại.

TranscribeGlass giúp người khiếm thính giao tiếp hiệu quả hơn. Nguồn: transcribeglass
TranscribeGlass giúp người khiếm thính giao tiếp hiệu quả hơn. Nguồn: transcribeglass

Khai phá tiềm năng

Quả thực, TranscribeGlass không phải là tiên phong trong dòng sản phẩm trợ thính, nhưng việc “sinh sau đẻ muộn” không khiến nó kém nổi bật so với thiết bị cùng loại. Như Tom Pritsky, lúc đó là sinh viên cao học về tin học y sinh tại Đại học Stanford, lần đầu biết tới TranscribeGlass vào năm 2021 đã nhận định thiết bị này sẽ làm nên cách mạng. Anh nói: “Thiết bị này cung cấp cho bạn thông tin quan trọng trong tầm nhìn. Đây là lần đầu tiên điều này dường như là một triển vọng rõ rệt. Không có công ty AR nào cố gắng làm điều này cho tôi cả”.

Nhận thấy tiềm năng của TranscribeGlass, Pritsky quyết định hợp tác với Lavakare để giúp phát triển thiết bị này thành một sản phẩm có thể đưa ra thị trường. Lý do khiến Pritsky kiên trì đeo đuổi việc hỗ trợ thính giác là vì bản thân anh là người khiếm thính. Từ khi lên ba, anh đã mất thính lực cả hai bên tai từ mức trung bình tới nặng.

Hai con người đồng chí hướng đã bắt tay với nhau để nghiên cứu và cuối cùng làm ra thành phẩm là thiết bị đính kèm AR có thể gắn vào bất kỳ cặp kính nào. Ứng dụng đính kèm TranscribeGlass chạy trên thiết bị di động, nó kết nối với nguồn phụ đề và chuyển phụ đề qua micro điện thoại hay micro Bluetooth sang phần cứng, sau đó chiếu văn bản trong tầm nhìn của người dùng. Văn bản sẽ xuất hiện ở khoảng cách do người dùng thiết lập – bất kỳ nơi đâu trong phạm vi từ 25cm cho tới hàng chục mét. Người dùng có thể lựa chọn dịch vụ phụ đề từ ứng dụng điện thoại, bao gồm Nhận dạng giọng nói tự động, phụ đề trực tiếp cho các sự kiện và cuộc họp, phụ đề cho phim tại rạp. Ứng dụng cũng cho phép người dùng điều chỉnh kích thước phông chữ, tốc độ chạy văn bản và nhièu tùy chọn khác như ngôn ngữ mặc định. Hiện tại, tiếng Anh là ngôn ngữ hỗ trợ chính và họ đang tiến hành mở rộng sang các ngôn ngữ khác trong tương lai gần.

Khoảng cách mà thiết bị thu được âm thanh tùy thuộc vào nguồn phát. Khi sử dụng micro Bluetooth làm nguồn âm thanh, khoảng cách sẽ bị giới hạn trong phạm vi của Bluetooth. Tuy nhiên, để có phạm vi rộng hơn, Pritsky cho biết: “Bạn có thể tích hợp với StreamText, một giải pháp phần mềm được thiết kế cho các hội nghị và địa điểm diễn thuyết”. TranscribeGlass đang sử dụng StreamText tại Stanford để thử nghiệm thí điểm. Và kết quả rất khả quan khi “người dùng có thể ngồi bất cứ đâu trong giảng đường, khoảng cách không là vấn đề vì nó truyền trực tiếp vào điện thoại thông qua ứng dụng của chúng tôi và kết nối Wi-Fi”.

TranscribeGlass chỉ nặng 15g, có thể sạc nhiều lần và dung lượng pin cho phép thiết bị hoạt động liên tục trong 8 giờ. Một điều đáng chú ý nữa của TranscribeGlass là giá cả phải chăng, với phiên bản beta có giá 55 USD (gần 1.400.000 VND), và dự kiến bán ra với giá khoảng 95 USD (gần 2.400.000 VND).

Cho đến nay, TranscribeGlass đã có năm nguyên mẫu, hơn 300 người dùng có cơ hội thử sản phẩm, và danh sách chờ hẵng còn rất dài. Để đẩy nhanh tiến độ ra mắt thị trường, cha đẻ của TranscribeGlass không dán nhãn nó là thiết bị y tế mà là sản phẩm công nghệ. Bởi trung bình để một thiết bị y tế được FDA chấp thuận và ra được thị trường phải mất 3 – 7 năm.

Giảng viên và nhà nghiên cứu điện toán tiếp cận Raja Kushalnagar tại Đại học Gallaudet rất ấn tượng trước thiết bị này. Ông nhận xét: “TranscribeGlass sẽ mang lại lợi ích cho người khiếm thính, giúp họ có thể đọc được những gì nghe nhầm hay bỏ sót, nhất là khi có tiếng ồn xung quanh, tiếng nhạc hoặc người nói nặng tiếng địa phương. Nó cũng giúp người khiếm thính không thể theo dõi được lời nói bằng cách cung cấp bản ghi chép, cộng với âm thanh xung quanh để nâng cao nhận thức về môi trường”.

Là người thường xuyên sử dụng thiết bị này, Pritsky tin rằng việc đọc chú thích chỉ có vài từ được nói cũng có thể giúp người dùng lấp đầy khoảng trống và “tham gia tốt hơn trong cuộc hội thoại”.

Nguồn: smithsonianmag.com, peninsulapress.com

Bài đăng số 1288 (số 16/2024) KH&PT