Eagle Digital, một startup mới thành lập năm 2021, đang phát triển một mẫu kính thông minh đặc biệt có thể giúp người khiếm thị và những người suy giảm thị lực dễ dàng nhận biết tiền tệ, vật thể, đồng thời giúp hiểu được nội dung văn bản thông qua giọng nói.
“Ánh sáng” mới cho người khiếm thị
Với người khiếm thị, những công việc hằng ngày tưởng chừng đơn giản như phân loại đồ đạc, trả tiền khi mua hàng hay thậm chí là đi bộ ra đường một cách an toàn là thách thức không nhỏ. Vậy liệu công nghệ có thể đem lại cho họ một đôi mắt khác? Những suy nghĩ này chính là động lực để nhóm kỹ sư trẻ Phạm Huy (trường Đại học FPT Hà Nội) và Trình Quốc Huy (trường Đại học Khoa học Tự nhiên TP.HCM), phát triển.
Được đặt tên là Eagle Digital, chiếc kính thông minh này được gắn camera, chip xử lý và một tai nghe, nhờ đó có thể thu hình ảnh từ môi trường xung quanh, phân tích và chuyển chúng thành giọng nói nhắc nhở người dùng. Chiếc kính có thể đọc văn bản trên sách, mô tả môi trường xung quanh, chẳng hạn như xe cộ và cảnh báo trước khi họ ra quyết định.
Công nghệ lõi của chiếc kính này nằm ở việc tối ưu các thuật toán AI nhận dạng hình ảnh - thứ đang được sử dụng phổ biến trong một loạt ứng dụng camera thông minh và điện thoại di động. Nếu như các công ty công nghệ thường sử dụng việc nhận dạng hình ảnh cho mục đích xác thực hoặc quản lý thì các kỹ sư của Eagle Digital muốn dùng nó cho những tính năng mang tính nhân văn hơn.
“Ý tưởng sản phẩm này bắt đầu từ một thành viên của nhóm. Cậu ấy có một người bà bị suy giảm thị lực, do vậy đã tự mày mò làm một số phiên bản ban đầu để hỗ trợ việc đi lại cho bà của mình. Sau đó, cậu đề xuất dự án lên cả nhóm, và mọi người quyết định dồn lực vào phát triển sản phẩm này, vì Việt Nam có tỷ lệ người khiếm thị cao mà các thiết bị hỗ trợ cho họ hiện tại đang rất khó khăn”, Phạm Huy chia sẻ.
Tuy nhiên đây cũng không phải là ý tưởng quá mới mẻ. Trên thế giới, các hãng công nghệ lớn đã tung ra những loại kính dựa trên công nghệ trí tuệ nhân tạo (AI) của mình, nhưng với chi phí thường rất đắt, từ 1.500 – 2.000 USD.
“Thêm vào đó, chúng có thể không tương thích với một số tác vụ quan trọng của người bản địa như mô tả tiền tệ. Các app hiện có chưa hỗ trợ cho tiền Việt Nam. Chúng mới chỉ nhận diện được ‘có một tờ tiền’ mà không cho biết đó là tờ bao nhiêu hay liệu đấy có phải tiền giả hay không. Do vậy, nhóm chúng tôi tập trung khá nhiều vào tối ưu tiền tệ, biến chúng thành một hạng mục riêng để trong một chừng mực nhất định có thể giúp người khiếm thị tự chủ về mặt tài chính, tự tin làm những việc đơn giản như đi ra ngoài mua một ổ bánh mì”, Phạm Huy nói.
Bên cạnh nhận diện tiền tệ, chiếc kính này cũng có những tính năng căn bản như đọc văn bản, sách báo cho người dùng hoặc mô tả vật thể đối diện – ví dụ như “trước mặt là một người phụ nữ, tầm 30 tuổi” hoặc “có một chiếc xe ô tô màu đen đang tới”. Các kỹ sư của Eagle Digital cho biết chiếc kính sẽ có độ ưu tiên về vật thể, theo thứ tự là con người, một số đồ vật gần gũi, xe cộ, biển báo,…
Hiện tại mức độ chính xác hình ảnh đã đạt từ 84-95%, tuy nhiên nhóm nghiên cứu vẫn muốn làm tốt hơn bằng cách tích hợp chiếc kính với một số cảm biến khác liên quan đến xử lý khoảng cách.
Trong hơn một năm rưỡi phát triển sản phẩm, Eagle Digital đã gặp gỡ với những người khiếm thị ở Sài Gòn, Hà Nội và Lâm Đồng để lấy ý kiến trải nghiệm về sản phẩm. Những tính năng nào nhận được phản hồi tốt sẽ được nhóm nghiên cứu giữ lại, trong khi những tính năng gây khó chịu sẽ được bỏ dần đi. Họ muốn những tương tác của công nghệ trở nên “người” hơn, do vậy các kỹ sư đã nhiều lần thay thế phương án giải cho cùng một bài toán, chẳng hạn như thay bộ rung cảnh báo bằng giọng nói nhắc nhở, để những người khiếm thị đạt được sự thoải mái cao nhất.
Đã có 15 người khiếm thị tham gia sử dụng chiếc kính này khi nó đang ở giai đoạn nguyên mẫu. Nhiều người trong đó ra hào hứng với phát minh này và nói rằng đó là những lúc “đỡ lo nhất” của họ.
Có lẽ sẽ không chỉ nhóm nhỏ những người dùng thử mà rất nhiều người khác có thể đón nhận được “ánh sáng” mới từ công nghệ này. Theo báo cáo của Viện Chiến lược và Chính sách Y tế năm 2019, tại Việt Nam hiện có khoảng 2 triệu người mù và thị lực kém, một phần ba trong số đó là những người nghèo không có tiền điều trị. Trong khi WHO đưa ra một con số rộng hơn, rằng trên thế giới có hơn 270 triệu người suy giảm thị lực ở các cấp độ khác nhau, ảnh hưởng đến cuộc sống thường ngày.
Nỗ lực đằng sau cặp kính
Thật đáng ngạc nhiên là đằng sau cặp kính thông minh này đều là những người có tuổi đời rất trẻ: Phạm Huy và Trình Quốc Huy, hai người đồng sáng lập Eagle Digital, đang ở độ tuổi sinh viên. Phạm Huy chuyên về phát triển phần cứng và hạ tầng vận hành, trong khi Quốc Huy có thế mạnh về các thuật toán AI.
Trước khi lập startup này, họ đã lăn lộn trong nhiều dự án IT, từ phát triển phần mềm desktop, app điện thoại, đến robot và học máy. Những kinh nghiệm đó đã giúp họ làm chủ sản phẩm của mình từ A đến Z, cả về phần cứng lẫn phần mềm. Tuy nhiên, con đường này không thẳng băng một lèo đến đích.
Chiếc kính ban đầu rất cồng kềnh và có một khối nhỏ gắn kèm bên cạnh. Phải đến phiên bản thứ sáu vào cuối năm nay, nó mới có bề ngoài không khác gì một chiếc kính râm thời trang thông thường. Phạm Huy tự hào nói rằng, chiếc kính hiện đã hỗ trợ cả công nghệ real-time streaming, tức người dùng có thể nhận phản hồi nhanh nhất theo thời gian thực.
Để thu nhỏ kích thước như vậy, họ đã tối ưu hóa thiết kế phần cứng và chuyển việc xử lý thuật toán từ thiết bị lên máy chủ nhằm mục đích giảm thời gian phân tích xuống thấp nhất và giúp thiết bị không cần có cấu hình quá lớn, gây tốn pin.
Khi được hỏi làm sao mà những sinh viên trẻ như họ có thể thiết lập được những công nghệ tạo ra sản phẩm này, Phạm Huy thẳng thắn thừa nhận rằng họ kế thừa rất nhiều từ kinh nghiệm nước ngoài.
“Ban đầu, chúng tôi tìm kiếm các công trình nghiên cứu và sử dụng những thuật toán mà các đại học và các nhóm nghiên cứu tiên tiến trên thế giới đã phát triển về nhận dạng vật thể hay đọc văn bản, sau đó cải tiến chúng để tối ưu cho những vấn đề của người Việt Nam. Một số thứ là mã nguồn mở, một số là mua bản quyền. Nhưng sau đó khi có thời gian, các ký sư của nhóm đều xây lại từng phần để nắm được công nghệ lõi”, Huy nói.
Sự hữu ích và tiện lợi của chiếc kính đã khiến Eagle Digital nhận được quan tâm của một số chuyên gia từ Singapore thông qua TECHFEST. Chia sẻ với Khoa học & Phát triển, ND, một doanh nhân người Việt không tiết lộ tên đã xây dựng startup ở Singapore, nói rằng anh có một số lý do để nhận lời đồng hành làm mentor với dự án này, đó là tính nhân văn, tiềm năng mở rộng và thương mại hóa ở mức chi phí phù hợp với nhu cầu của đông đảo mọi người.
ND đã rót vốn 15.000 USD cho dự án, đồng thời kết nối các kỹ sư trẻ này với một chuyên gia IT tại Singapore để giải quyết những lỗi mà startup thường gặp khi đưa sản phẩm công nghệ ra thị trường. Mentor này muốn đưa dự án kính mắt sang Singapore. “Ở đó, cho dù các bạn không tiến ra toàn cầu được thì cũng có thể nắm bắt được cơ hội của ngành công nghiệp”, anh nhấn mạnh.
Mặc dù Singapore không phải là thị trường lớn nhất của sản phẩm dành cho những người khiếm thị, nhưng xung quanh đó là thị trường khổng lồ mà những người đi trước như ND tin rằng nếu thành công, Eagle Digital có thể nhanh chóng mở rộng.
Trong khi đó, các kỹ sư trẻ người Việt đang tiến hành đăng ký sáng chế ở Việt Nam và cố gắng đưa chi phí sản phẩm của mình xuống còn 150-200 USD/chiếc. Họ dự kiến bốn tháng nữa sẽ đưa sản phẩm đầu tiên ra kệ hàng.