Các nhà nghiên cứu đang khám phá các cách sử dụng giọng nói của con người để chẩn đoán Covid-19, mất trí nhớ, trầm cảm và nhiều hơn nữa.

Trong khi các nhà nghiên cứu kêu gọi những bệnh nhân COVID-19 đã hồi phục hiến huyết tương và máu của họ thì ở Israel, Bộ Quốc phòng và một công ty mới thành lập có tên là Vocalis Health yêu cầu họ đóng góp giọng nói.

Lĩnh vực mới

Công ty phân tích giọng nói Vocalis có văn phòng ở Israel và Hoa Kỳ, trước đây đã xây dựng một ứng dụng điện thoại thông minh có thể phát hiện các đợt bùng phát bệnh phổi tắc nghẽn mãn tính bằng cách lắng nghe các dấu hiệu cho thấy người dùng bị hụt hơi khi nói. Công ty muốn làm điều tương tự với COVID-19. Những người đã có kết quả xét nghiệm dương tính với SARS-CoV-2 có thể tham gia bằng cách tải xuống ứng dụng nghiên cứu của Vocalis. Mỗi ngày một lần, họ kích hoạt ứng dụng và nói vào điện thoại - ứng dụng sẽ yêu cầu họ mô tả một một hình ảnh và đếm từ 50 đến 70.

Sau đó, Vocalis bắt đầu xử lý các bản ghi âm bằng hệ thống máy học, cùng với giọng nói của những người đã được xét nghiệm âm tính với căn bệnh này, nhằm cố gắng xác định dấu hiệu của COVID-19 qua giọng nói.

Đến giữa mùa hè, công ty đã có hơn 1.500 mẫu giọng nói và phiên bản thử nghiệm của công cụ sàng lọc kỹ thuật số COVID-19. Phiên bản này hiện đang được thử nghiệm trên khắp thế giới. “Đây không phải là một biện pháp xâm lấn, cũng không phải là thuốc, chúng tôi sẽ không tác động gì, bạn chỉ cần nói," Tal Wenderow, chủ tịch kiêm giám đốc điều hành Vocalis, nói.

Vocalis không phải là công ty duy nhất đi tìm dấu ấn sinh học giọng nói của những bệnh nhân COVID-19. Riêng với chẩn đoán COVID-19 bằng giọng nói, có ít nhất ba nhóm nghiên cứu khác đang thực hiện các dự án như phân tích các bản ghi âm tiếng ho bệnh nhân COVID-19, hay phát triển các thuật toán phân tích giọng nói được thiết kế để phát hiện xem người nói có đang đeo khẩu trang hay không.


Đó là một dấu hiệu cho thấy lĩnh vực chẩn đoán giọng nói đang khao khát tạo dấu ấn như thế nào. Trong thập kỷ qua, các nhà khoa học đã sử dụng trí tuệ nhân tạo (AI) và hệ thống máy học để xác định các dấu ấn sinh học giọng nói tiềm năng của nhiều tình trạng bệnh khác nhau, bao gồm mất trí nhớ, trầm cảm, rối loạn phổ tự kỷ và thậm chí cả bệnh tim. Các công nghệ đã được phát triển có khả năng chọn ra những khác biệt nhỏ trong cách nói chuyện của những người mắc bệnh; và các công ty trên khắp thế giới đang bắt đầu thương mại hóa loại công nghệ này.

Một số bệnh gây ra biến dạng giọng nói rõ ràng như giọng bị ngạt của một người bị dị ứng. Nhưng nhiều nhà khoa học nghĩ rằng phân tích giọng nói thậm chí có thể giúp xác định một loạt các chứng rối loạn, nhờ vào sự phức tạp của giọng nói con người.

Hiện tại, hầu hết các nhóm đang thực hiện cách tiếp cận chậm, thiết kế các công cụ phù hợp để sử dụng trong văn phòng bác sĩ hoặc các thử nghiệm lâm sàng. Nhưng nhiều người mơ ước triển khai công nghệ này rộng rãi hơn, sử dụng micro phổ biến trong các sản phẩm tiêu dùng như điện thoại thông minh để xác định các chứng bệnh và rối loạn. Các hệ thống này một ngày nào đó có thể cho phép các nhà dịch tễ học sử dụng điện thoại thông minh để theo dõi sự lây lan của dịch bệnh và biến loa thông minh thành thiết bị y tế trong nhà.

"Trong tương lai, Siri và Alexa của bạn có thể nói, 'Ồ, bạn bị cảm rồi,'" Björn Schuller, chuyên gia về nhận dạng giọng nói và cảm xúc tại Đại học Augsburg ở Đức và Imperial College London, người đang dẫn đầu một trong những nghiên cứu về giọng nói và COVID-19, cho biết.

Nhưng phân tích giọng nói tự động vẫn còn là một lĩnh vực mới và có một số cạm bẫy tiềm ẩn, từ chẩn đoán sai cho đến xâm phạm quyền riêng tư cá nhân và y tế. Nhiều nghiên cứu vẫn còn ở quy mô nhỏ và việc chuyển từ mô hình mẫu sang sản phẩm sẽ không dễ dàng.

Những kết quả khả quan

Nói đòi hỏi sự phối hợp của nhiều cấu trúc và hệ thống trong cơ thể; và các nhà nghiên cứu hiện có thể đưa hàng trăm hoặc hàng nghìn mẫu giọng nói vào máy tính để tìm kiếm các đặc điểm giúp phân biệt những người mắc các bệnh lý khác nhau với những người khỏe mạnh.

Phần lớn các nghiên cứu ban đầu trong lĩnh vực này tập trung vào bệnh Parkinson, căn bệnh chưa có xét nghiệm chẩn đoán và ảnh hưởng mạnh đến khả năng nói.

Parkinson gây ra một loạt các triệu chứng vận động, bao gồm run, cứng cơ và các vấn đề về thăng bằng và phối hợp. Kết quả là nhiều người bị Parkinson có giọng nói yếu và thì thào. "Đó là một trong những biểu hiện bạn có thể nghe thấy bằng tai người. Nhưng nếu lấy 10.000 mẫu và xử lý bằng máy tính, bạn có thể nhận ra các dấu hiệu chính xác hơn nhiều," Reza Hosseini Ghomi, bác sĩ tâm thần kinh tại EvergreenHealth ở Kirkland, Washington, cho biết.

Hơn một thập kỷ trước, Max Little, nhà nghiên cứu về học máy và xử lý tín hiệu hiện làm việc tại Đại học Birmingham, Vương quốc Anh, và các đồng nghiệp của ông đã sử dụng bản ghi âm của 43 người lớn, trong đó có 33 người mắc bệnh Parkinson, nói âm tiết “ahhh”. Họ đã sử dụng các thuật toán xử lý giọng nói để phân tích 132 đặc điểm âm thanh của mỗi bản ghi âm, cuối cùng xác định 10 đặc điểm mà dựa vào đó, hệ thống có thể xác định đâu là mẫu giọng nói của người bệnh Parkinson với độ chính xác gần 99 %.

Little và những người khác trong lĩnh vực này cũng đã chứng minh rằng một số đặc điểm giọng nói nhất định tương quan với mức độ nghiêm trọng của các triệu chứng Parkinson. Little nói, các hệ thống này vẫn chưa đủ mạnh để sử dụng thường xuyên trong thực hành lâm sàng, nhưng có rất nhiều ứng dụng tiềm năng. Phân tích giọng nói có thể là cách nhanh chóng, chi phí thấp để theo dõi những cá nhân có nguy cơ mắc bệnh cao; để sàng lọc các quần thể lớn; hoặc thậm chí có thể tạo ra một dịch vụ điện thoại có thể chẩn đoán từ xa những người không có điều kiện gặp bác sĩ thần kinh. Bệnh nhân có thể sử dụng công nghệ này tại nhà - dưới dạng một ứng dụng điện thoại thông minh - để theo dõi các triệu chứng của chính họ và theo dõi phản ứng của họ với thuốc.

Các nhà nghiên cứu cũng đang xác định các dấu ấn sinh học dựa trên giọng nói cho các loại bệnh thoái hóa thần kinh khác. Ví dụ, một bộ ba nhà khoa học ở Toronto, Canada, đã sử dụng các mẫu giọng nói và bản ghi âm của hơn 250 người để xác định hàng chục điểm khác biệt giữa giọng nói của những người có khả năng mắc bệnh Alzheimer và những người không mắc bệnh này. Trong số những người tham gia, những người mắc bệnh Alzheimer có xu hướng sử dụng các từ ngắn hơn, kho từ vựng nhỏ hơn và ngắt câu nhiều hơn. Họ cũng tự lặp lại và sử dụng nhiều đại từ hơn (chẳng hạn như ‘it’ hoặc ‘this’ để thay cho danh từ riêng). "Đó có thể là một dấu hiệu cho thấy họ không nhớ tên của mọi thứ, nên họ phải sử dụng đại từ thay thế," Frank Rudzicz - nhà khoa học máy tính tại Đại học Toronto, người đứng đầu nghiên cứu - cho biết.

Khi hệ thống xem xét dựa trên các đặc điểm giọng nói như thế, nó có thể xác định những người mắc bệnh Alzheimer với độ chính xác 82%. (Đã được cải thiện lên khoảng 92%, theo Rudzicz, và tỉ lệ lỗi âm tính giả và dương tính giả gần như bằng nhau.)

Vì một số thay đổi giọng nói xảy ra trong giai đoạn đầu của các bệnh thoái hóa thần kinh, các nhà nghiên cứu hy vọng rằng các công cụ phân tích giọng nói cuối cùng có thể giúp bác sĩ lâm sàng chẩn đoán các tình trạng đó sớm hơn để can thiệp trước khi xuất hiện các triệu chứng rõ ràng.

Tuy nhiên, hiện tại, ý tưởng này chủ yếu vẫn là lý thuyết; các nhà khoa học vẫn cần phải thực hiện các thử nghiệm lớn, dài hạn để chứng minh rằng phân tích giọng nói thực sự có thể phát hiện bệnh sớm hơn các phương pháp chẩn đoán tiêu chuẩn.

Một số bác sĩ lâm sàng lưu ý rằng chỉ phân tích giọng nói sẽ hiếm khi mang lại chẩn đoán chính xác. Norman Hogikyan, nhà thanh quản học tại Đại học Michigan ở Ann Arbor, nói: "Tôi học được rất nhiều điều bằng cách lắng nghe giọng nói của ai đó. Tôi làm việc đó để kiếm sống. Nhưng tôi đặt nó cùng với tiền sử bệnh nhân và sau đó là các bài kiểm tra chẩn đoán. Cả ba phần đánh giá đó đều quan trọng."

(còn tiếp)

Nguồn: