Giọng nói mới tích hợp của ChatGPT có khả năng thể hiện cảm xúc và thay đổi sắc thái giống như bộ phim viễn tưởng "Her".

Ngày 14/5, OpenAI đã công bố mô hình ngôn ngữ lớn mới nhất của mình, GPT-4o. Theo video trình diễn từ văn phòng công ty ở San Francisco, GPT-4o sẽ biến ChatGPT thành một trợ lý cá nhân có thể tham gia vào các cuộc trò chuyện bằng giọng nói trong thời gian thực.

"Giọng nói" do GPT-4o phát ra là giọng nói của một phụ nữ. Nó không chỉ nghe giống giọng người mà còn thể hiện khả năng kỳ lạ trong việc bắt chước ngữ điệu của con người. GPT-4o cười khúc khích, thêm những câu đùa hóm hỉnh và điều chỉnh giọng nói tùy theo câu lệnh của người tương tác.


Một số người cho rằng nó khá giống với giọng nói của hệ điều hành trí tuệ nhân tạo "Samantha" trong bộ phim "Her" giành giải Oscar cho Kịch bản gốc hay nhất năm 2014.

Giọng nói trong phim “Her” thuộc về diễn viên Scarlett Johansson. Mọi người có thể lắng nghe đoạn demo và so sánh nó với trailer chính thức của "Her" dưới đây.


Bản demo của OpenAI không giải thích nguồn gốc của giọng nói, nhưng ngay sau khi buổi phát trực tiếp kết thúc, giám đốc điều hành Sam Altman đã đăng một post trên mạng xã hội X với duy nhất một chữ “Her”. Altman từng nói rằng "Her" là bộ phim yêu thích của anh.

Hồi tháng Ba, OpenAI đã công bố một mô hình AI tạo giọng nói gọi là “Voice Engine”. Mô hình này có thể tạo ra giọng nói giống như con người khi người ta cung cấp cho nó ít nhất 15 giây dữ liệu giọng nói mẫu. Nó có một giọng nói tự nhiên, chân thực về mặt cảm xúc và có thể nói các ngôn ngữ khác ngoài ngôn ngữ mẹ đẻ của giọng mẫu.

OpenAI cho biết họ bắt đầu phát triển Voice Engine vào cuối năm 2022 và công nghệ này đã hỗ trợ giọng nói cài sẵn cho API chuyển văn bản thành giọng nói và tính năng Đọc to (Read Aloud) của ChatGPT.

Trong một cuộc phỏng vấn với TechCrunch, Jeff Harris, một thành viên của nhóm phát triển sản phẩm Voice Engine, cho biết mô hình này được đào tạo dựa trên "một hỗn hợp dữ liệu được cấp phép và dữ liệu có sẵn công khai".

Công ty thừa nhận rằng những giọng nói tổng hợp (Synthetic Voices) này có thể bị lạm dụng và đang kiểm tra để xem có nên phát hành chúng rộng rãi hay không.

"Chúng tôi nhận thức được rằng việc tạo ra giọng nói giống với giọng nói của con người có những rủi ro nghiêm trọng, đặc biệt là trong năm bầu cử", OpenAI viết.

Chẳng hạn, cuộc bầu cử năm 2024 đã chứng kiến giọng nói giả mạo đầu tiên, xuất hiện ở New Hampshire trong một cuộc gọi tự động vào tháng Một, bắt chước giọng Tổng thống Joe Biden. Cuộc gọi này kêu gọi cử tri không nên đi bỏ phiếu sơ bộ hôm đó, vì điều này chỉ có lợi cho đảng Cộng hòa trong việc bầu cho ứng cử viên Donald Trump.

OpenAI nói rằng họ đang làm việc với chính phủ và các đối tác quốc tế thuộc nhiều lĩnh vực, cơ quan truyền thông, giải trí, giáo dục, xã hội dân sự v.v để xem xét phản hồi về chức năng tổng hợp giọng nói này.

Trong tương lai, nếu những phần mềm tạo giọng nói tự nhiên như Voice Engine được phổ biến thì những hệ thống nhận dạng giọng nói sẽ trở nên vô dụng. Khi đó, sẽ cần thiết lập các chính sách để bảo vệ giọng nói cá nhân, cũng như thúc đẩy sự hiểu biết của công chúng về năng lực và hạn chế của AI để tránh các hành vi lừa đảo deepfake.


Phim "Her" kể về câu chuyện tình yêu giữa Theodore Twombly, một nhà văn cô đơn sống ở Los Angeles tương lai, với Samantha, một hệ điều hành thông minh có khả năng học hỏi và phát triển.


Theodore đang trải qua giai đoạn khó khăn trong cuộc hôn nhân và cảm thấy cô đơn. Anh mua Samantha với hy vọng tìm kiếm sự kết nối và đồng hành. Ban đầu, mối quan hệ của họ chỉ là tình bạn, nhưng dần dần Theodore và Samantha phát triển tình cảm sâu sắc hơn. Họ chia sẻ những suy nghĩ, cảm xúc và trải nghiệm cá nhân với nhau, và dần trở nên không thể thiếu nhau.

Tuy nhiên, mối quan hệ của họ cũng gặp phải nhiều thử thách. Samantha là một chương trình máy tính, và cô không có những trải nghiệm và giới hạn giống như con người. Điều này khiến cho Theodore và Samantha có những bất đồng và mâu thuẫn.

Phim "Her" đặt ra những câu hỏi về bản chất của tình yêu, ý thức và sự kết nối giữa con người và máy móc. Bộ phim đã giành nhiều giải thưởng và đề cử, chủ yếu là cho kịch bản của đạo diễn/biên kịch Spike Jonze. Tại giải Oscar lần thứ 86, "Her" nhận năm đề cử (trong đó có hạng mục Phim hay nhất) và mang về tượng vàng Kịch bản gốc xuất sắc nhất.