Trang chủ Khoa học

Khoa học

Đằng sau cuộc xung đột giữa Scarlett Johansson và OpenAI

01/06/2024 07:15

Việc một người nổi tiếng công khai xung đột với OpenAI cho thấy đang tồn tại sự rạn nứt ngày càng gia tăng giữa các công ty công nghệ và giới nghệ sĩ. Sâu xa hơn, đó là cuộc chiến bảo vệ tính độc đáo của con người trong thời đại AI.

OpenAI sử dụng giọng đọc giống hệt nữ diễn viên Scarlett Johansson cho trợ lý ảo "Sky" không chỉ là một thảm họa truyền thông mà còn cho thấy một thái độ coi thường nghiêm trọng vấn đề bản quyền trí tuệ. Ảnh: Techsauce.co

Sự việc Johansson vs. OpenAI

Hai tuần trước, khi OpenAI ra mắt tính năng “giọng nói”của mô hình ngôn ngữ lớn ChatGPT, công ty này đã lập tức nhận được cáo buộc công khai của nữ diễn viên nổi tiếng Scarlett Johansson rằng giọng nói này “giống giọng nói của cô một cách kỳ lạ” đến nỗi những người bạn thân nhất của cô và các hãng thông tấn cũng “không thể nhận ra sự khác biệt”.

Bên cạnh cảm xúc “sốc” và “giận dữ” cá nhân, Johansson nói rằng cô thấy đó là điều đáng báo động, nhất là vào thời điểm Internet tràn ngập thông tin sai lệch và deepfake như hiện nay. Mặc dù không chính thức kiện tụng nhưng đội luật sư của Johansson đã gửi cho OpenAI hai lá thư yêu cầu công ty nêu chi tiết quá trình phát triển giọng nói mà họ gọi là “Sky” này.

Johansson cho biết tháng Chín năm ngoái, Sam Altman - Giám đốc điều hành OpenAI đề nghị cô cấp phép giọng nói của mình cho trợ lý ảo ChatGPT. Altman đã nói với cô rằng “anh ấy cảm thấy bằng cách lồng tiếng cho hệ thống [ChatGPT], tôi có thể thu hẹp khoảng cách giữa các công ty công nghệ và các nhà sáng tạo, đồng thời giúp người tiêu dùng cảm thấy thoải mái với sự thay đổi địa chấn liên quan đến con người và AI. Sam nói anh ấy cảm thấy giọng nói của tôi sẽ an ủi mọi người.”

Vì lý do cá nhân, Johansson đã từ chối đề nghị này. Tuy nhiên, chỉ hai ngày trước khi phần mềm ChatGPT mới được công bố vào tháng năm năm nay, Altman một lần nữa liên hệ với nhóm của Johansson, thúc giục nữ diễn viên xem xét lại đề nghị của mình.

Trước khi cô và Altman có thể kết nối, vào ngày 14/5, OpenAI đã công bố sản phẩm bùng nổ mới của mình, hoàn chỉnh với một giọng nói mà Johansson cho rằng dường như đã sao chép chân dung của cô.

Dĩ nhiên Sam Altman lập tức phủ nhận điều này và cho biết giọng nói “Sky” thuộc về một nữ diễn viên lồng tiếng chuyên nghiệp khác mà họ đã tiếp cận trước khi gặp Johansson. Altman nhấn mạnh rằng Sky “không bao giờ có ý định giống với giọng của [Johansson]” và họ sẽ tạm dừng việc sử dụng giọng nói “Sky” để tôn trọng nữ diễn viên.

Đây là một tình huống lộn xộn đối với OpenAI, bởi ngay hôm phát hành trợ lý giọng nói của ChatGPT, Altman đã đăng một post trên mạng xã hội X với một từ “Her” duy nhất - ám chỉ đến bộ phim cùng tên năm 2013, trong đó Johansson lồng tiếng cho một trợ lý AI mà nhân vật chính phải lòng. Trước đây, Altman cũng từng nói rằng “Her” là bộ phim yêu thích của anh. Tất cả ngụ ý rằng CEO của OpenAI đã nhận thức, thậm chí tự hào, về sự tương đồng giữa giọng nói của “Sky” và Johansson.

Sự kiện này đang trở thành một chương quan trọng trong cuộc tranh luận đang diễn ra về vấn đề bản quyền và những tác động đạo đức của công nghệ AI.

Trước tác động của dư luận, OpenAI đã phải tiết lộ quy trình tuyển chọn giọng nói của mình trên website công ty. Họ cho biết, từ đầu năm 2023, công ty đã làm việc với các đạo diễn và nhà sản xuất từng đoạt giải để xây dựng bộ tiêu chí cho giọng nói của ChatGPT, xem xét cẩn thận tính cách độc đáo của từng giọng nói và sức hấp dẫn của chúng đối với khán giả toàn cầu. Có một số tiêu chí như “giọng nói mang lại cảm giác vượt thời gian”, “giọng nói gần gũi, tạo cảm giác đáng tin tưởng”, “giọng nói ấm áp, lôi cuốn, tin cậy với âm sắc phong phú”, “giọng nói tự nhiên, dễ nghe” v.v

OpenAI cho biết vào tháng năm năm ngoái, họ đã nhận được 400 mẫu giọng dự thi từ các diễn viên lồng tiếng và diễn viên điện ảnh, từ đó chọn ra năm giọng nói cuối cùng là Breeze, Cove, Ember, Juniper và Sky. Danh tính của những người cung cấp giọng nói này không được công bố để bảo vệ thông tin cá nhân.

OpenAI trấn an dư luận rằng họ đã nói chuyện với từng diễn viên lồng tiếng về tầm nhìn tương tác giọng nói giữa người và AI của công ty, đồng thời thảo luận về khả năng, hạn chế và rủi ro của công nghệ liên quan. Việc giám đốc Sam Altman liên hệ với Johansson sau đó, theo phía công ty, là để thuyết phục cô trở thành diễn viên lồng tiếng thứ sáu cho ChatGPT.

Góc nhìn luật pháp

David Simon, phó giáo sư tại Trường Luật của Đại học Northeastern (Mỹ), nói rằng có ít nhất ba khiếu nại tiềm năng mà Johansson có thể đưa ra chống lại OpenAI, bao gồm: khiếu nại về quyền công bố (right of publicity), khiếu nại về nhãn hiệu (trademark) và khiếu nại về bản quyền (copyright).

Đầu tiên là quyền công bố, hoặc hiểu đơn giản là quyền thuộc về nhân thân. Quyền này cho phép mọi người có quyền khai thác thương mại hình ảnh hoặc danh tính của họ, bao gồm cả ngoại hình và giọng nói.

Johansson có thể lập luận rằng OpenAI đang chiếm đoạt thương mại chân dung của cô ấy mà không có sự đồng ý. Ngay cả khi OpenAI không sử dụng giọng nói của Scarlett để đào tạo mô hình của mình, vẫn có những án lệ về việc cố tình bắt chước giọng nói đặc biệt và có giá trị thương mại của ai đó để có lợi cho mình.

Có hai vụ án tương tự như vậy vào năm 1988, khi nữ ca sĩ và diễn viên người Mỹ Midler kiện Ford vì đã thuê một ca sĩ phụ để bắt chước giọng cô trong quảng cáo, và nhạc sĩ kiêm ca sĩ Tom Waits kiện Frito-Lay vì sử dụng người bắt chước giọng anh để hát bài hát của anh trong quảng cáo Doritos. Cả hai công ty đều đã thuê các nhạc sĩ đóng giả Bette Midler và Tom Waits cho quảng cáo của họ vì cả hai ca sĩ đều từ chối tham gia vào quảng cáo. Hai vụ kiện đều có kết quả nghiên về phía các nghệ sĩ.

Trường hợp của Johansson cũng có nhiều khả năng thắng thế tương tự nếu đưa ra kiện tụng, và những chiến thắng như vậy “có ý nghĩa quan trọng đối với các bản sao giọng nói AI”. Tuy nhiên, ở Mỹ, không có luật liên bang bảo vệ quyền công bố, mà chỉ có luật của một số tiểu bang. Điều khá may mắn là California, nơi đặt trụ sở của OpenAI, thuộc diện có luật pháp bảo vệ giọng nói của cá nhân.

Thứ hai, Johansson có thể đưa ra khiếu nại về nhãn hiệu. Quyền này bảo vệ các cá nhân khi giọng nói của họ bị sử dụng để quảng cáo cho một sản phẩm mà họ không hề liên quan, ví dụ như khi người ta lầm tưởng rằng giọng nói của Johansson là chứng thực cho sản phẩm ChatGPT của OpenAI.

Johansson có thể lập luận, “Tôi có giọng nói đặc biệt này. Nó gắn liền với tôi. Nó có giá trị thương mại. Về cơ bản, nó giống như một nhãn hiệu. Bằng cách bắt chước giọng nói của tôi, bạn đang tạo ấn tượng rằng tôi ủng hộ việc sử dụng sản phẩm của bạn và khiến người tiêu dùng bối rối về việc liệu tôi có đang thực sự làm điều đó hay không. Nếu sản phẩm của bạn có vấn đề, nó sẽ ảnh hưởng đến uy tín và hình ảnh của tôi”.

Mặc dù OpenAI tuyên bố họ không cố tình làm cho giọng nói “Sky” nghe giống Johansson, nhưng điều đó không chắc sẽ bảo vệ được công ty vì người tiêu dùng đã nhận ra sự tương đồng.

Simon nói rằng hai cách khiếu nại đầu tiên sẽ là mạnh nhất, nhưng Johansson cũng có khả năng đưa ra khiếu nại thứ ba về bản quyền. Quyền này bảo vệ các tác phẩm gốc của nghệ sĩ khi chúng được biểu đạt hữu hình, ví dụ như dưới dạng một bức tranh hoặc một bản ghi âm.

Nếu OpenAI sử dụng các bản ghi âm để đào tạo mô hình AI của mình và Johansson sở hữu bản quyền đối với các bản ghi âm đó, thì cô ấy có thể kiện công ty vì vi phạm bản quyền. Điều này đã từng diễn ra cách đây vài tháng, khi thời báo The New York Times cáo buộc OpenAI sử dụng bất hợp pháp các bài báo bản quyền của họ để đào tạo AI có thể viết theo phong cách của The New York Times.

Nhưng liệu Scarlett Johansson có kiện OpenAI hay không là một câu hỏi ngỏ. Theo đánh giá của phó giáo sư Simon, Johansson đã chọn cách tiếp cận tình huống một cách thông minh. Trước tiên, bằng cách yêu cầu OpenAI minh bạch thông tin, cô đang hướng tới việc tạo dư luận để công chúng có cái nhìn toàn diện hơn về vấn đề, mà không đi sâu vào kiện tụng. Ngoài ra, nó cũng phát đi thông điệp rằng giọng nói của ChatGPT “không phải” của Johansson và cô đang cảm thấy bị xúc phạm.

Nếu kiện tụng, sẽ có rất nhiều câu hỏi xung quanh cần được trả lời, ví dụ như: liệu có phải OpenAI đang cố gắng tạo ra một giọng nói tương tự như Johansson? Họ có sử dụng giọng nói của Johansson để làm điều đó không? Họ có cố gắng đào tạo AI bắt chước giọng nói của Johansson để đạt lợi thế thương mại không? Họ có xin giấy phép từ Johansson không? Liệu mọi người có bị bối rối về việc Johansson ủng hộ/đại diện sản phẩm hay không? v.v Chứng minh những thứ đó thoạt nghe đơn giản nhưng không dễ dàng.

Hơn nữa, Johansson có thể sẽ không kiện OpenAI vì công ty không còn sử dụng giọng nói “Sky” nữa. Và vì nó chỉ là một bản demo xuất hiện trong một thời gian rất ngắn để ra mắt tính năng, không phải là một bản phát hành đầy đủ cho công chúng để cung cấp các dịch vụ, nên rất khó để chứng minh Johansson có bị thiệt hại gì hay không.

Tuy nhiên, đôi khi người ta có thể theo đuổi đến cùng một sự việc chỉ đơn giản vì nó là “điều phải làm”.

Khơi dậy nỗi sợ hãi ở Hollywood

Dù có kiện tụng hay không, câu chuyện của Johansson đã thành công trong việc khơi lại nỗi sợ hãi AI của Hollywood, vốn đã bùng lên trong cuộc đình công hồi tháng năm năm ngoái. Các công đoàn bảo vệ giới nghệ sĩ Mỹ đã lo ngại AI có thể thay thế họ hoặc làm giảm khả năng sáng tạo của họ. Họ phản đối việc các nhà sản xuất điện ảnh và truyền hình sử dụng các mô hình AI được đào tạo dựa trên công sức sáng tạo của các nghệ sĩ mà không có một sự đền bù xứng đáng.

Hiện nay, AI mà các hãng phim sử dụng đã có thể tự động hóa một số tác vụ như viết kịch bản, tạo cốt truyện hoặc tạo hiệu ứng đặc biệt. Điều này có khả năng dẫn đến mất việc làm cho các nhà biên kịch, diễn viên và các chuyên gia sáng tạo khác. Các diễn viên lo lắng rằng những nhân vật “ảo” do AI tạo ra trong các thước phim sẽ thay thế họ, đặc biệt là đối với những vai phụ ít quan trọng. Một số lo ngại rằng AI có thể sử dụng giọng nói hoặc chân dung mà không có sự đồng ý của họ, như đã thấy trong trường hợp của Scarlett Johansson.

Chung quy lại, giới nghệ sĩ ở Hollywood muốn có tiếng nói về cách AI được sử dụng trong làm phim. Họ hiểu rằng nếu không đạt được các thỏa thuận mạnh mẽ từ bây giờ thì chỉ vài năm nữa thôi, họ sẽ càng khó đấu tranh đòi quyền lợi, bởi khi đó các hãng phim sẽ không còn cần đến họ.

Thực chất, cuộc giằng co giữa các nghệ sĩ như Johansson với các công ty công nghệ như OpenAI là một cuộc chiến bảo vệ tính độc đáo của con người trong thời đại AI. Chúng hướng tới việc thiết lập ranh giới đạo đức cũng như pháp luật cho việc sử dụng AI. Các khung pháp lý hiện nay đang phải vật lộn để bắt kịp với những tiến bộ nhanh chóng trong công nghệ AI.

Chẳng hạn tuần trước, Hiệp hội các diễn viên Mỹ tuyên bố ủng hộ ra mặt Johanssonvà nhấn mạnh rằng họ muốn luật pháp liên bang bảo vệ tiếng nói và chân dung của các nghệ sĩ - và của tất cả mọi người - khỏi bị sao chép kỹ thuật số trái phép.

Nhìn về tương lai

Các chuyên gia xã hội học cho biết, những sản phẩm “giọng nói AI giống hệt con người” cung cấp góc nhìn thoáng qua về thế hệ tiếp theo của AI, và cũng đặt ra câu hỏi về những rủi ro đi kèm khi ngày càng có nhiều người áp dụng các công cụ này.

Visar Berisha, giáo sư Đại học bang Arizona, người nghiên cứu về công nghệ giọng nói AI, cho biết rất khó để dự đoán các trợ lý giọng nói AI nói chuyện với tính cách như con người sẽ thay đổi xã hội ra sao.

Anh nhận xét: "Giao tiếp bằng giọng nói thực sự gần gũi, tạo tác động mạnh mẽ. Nó cho phép AI thể hiện những sắc thái tinh tế, những thứ mà ta có thể cảm nhận được như sự chân thành, sự vội vã, niềm vui và mối quan tâm. Tất cả những điều này đều giúp nuôi dưỡng mối liên kết sâu sắc hơn giữa người dùng với máy móc. Và ta có thể thấy những tương tác này có khả năng ‘gây nghiện’ đến mức nào.”

Như đã nói, lý do (được cho là) của Altman khi muốn dùng giọng nói của Johansson là âm sắc quen thuộc của cô ấy có thể "an ủi mọi người", những người e dè hoặc khó chịu với trợ lý AI. Sự giống nhau trong chất giọng của “Sky” với Johansson sẽ ít liên quan đến tính thẩm mỹ của giọng nói mà nhiều hơn đến các thủ thuật để mọi người chấp nhận AI.

Có thể mọi người sẽ bắt đầu hình thành các kết nối cảm xúc với các hệ thống AI, giống như cốt truyện của "Her" - một bộ phim không kết thúc có hậu. Nam chính của “Her” đã trải qua giai đoạn hôn nhân khó khăn và cảm thấy cô đơn. Anh tìm đến AI Samatha (do Johansson lồng tiếng) với hy vọng tìm kiếm sự kết nối và đồng hành. Ban đầu, mối quan hệ của họ chỉ là tình bạn, nhưng dần dần anh và Samantha phát triển tình cảm sâu sắc hơn. Họ chia sẻ những suy nghĩ, cảm xúc và trải nghiệm cá nhân với nhau, và dần trở nên không thể thiếu nhau.

"Khi tôi lần đầu tiên xem bộ phim đó, nó có vẻ giống như khoa học viễn tưởng. Bây giờ xem ra không phải như vậy nữa." Berisha nhận xét.

Các giọng nói tự nhiên không chỉ làm xáo trộn cảm xúc xã hội mà còn đi kèm với những nguy cơ lừa đảo tinh vi. Hồi tháng Ba, khi giới thiệu mô hình AI tạo giọng nói tổng hợp Voice Engine, OpenAI thừa nhận rằng họ thấy các rủi ro deepfake. Công nghệ này cho phép tạo ra giọng nói “như con người” khi cung cấp ít nhất 15 giây dữ liệu giọng nói mẫu.

Với viễn cảnh này, bất kỳ ai cũng có thể tìm cách giả giọng người khác để đạt được mục đích của mình. Dĩ nhiên, Voice Engine chưa được phát hành rộng rãi. Nhưng có không ít công ty đã đưa ra những công nghệ tương tự như thế và hoàn toàn miễn phí. Đến một lúc nào đó, chúng ta sẽ rất khó phân biệt liệu giọng nói mình đang giao tiếp là của con người hay máy móc.

Nguồn:

Reuters, NPR, OpenAI

Bài đăng số 1294 (số 22/2024) KH&PT

Hồng Hạnh

TIN TIÊU ĐIỂM

CHUYÊN MỤC