Bởi vậy OpenAI cho rằng, việc hạn chế dữ liệu đào tạo ở sách và hình ảnh thuộc phạm vi công cộng sẽ không cho phép tạo ra các hệ thống AI đáp ứng được nhu cầu ngày nay của người dân.

Các chatbot như ChatGPT và các công cụ tạo hình ảnh như Stable Diffusion được “đào tạo” trên một kho dữ liệu khổng lồ lấy từ internet, trong đó phần lớn được bảo vệ bản quyền nhằm chống lại việc tác phẩm bị sử dụng mà không được phép của chủ sở hữu.

Hình minh họa. Nguồn: Reuters

Tháng trước, New York Times (NYT) đã kiện OpenAI và Microsoft, nhà đầu tư lớn nhất của OpenAI và sử dụng các mô hình của OpenAI trong các sản phẩm như Bing, cáo buộc các công ty “sử dụng trái phép” các tác phẩm, tài liệu báo chí của tờ báo nổi tiếng này để tạo ra mô hình AI.

Đáp lại, OpenAI cho biết họ không thể đào tạo các mô hình ngôn ngữ lớn như mô hình GPT-4 – công nghệ đằng sau ChatGPT – nếu không có quyền truy cập vào tác phẩm có bản quyền.

OpenAI cho biết trong báo cáo mới của mình: “Bởi vì bản quyền ngày nay bao trùm hầu như mọi khía cạnh – bao gồm các bài đăng trên blog, ảnh, bài đăng trên diễn đàn, mã phần mềm và tài liệu của chính phủ – nên sẽ không thể đào tạo các mô hình AI hàng đầu nếu không sử dụng các tài liệu có bản quyền”.

Công ty nói thêm: “Việc hạn chế dữ liệu đào tạo ở sách và hình ảnh thuộc phạm vi công cộng sẽ không tạo ra các hệ thống AI đáp ứng được nhu cầu của người dân ngày nay”.

Trả lời vụ kiện của NYT vào tháng trước, OpenAI cho biết họ tôn trọng “quyền của người sáng tạo và chủ sở hữu nội dung”. Tuy nhiên, việc sử dụng tài liệu có bản quyền của các công ty AI không phải không có căn cứ, mà dựa trên các điều khoản pháp lý về “sử dụng hợp pháp”, cho phép sử dụng nội dung trong một số trường hợp nhất định mà không cần xin phép chủ sở hữu.

Trong bản đệ trình mới nhất lên chính phủ Mỹ, OpenAI cho biết họ tin rằng “về mặt pháp lý, luật bản quyền không cấm sử dụng tài liệu cho mục đích đào tạo”.

Vụ kiện của NYT kéo theo nhiều khiếu nại pháp lý khác chống lại OpenAI. John Grisham, Jodi Picoult và George RR Martin nằm trong số 17 tác giả đã kiện OpenAI hồi tháng 9/2023 với cáo buộc về “hành vi trộm cắp có hệ thống trên quy mô lớn”.

Getty Images - công ty sở hữu một trong những thư viện ảnh lớn nhất thế giới, đang kiện người tạo ra Stable Diffusion, Stability AI, ở Mỹ, Anh và xứ Wales vì vi phạm bản quyền. Tại Mỹ, một nhóm nhà xuất bản âm nhạc bao gồm Universal Music đang kiện Anthropic, công ty được Amazon hậu thuẫn, cáo buộc họ sử dụng lời bài hát có bản quyền để đào tạo mô hình của mình.

Nguồn: