Google bị kiện vì sử dụng dữ liệu không được phép để đào tạo AI của mình

13/07/2023 17:00:10

VietTimes – Số lượng các vụ kiện về dữ liệu được sử dụng để đào tạo các mô hình AI khác nhau đang tăng lên nhanh chóng và lần này Google đang "ở trong tầm ngắm".

Google bị kiện vì sử dụng dữ liệu không được cho phép để đào tạo AI của mình (Ảnh: Slash Gear)

DeepMind, công ty đã được mua lại bởi Google vào nhiều năm trước và được tích hợp với nhóm Google Brain vào tháng 4, cũng là một phần của vụ kiện.

Những người khởi kiện tuyên bố rằng Google "đã bí mật đánh cắp mọi thứ từng được tạo và chia sẻ trên internet" để sử dụng với mục đích huấn luyện chatbot AI.

Tin tức này xuất hiện chỉ vài ngày sau khi OpenAI vướng phải một vụ kiện liên quan đến các mô hình ngôn ngữ mà họ đào tạo, cụ thể là GPT-3.5 và GPT-4. Diễn viên Sarah Silverman đã cáo buộc OpenAI vi phạm bản quyền sách của cô bằng cách đưa chúng vào dữ liệu đào tạo mà không được phép. Hơn nữa, vụ kiện cũng cho biết nhiều khả năng OpenAI đang sử dụng những nguồn sách lậu để đào tạo AI.

Sự bùng nổ của các chatbot AI đang đặt ra những câu hỏi liên quan đến vấn đề bản quyền và cách người sáng tạo được trả phí khi AI được đào tạo trên chính các tác phẩm của họ. Trọng tâm của vấn đề là các bộ dữ liệu được sử dụng để đào tạo các mô hình AI khác nhau, có thể bao gồm mọi thứ từ nội dung được lấy từ các blog ngẫu nhiên đến tạp chí khoa học, thư viện sách đã xuất bản, nền tảng truyền thông xã hội, v.v. Một số công ty sử dụng số lượng lớn nội dung do con người tạo ra như Reddit và Twitter đã yêu cầu các công ty đào tạo chatbot AI trả phí.

Trong khi các công ty lớn chiến đấu với các vụ kiện, có nhiều người gián tiếp bị cuốn vào vấn đề này, những người không có đủ nguồn lực để thách thức các gã khổng lồ công nghệ một cách riêng lẻ, đó là nơi các vụ kiện tập thể có thể phát huy tác dụng. Do đó, không có gì ngạc nhiên khi Google đang phải đối mặt với một vụ kiện tập thể với mục đích yêu cầu Google tạm dừng cung cấp quyền truy cập thương mại vào các mô hình AI của mình.

Hành động pháp lý đến từ Công ty luật Clarkson và một trong những luật sư của vụ án - ông Tim Giordano, đã giải thích lý do trong một tuyên bố với CNN: "Google cần hiểu rằng việc các thông tin và dữ liệu được đăng công khai không có nghĩa là nó được sử dụng miễn phí. Thông tin cá nhân và dữ liệu của chúng tôi là tài sản của chúng tôi và nó có giá trị và không ai có quyền lấy và sử dụng nó cho bất kỳ mục đích nào".

Alphabet, Google và DeepMind hiện vẫn chưa đưa ra bất kỳ bình luận nào liên quan đến sự việc này.

Theo Slashgear