Rác AI bắt đầu tràn ngập Internet

VietTimes – Những bài đăng không có giá trị do AI tạo ra đang ngày một tràn lan trên Internet. Về lâu dài, điều này sẽ ảnh hưởng trực tiếp đến các mô hình AI tạo sinh này.

Ảnh: The Wall Street Journal

Sau khi nghe về khả năng ngôn ngữ của ChatGPT, Jennifer Stevens đã tự hỏi liệu chatbot này có thể được áp dụng cho tạp chí International Living mà bà đang là chủ biên hay không. Sau đó không lâu, bà đã sử dụng trí tuệ nhân tạo của OpenAI cho tờ báo của mình.

Tuy nhiên, sau vài tháng, công việc của Stevens không giảm đi mà ngược lại còn tăng. Bà đã phải dành hàng giờ để lọc những nội dung vô ích do ChatGPT tạo ra. Bà là một trong những người nhận thấy ngày càng có nhiều nội dung do AI tạo ra kém hơn so với tiêu chuẩn và kỳ vọng, đến mức coi đó là một loại nội dung rác mới.

AI tạo sinh luôn là chủ đề nóng của ngành công nghệ trong thời gian gần đây. Công nghệ này có thể trả lời các câu hỏi, tạo hình ảnh và thậm chí tạo các bài luận dựa trên các gợi ý đơn giản. Chúng hứa hẹn giúp con người thực hiện công việc dễ dàng hơn, như cách máy tính đã thay đổi toán học. Tuy nhiên, công nghệ này cũng khiến những nội dung rác, kém chất lượng do AI tạo ra đang được lan truyền rộng khắp trên Internet.

Vào đầu tháng 5, công ty xếp hạng trang web tin tức NewsGuard đã tìm thấy 49 trang web tin tức giả đang sử dụng AI để tạo nội dung. Theo Gordon Crovitz, người đồng sáng lập công ty, đến cuối tháng 6, con số đã lên tới 277.

“Xu hướng này đang phát triển theo cấp số nhân,” Crovitz nói. Ông Gordon trước đây là nhà báo của The Wall Street Journal (WSJ), cho biết các trang web dường như được tạo ra để kiếm tiền thông qua mạng quảng cáo trực tuyến của Google.

WSJ cũng thử yêu cầu ChatGPT "kể tên một số tạp chí chấp nhận nội dung do ChatGPT viết". Ngay sau đó, công cụ của OpenAI đưa ra 10 cái tên phổ biến có trên một triệu lượt xem mỗi ngày, trong đó có 5 tạp chí sử dụng hệ thống gửi nội dung có tên Moksha để quản lý việc gửi bài viết do AI tạo.

"Các nhà xuất bản sử dụng Moksha chắc chắn đã nhận thấy sự gia tăng số bài do AI tạo. Vì vậy chúng tôi đã phát triển công cụ để họ có thể dễ dàng kiểm soát", Matthew Kressel, người đứng sau Moksha, cho biết sau đó.

Các nhà nghiên cứu cũng chỉ ra rằng công nghệ AI có thể bị lạm dụng để tạo ra thông tin sai lệch về chính trị và các thông điệp nhắm mục tiêu được sử dụng để hack. Công ty an ninh mạng Zscaler cho biết còn quá sớm để nói liệu AI có đang bị tội phạm sử dụng rộng rãi hay không, nhưng họ tin rằng công nghệ này sẽ sớm được sử dụng để phát triển các trang web lừa đảo chất lượng cao, được thiết kế để lừa nạn nhân tải xuống phần mềm độc hại, hoặc tiết lộ tên người dùng và mật khẩu trực tuyến của họ.

Trên YouTube, các cuộc thảo luận về ChatGPT đang diễn ra sôi nổi. Hàng chục video đưa ra lời khuyên về cách kiếm tiền từ công nghệ của OpenAI đã được xem hàng trăm nghìn lần. Một số video nói rằng người dùng có thể kiếm được hàng nghìn USD mỗi tuần, khuyến khích họ viết sách điện tử hoặc bán quảng cáo trên các blog chứa đầy nội dung do AI tạo ra.

Trước vấn đề này, đại diện Google cho biết luôn kiểm soát công cụ tìm kiếm khỏi nội dung spam và thao túng. Bên cạnh đó, công ty nhấn mạnh việc sử dụng nội dung do AI tạo ra để thao túng xếp hạng kết quả tìm kiếm là vi phạm chính sách và sẽ bị hạn chế.

Nhiều tờ báo có chính sách nhận bài viết từ cộng tác viên đang cảm thấy quá tải. Neil Clarke, đại diện tạp chí khoa học viễn tưởng Clarkesworld, cho biết đã ngừng nhận bài được gửi trực tuyến từ đầu năm do hệ thống "tắc nghẽn" bởi hàng trăm câu chuyện do AI sáng tác.

AI có “chính tả và ngữ pháp hoàn hảo, nhưng một câu chuyện hoàn toàn không mạch lạc”, ông nói.

Stevens, của International Living, cho biết: “Tất cả chúng đều được viết theo một cách khá nhạt nhẽo và chung chung. Tất cả đều đúng ngữ pháp. Tuy nhiên tất cả bài viết này đều rất thô cứng, khó chấp nhận".

Một số chuyên gia dự đoán, nếu Internet chứa đầy nội dung do AI tạo ra, chúng có thể hình thành cái gọi là "Sự sụp đổ của mô hình". AI thường dùng dữ liệu trực tuyến trên Internet để huấn luyện chính chúng hàng ngày. Nhưng khi Internet đầy rẫy nội dung AI, các mô hình sẽ trở nên kém tin cậy và cuối cùng sụp đổ.

Ilia Shumailov, một nhà nghiên cứu tại Nhóm máy học lý thuyết và ứng dụng của Đại học Oxford, cho biết giống như việc quét và in lặp đi lặp lại cùng một bức ảnh sẽ làm giảm độ chi tiết của nó.

Tháng trước, các nhà nghiên cứu tại Viện Công nghệ Liên bang ở Lausanne (Pháp) đã thuê các nhà văn tự do để tóm tắt các bài viết được đăng trên Tạp chí Y học New England và phát hiện ra rằng hơn một phần ba trong số đó sử dụng nội dung do AI tạo ra.

Ông Shumailov cho rằng "sự sụp đổ của mô hình" là không thể tránh khỏi, nhưng vẫn còn một số giải pháp cho vấn đề này. Theo ông, nếu các công ty có quyền truy cập vào nội dung do con người tạo ra, tách biệt với mô hình dùng bất cứ nguồn dữ liệu nào đang có trên Internet sẽ có thể tạo nên sự khác biệt.

Theo The Wall Street Journal