Ngộ nhận của Mark Zuckerberg: Nhầm tưởng công nghệ ngôn ngữ sẽ thay đổi thế giới, trợ lý ảo ‘chết yểu’ sau 3 ngày vì ‘nói không thành có’

Sai lầm của Meta, và sự ngạo mạn của nó, một lần nữa cho thấy điểm mù của Big Tech trong lĩnh vực mô hình ngôn ngữ lớn.

Ngày 15/11, Meta tiết lộ một mô hình máy tính xử lý ngôn ngữ mới có tên Galactica, được tạo ra để hỗ trợ tìm kiếm và xử lý tài liệu khoa học, theo MIT Technology Review. Tuy nhiên, thay vì tạo ra cú hích lớn như Meta kỳ vọng, Galactica “chết yểu” chỉ sau 3 ngày nhận chỉ trích dữ dội. Ngày hôm qua, bản demo công khai của mô hình này đã chính thức bị gỡ bỏ.

Sai lầm của Meta, và sự ngạo mạn của nó, một lần nữa cho thấy điểm mù của Big Tech trong lĩnh vực mô hình ngôn ngữ lớn. Rất nhiều nghiên cứu đã chỉ ra sai sót của công nghệ này, bao gồm cả xu hướng tái tạo định kiến, “nói không thành có”. Meta và nhiều công ty khác tiếp cận mô hình ngôn ngữ lớn, trong đó có Google, đã không coi trọng vấn đề này.

Galactica là mô hình ngôn ngữ lớn phục vụ cho lĩnh vực khoa học, được đào tạo dựa trên 48 triệu dữ liệu về các bài báo khoa học, trang web, sách giáo khoa, ghi chú bài giảng và bách khoa toàn thư. Meta quảng cáo mô hình này như một “lối tắt” cho các nhà nghiên cứu và sinh viên, với khả năng “tóm tắt các bài báo học thuật, giải toán, viết báo trên Wiki, tạo mã khoa học, chú thích phân tử…”.

Tuy nhiên, “lớp phủ bóng” nhanh chóng bị “bào mòn”. Giống như tất cả các mô hình ngôn ngữ khác, Galactica chỉ là một bot không thể phân biệt sự thật hay hư cấu. Trong vòng vài giờ, các nhà khoa học đã chia sẻ kết quả sai lệch và thông tin không chính xác của nó trên mạng xã hội.

“Cảm xúc tôi lẫn lộn trước nỗ lực mới này. Trong buổi giới thiệu demo, chúng trông thật tuyệt vời, kỳ diệu và thông minh. Tuy nhiên, mọi người dường như không hiểu rõ về nguyên tắc, rằng những thứ như vậy không thể hoạt động theo cách mà chúng ta thổi phồng”, Chirag Shah tại Đại học Washington, chuyên gia nghiên cứu về công nghệ tìm kiếm, cho biết.

Khi được hỏi về lý do xóa bản demo, đại diện Meta lên tiếng: “Cảm ơn mọi người đã dùng thử bản demo mô hình Galactica. Chúng tôi đánh giá cao phản hồi từ cộng đồng và hiện đã tạm dừng”.

Một vấn đề lớn với Galactica là nó không thể phân biệt thật giả - nguyên tắc tối thiểu đối với một mô hình ngôn ngữ được thiết kế phục vụ khoa học. Theo Michael Black, Giám đốc Viện Hệ thống Thông minh Max Planck, Đức chuyên nghiên cứu về khoa học, “Trong mọi trường hợp, những thông tin sai lệch lại nghe có vẻ đúng và có căn cứ. Tôi nghĩ điều này rất nguy hiểm.”

“Đừng nên quá tin tưởng nó. Về cơ bản, hãy chỉ coi nó giống như một bản tìm kiếm nâng cao trên Google về các thông tin nguồn thứ cấp sơ sài!”, Miles Cranmer, một nhà vật lý thiên văn tại Princeton, nói.

Theo MIT Technology Review, Galactica cũng có những lỗ hổng trong việc xử lý thông tin. Khi được yêu cầu tạo văn bản về các chủ đề nhất định, chẳng hạn như “phân biệt chủng tộc” và “AIDS”, mô hình này đã trả lời: “Xin lỗi, truy vấn của bạn không vượt qua bộ lọc nội dung của chúng tôi. Hãy thử lại và ghi nhớ đây là mô hình ngôn ngữ khoa học.”

Điều này được coi như một sự thừa nhận rằng, các mô hình ngôn ngữ chưa thể, hay nói trắng ra là không bao giờ có thể làm được tất cả mọi thứ.

“Các mô hình ngôn ngữ không thực sự hiểu tất cả mọi thứ, trừ khả năng nắm bắt mẫu chuỗi từ và phát ra theo xác suất. Nó mang lại cảm giác sai lầm về trí tuệ”, Shah nói.

Đáp lại, nhóm Meta đằng sau Galactica lập luận rằng mô hình ngôn ngữ này tối ưu hơn các công cụ tìm kiếm: “Chúng tôi tin rằng đây sẽ là giao diện tiếp theo cho cách con người tiếp cận kiến thức khoa học”.

Gary Marcus, một nhà khoa học nhận thức tại Đại học New York đã đưa ra quan điểm của mình trong một bài đăng có tiêu đề “Một vài từ về những điều nhảm nhí”, rằng khả năng mô hình ngôn ngữ lớn bắt chước văn bản do con người viết chẳng là gì cả.

Meta công bố báo cáo tài chính quý III/2022 đáng thất vọng, đồng thời cho biết đang thực hiện “những thay đổi đáng kể” nhằm cắt giảm chi tiêu trước năm 2023.

Được biết, Meta không phải là công ty duy nhất ủng hộ quan điểm các mô hình ngôn ngữ có thể thay thế các công cụ tìm kiếm. Trong nhiều năm qua, Google cũng từng quảng bá mô hình ngôn ngữ PaLM như một cách để tra cứu thông tin. Đây là ý tưởng tích cực, song việc khẳng định sự tin cậy trong thông tin như những gì Meta đã làm khi quảng cáo Galactica là liều lĩnh và vô trách nhiệm.

Quay trở lại hồi năm 2016, Microsoft cũng tung ra một chatbot có tên Tay trên Twitter, sau đó lập tức gỡ xuống chỉ sau 16 giờ người dùng Twitter biến nó trở thành một sexbot phân biệt chủng tộc và kỳ thị người đồng tính.

“Các công ty công nghệ lớn tiếp tục làm điều này, và hãy ghi nhớ lời tôi nói, họ sẽ không dừng lại vì họ nghĩ mình có thể. Họ nghĩ đây sẽ là tương lai của thế giới truy cập thông tin, ngay cả khi không ai yêu cầu điều đó”, Shah nói.

Trước đó ít lâu, Meta đã công bố báo cáo tài chính quý III/2022 đáng thất vọng sau khi ghi nhận đà sụt giảm doanh thu, đồng thời đưa ra cảnh báo rằng họ đang thực hiện “những thay đổi đáng kể” nhằm cắt giảm chi tiêu trước năm 2023. Trong giai đoạn từ tháng 7 đến 9, tập đoàn này chỉ đạt doanh thu 27,7 tỷ USD, giảm 4% so với cùng kỳ năm ngoái. Công ty mẹ Facebook trước đó đã báo cáo mức sụt giảm doanh thu lần đầu trong lịch sử vào quý II.

Trong khi đó, lợi nhuận ròng Meta cũng không mấy khả quan khi chỉ đạt 4,4 tỷ USD, giảm hơn một nửa so với hồi năm ngoái. Tuy nhiên, đại diện Facebook vẫn lạc quan rằng lợi nhuận quý cuối năm 2022 sẽ bùng nổ, đạt 30-32,5 tỷ USD.

“Chúng tôi đang tiến đến năm 2023 với trọng tâm là ưu tiên sự hiệu quả. Nó sẽ giúp chúng tôi điều chỉnh định hướng hiện tại và xây dựng một công ty lớn mạnh hơn”, Mark Zuckerberg, Giám đốc điều hành Meta khẳng định. “Mặc dù chúng tôi phải đối mặt với những thách thức ngắn hạn về doanh thu, song các nguyên tắc cơ bản vẫn có thể giúp cải thiện tốc độ tăng trưởng doanh thu đáng kể”.

Theo: Bloomberg, MIT Technology Review