Chúng ta biết rất ít về cách các mô hình ngôn ngữ AI hoạt động

Blog Change

Các mô hình ngôn ngữ AI không phải là con người, nhưng chúng ta đánh giá chúng như thể con người, sử dụng các bài kiểm tra như kỳ thi thanh hoặc Kỳ thi cấp phép y tế Hoa Kỳ.

Các mô hình có xu hướng làm rất tốt trong các kỳ thi này, có lẽ vì các ví dụ về các kỳ thi như vậy có rất nhiều trong dữ liệu đào tạo của các mô hình. Như nhà nghiên cứu Will Douglas Heaven viết trong bài báo gần đây nhất của anh ấy, "một số người bị lóa mắt bởi những gì họ coi là tia sáng của trí thông minh giống như con người; Những người khác một chút cũng không tin."

Ngày càng có nhiều chuyên gia kêu gọi loại bỏ các thử nghiệm này, nói rằng chúng thúc đẩy sự cường điệu của AI và tạo ra "ảo tưởng rằng [các mô hình ngôn ngữ AI] có khả năng lớn hơn những gì thực sự tồn tại".

Điều nổi bật trong câu chuyện của Will là chúng ta biết rất ít về cách các mô hình ngôn ngữ AI hoạt động và tại sao chúng tạo ra những thứ chúng làm. Với những bài kiểm tra này, chúng ta đang cố gắng đo lường và tôn vinh "trí thông minh" của chúng dựa trên kết quả đầu ra của chúng, mà không hiểu đầy đủ cách chúng hoạt động bên trong.

Những điểm nổi bật khác:

Khuynh hướng đánh giá tính con người khiến mọi việc trở nên lộn xộn: "Mọi người đã đưa ra các bài kiểm tra về trí tuệ con người - bài kiểm tra IQ và các loại khác - cho máy móc từ ngay từ khi Trí tuệ Nhân tạo ra đời", như Melanie Mitchell, một nhà nghiên cứu Trí tuệ Nhân tạo tại Viện Santa Fe ở New Mexico nói. "Vấn đề suốt thời gian là ý nghĩa khi bạn thử nghiệm máy móc như thế này. Nó không có nghĩa giống như đối với con người."

Trẻ em so với GPT-3: Các nhà nghiên cứu tại Đại học California, Los Angeles, đã đưa cho GPT-3 một câu chuyện về một vị thần ma thuật chuyển đồ trang sức giữa hai chai và sau đó hỏi nó làm thế nào để chuyển kẹo cao su từ bát này sang bát khác, sử dụng các đồ vật như áp phích và ống các tông. Ý tưởng là câu chuyện gợi ý về cách giải quyết vấn đề. GPT-3 đề xuất các giải pháp phức tạp nhưng vô nghĩa về mặt cơ học. "Đây là điều mà trẻ em có thể dễ dàng giải quyết", Taylor Webb, một trong những nhà nghiên cứu cho biết.

Các mô hình ngôn ngữ AI không phải là con người: "Với các mô hình ngôn ngữ lớn tạo ra văn bản có vẻ giống con người, thật hấp dẫn khi cho rằng các bài kiểm tra tâm lý con người sẽ hữu ích để đánh giá chúng. Nhưng điều đó không đúng: các bài kiểm tra tâm lý con người dựa trên nhiều giả định có thể không phù hợp với các mô hình ngôn ngữ lớn", Laura Weidinger, một nhà khoa học nghiên cứu cao cấp tại Google DeepMind nói.

Bài học từ thế giới động vật: Lucy Cheke, một nhà tâm lý học tại Đại học Cambridge, Vương quốc Anh, cho rằng các nhà nghiên cứu AI có thể điều chỉnh các kỹ thuật được sử dụng để nghiên cứu động vật, đã được phát triển để tránh đi đến kết luận vội vàng dựa trên thành kiến của con người.

Không ai biết các mô hình ngôn ngữ hoạt động như thế nào: "Tôi nghĩ rằng vấn đề cơ bản là chúng ta tiếp tục tập trung vào kết quả kiểm tra hơn là cách bạn vượt qua các bài kiểm tra", Tomer Ullman, một nhà khoa học nhận thức tại Đại học Harvard nói.

Học sâu hơn

Google DeepMind đã đưa ra một công cụ watermarking cho hình ảnh do AI tạo ra

Google DeepMind đã ra mắt một công cụ đánh dấu mới gọi là SynthID, cho biết liệu hình ảnh có được tạo ra bằng Trí tuệ Nhân tạo hay không. Ban đầu, công cụ này sẽ chỉ có sẵn cho người dùng của công cụ tạo hình ảnh AI của Google, gọi là Imagen. Người dùng sẽ có khả năng tạo ra hình ảnh và sau đó chọn xem có thêm đánh dấu hay không. Hy vọng là điều này có thể giúp người dùng phân biệt khi nội dung được tạo ra bằng AI đang được trình bày như thực tế hoặc để bảo vệ quyền sở hữu.

Bước đầu tiên: Google DeepMind hiện là công ty Công nghệ Lớn đầu tiên công khai ra mắt một công cụ như vậy, theo sau sau một cam kết tự nguyện với Nhà Trắng để phát triển Trí tuệ Nhân tạo có trách nhiệm. Watermarking - một kỹ thuật mà bạn ẩn một tín hiệu trong một phần văn bản hoặc hình ảnh để xác định nó được tạo ra bằng Trí tuệ Nhân tạo - đã trở thành một trong những ý tưởng phổ biến nhất được đề xuất để kiềm chế các hại từ việc sử dụng AI. Đó là một bước khởi đầu tốt, nhưng Watermarking một mình sẽ không tạo ra nhiều sự tin tưởng hơn trên môi trường trực tuyến.

Bit & Byte

Các lựa chọn thay thế ChatGPT của Trung Quốc vừa được chấp thuận cho công chúng Baidu, một trong những công ty trí tuệ nhân tạo hàng đầu của Trung Quốc, đã tuyên bố sẽ mở quyền truy cập vào mô hình ngôn ngữ lớn giống như ChatGPT, Ernie Bot, cho công chúng. Phóng viên Zeyi Yang xem xét điều này có ý nghĩa gì đối với người dùng internet Trung Quốc. (Tạp chí Công nghệ MIT)

Cấy ghép não đã giúp tạo ra một hình đại diện kỹ thuật số của khuôn mặt của một người sống sót sau đột quỵ Tin tức đáng kinh ngạc. Hai bài báo trên tạp chí Nature cho thấy những tiến bộ lớn trong nỗ lực chuyển hoạt động của não thành lời nói. Các nhà nghiên cứu đã cố gắng giúp những phụ nữ bị mất khả năng nói chuyện giao tiếp trở lại với sự trợ giúp của cấy ghép não, thuật toán AI và hình đại diện kỹ thuật số. (Tạp chí Công nghệ MIT)

Bên trong thị trường khiêu dâm AI, nơi mọi thứ và mọi người đều được rao bán. Đây là một cuộc điều tra tuyệt vời xem xét cách sự bùng nổ AI tạo ra đã tạo ra một thị trường hạt giống cho nội dung khiêu dâm deepfake. Hoàn toàn có thể dự đoán được và đáng thất vọng vì chúng ta đã làm rất ít để ngăn chặn các tác hại trong cuộc sống thực như khiêu dâm deepfake và không có sự đồng thuận. (Truyền thông 404)

Một lực lượng lao động kỹ thuật số ở nước ngoài đang đẩy mạnh sự bùng nổ của Trí tuệ Nhân tạo. Hàng triệu người ở Philippines làm việc với tư cách là người chú thích dữ liệu, bao gồm 10.000 người cho nền tảng Remotasks thuộc sở hữu của Scale AI. Nhưng như cuộc điều tra này về điều kiện lao động đáng ngờ cho thấy, nhiều công nhân đang kiếm được dưới mức lương tối thiểu và đã bị trì hoãn, giảm hoặc hủy bỏ các khoản thanh toán. (Theo Washington Post)

Hòn đảo nhiệt đới với tên miền "nóng hổi". Sự bùng nổ của Trí tuệ Nhân tạo đã đồng nghĩa với việc Anguilla đã trúng số lớn với tên miền .ai của họ. Dự kiến rằng quốc gia này sẽ thu hàng triệu đô la từ các công ty muốn có cái danh hiệu sôi động này. (Bloomberg)