OpenAI ra mắt GPT-4 Turbo và chương trình tinh chỉnh cho GPT-4

Blog Change

Hôm nay, tại hội nghị nhà phát triển đầu tiên, OpenAI đã giới thiệu GPT-4 Turbo, một phiên bản cải tiến của mẫu AI tạo văn bản hàng đầu của họ, GPT-4 , mà công ty tuyên bố là vừa “mạnh hơn” vừa rẻ hơn.

GPT-4 Turbo có hai phiên bản: một phiên bản chuyên phân tích văn bản và phiên bản thứ hai hiểu ngữ cảnh của cả văn bản và hình ảnh. Mô hình phân tích văn bản có sẵn ở dạng xem trước thông qua API bắt đầu từ hôm nay và OpenAI cho biết họ có kế hoạch cung cấp cả hai mô hình này “trong vài tuần tới”.

Chúng có giá 0,01 USD cho mỗi 1.000 mã thông báo đầu vào (~750 từ), trong đó “mã thông báo” đại diện cho các bit của văn bản thô — ví dụ: từ “fantastic” ̣̣(tuyệt vời) được chia thành “fan”, “tas” và “tic”) và 0,03 USD mỗi mã. 1.000 mã thông báo đầu ra. ( Mã thông báo đầu vào là mã thông báo được đưa vào mô hình, trong khi mã thông báo đầu ra là mã thông báo mà mô hình tạo ra dựa trên mã thông báo đầu vào.) Giá của GPT-4 Turbo xử lý hình ảnh sẽ phụ thuộc vào kích thước hình ảnh. Ví dụ: chuyển một hình ảnh có độ phân giải 1080×1080 pixel sang GPT-4 Turbo sẽ có giá 0,00765 USD, OpenAI cho biết.

“Chúng tôi đã tối ưu hóa hiệu suất để có thể cung cấp GPT- 4 Turbo với mức giá rẻ hơn gấp 3 lần cho mã thông báo đầu vào và giá rẻ hơn gấp 2 lần cho mã thông báo đầu ra so với GPT-4,” OpenAI viết trong một bài đăng trên blog được chia sẻ với TechCrunch sáng nay.

GPT-4 Turbo tự hào có một số cải tiến so với GPT-4 - một trong số đó là cơ sở kiến thức mới hơn để sử dụng khi phản hồi các yêu cầu.

Giống như tất cả các mô hình ngôn ngữ, GPT-4 Turbo về cơ bản là một công cụ thống kê để dự đoán từ. Với vô số ví dụ, chủ yếu là từ web, GPT-4 Turbo đã học được khả năng xuất hiện của các từ dựa trên các mẫu, bao gồm cả ngữ cảnh ngữ nghĩa của văn bản xung quanh. Ví dụ: với một email thông thường kết thúc bằng đoạn “Đang chờ…” GPT-4 Turbo có thể hoàn thành nó bằng “… để nghe phản hồi”.

GPT-4 đã được đào tạo trên dữ liệu web cho đến tháng 9 năm 2021, nhưng điểm giới hạn kiến thức của GPT-4 Turbo là tháng 4 năm 2023. Điều đó có nghĩa là các câu hỏi về các sự kiện gần đây - ít nhất là các sự kiện đã xảy ra trước ngày giới hạn mới - sẽ mang lại kết quả câu trả lời chính xác hơn.

GPT-4 Turbo cũng có cửa sổ ngữ cảnh mở rộng.

Cửa sổ ngữ cảnh, được đo bằng mã thông báo, đề cập đến văn bản mà mô hình xem xét trước khi tạo bất kỳ văn bản bổ sung nào. Các mô hình có cửa sổ ngữ cảnh nhỏ có xu hướng “quên” nội dung của các cuộc trò chuyện thậm chí rất gần đây, khiến chúng lạc đề - thường theo những cách có vấn đề.

GPT-4 Turbo cung cấp cửa sổ ngữ cảnh 128.000 mã thông báo - gấp bốn lần kích thước của GPT-4 và là cửa sổ ngữ cảnh lớn nhất so với bất kỳ mẫu máy thương mại nào hiện có, vượt qua cả Claude 2 của Anthropic . (Claude 2 hỗ trợ tới 100.000 mã thông báo; Anthropic tuyên bố đang thử nghiệm cửa sổ ngữ cảnh 200.000 mã thông báo nhưng vẫn chưa phát hành công khai nó.) Thật vậy, 128.000 mã thông báo có nghĩa là khoảng 100.000 từ hoặc 300 trang, để tham khảo, độ dài này là khoảng của “Wuthering Heights”, “Gulliver's Travels” và “Harry Potter và Tù nhân ngục Azkaban.”

Và GPT-4 Turbo hỗ trợ "chế độ JSON" mới, đảm bảo rằng mô hình đáp ứng với JSON hợp lệ - định dạng tệp tiêu chuẩn mở và định dạng trao đổi dữ liệu. Điều đó rất hữu ích trong các ứng dụng web truyền dữ liệu, như những ứng dụng gửi dữ liệu từ máy chủ đến máy khách để nó có thể được hiển thị trên một trang web, OpenAI nói. Các thông số mới liên quan khác sẽ cho phép các nhà phát triển làm cho mô hình trả về các hoàn thành "nhất quán" nhiều thời gian hơn và - đối với các ứng dụng thích hợp hơn - ghi lại xác suất cho các mã thông báo đầu ra có khả năng nhất được tạo bởi GPT-4 Turbo.

"GPT-4 Turbo hoạt động tốt hơn các mô hình trước đây của chúng tôi về các tác vụ yêu cầu tuân theo các hướng dẫn cẩn thận, chẳng hạn như tạo các định dạng cụ thể (ví dụ: 'luôn phản hồi trong XML')", OpenAI viết. "Và GPT-4 Turbo có nhiều khả năng trả về các thông số chức năng phù hợp."

Nâng cấp GPT-4

OpenAI đã không bỏ qua GPT-4 trong việc tung ra GPT-4 Turbo.

Hôm nay, công ty đang triển khai chương trình truy cập thử nghiệm để tinh chỉnh GPT-4. Công ty cho biết, trái ngược với chương trình tinh chỉnh dành cho GPT-3.5 , tiền thân của GPT-4, chương trình GPT-4 sẽ có nhiều sự giám sát và hướng dẫn hơn từ các nhóm OpenAI - chủ yếu là do các rào cản kỹ thuật.

OpenAI viết trong bài đăng trên blog: “Các kết quả sơ bộ chỉ ra rằng việc tinh chỉnh GPT-4 đòi hỏi nhiều công sức hơn để đạt được những cải tiến có ý nghĩa so với mô hình cơ sở so với những lợi ích đáng kể nhận được khi tinh chỉnh GPT-3.5”.

Ở những nơi khác, OpenAI đã thông báo rằng họ sẽ tăng gấp đôi giới hạn tốc độ mã thông báo mỗi phút cho tất cả khách hàng trả tiền GPT-4. Nhưng giá sẽ giữ nguyên ở mức 0,03 USD cho mỗi mã thông báo đầu vào và 0,06 USD cho mỗi mã thông báo đầu ra (đối với mô hình GPT-4 có cửa sổ ngữ cảnh 8.000 mã thông báo) hoặc 0,06 USD cho mỗi mã thông báo đầu vào và 0,012 USD cho mỗi mã thông báo đầu ra (đối với GPT-4 với 32.000- cửa sổ ngữ cảnh mã thông báo).