Search Suggest

OpenAI phát hành mô hình mini GPT-4o, thay thế cho GPT-3.5

Từ hôm nay, người dùng có thể sử dụng GPT-4o mini.

Mô hình AI nhỏ gọn mới nhất, GPT-4o mini, vừa được OpenAI công bố. Theo OpenAI, GPT-4o mini, rẻ hơn và hoạt động nhanh hơn các mô hình AI tiên tiến hiện tại, bắt đầu được cung cấp cho các nhà phát triển và người dùng thông qua ứng dụng ChatGPT trên điện thoại và trên web. Vào tuần tới, nó dự kiến đến tay người dùng doanh nghiệp. 


Theo OpenAI, GPT-4o mini vượt trội trong các tác vụ văn bản và thị giác so với các mô hình AI nhỏ hiện có. Do tốc độ và hiệu quả về chi phí so với các mô hình AI lớn hơn, chẳng hạn như GPT-4 Omni hoặc Claude 3.5 Sonnet, các mô hình AI nhỏ hơn được phát triển. Chúng rất hữu ích cho các nhiệm vụ đơn giản và đòi hỏi mô hình AI phải thực hiện nhiều lần.

Mô hình nhỏ nhất của OpenAI sẽ là GPT-4o mini, thay thế cho GPT-3.5 Turbo. Theo OpenAI, GPT-4o mini đạt điểm 82% trên MMLU, một điểm chuẩn để đánh giá khả năng lý luận, so với 79% của Gemini 1.5 Flash và 75% của Claude 3 Haiku. Công cụ đo lường khả năng toán học MGSM, GPT-4o mini đạt 87%, so với 78% và 72% của Flash và Haiku.

Theo OpenAI, chi phí vận hành của GPT-4o mini thấp hơn 60% so với GPT-3.5 Turbo và đáng kể thấp hơn so với các mô hình tiên tiến trước đó. Theo OpenAI, trong tương lai, GPT-4o mini sẽ hỗ trợ xử lý hình ảnh và văn bản thông qua API. Ngoài ra, nó có thể hỗ trợ xử lý video và âm thanh.

 Trong cuộc phỏng vấn với TechCrunch, Olivier Godement, Giám đốc API Sản phẩm của OpenAI, nói: "Để mọi ngóc ngách trên thế giới được AI hỗ trợ, chúng ta cần phải làm cho các mô hình trở nên dễ tiếp cận hơn nhiều." "Tôi nghĩ GPT-4o mini là một tiến bộ rất lớn theo hướng đó."

GPT-4o mini, được xây dựng trên API của OpenAI, có giá 15 cent cho mỗi triệu token đầu vào và 60 cent cho mỗi triệu token đầu ra đối với các nhà phát triển. Mô hình có cửa sổ ngữ cảnh 128.000 token, tương đương với một cuốn sách, và dữ liệu được cập nhật đến tháng 10 năm 2023.

Mặc dù OpenAI không tiết lộ kích thước chính xác của GPT-4o mini, nhưng nó tương đương với các mô hình AI nhỏ hơn như Gemini 1.5 Flash, Llama 3 8b và Claude Haiku. Tuy nhiên, các bài kiểm tra trước khi ra mắt trên LMSYS.org, một nền tảng thi đấu chatbot, cho thấy GPT-4o mini thông minh hơn, nhanh hơn và tiết kiệm chi phí hơn so với các mô hình nhỏ nhất. Những bài kiểm tra đầu tiên về độc lập dường như xác nhận điều này.

George Cameron, đồng sáng lập Artificial Analysis, nói trong email gửi TechCrunch: "So với các mô hình tương đương, GPT-4o mini hoạt động rất nhanh, với tốc độ xuất ra trung bình 202 token mỗi giây." Đây là một lựa chọn hấp dẫn cho các trường hợp sử dụng phụ thuộc vào tốc độ, bao gồm nhiều ứng dụng dành cho người tiêu dùng và các cách tiếp cận mới mẻ để sử dụng mô hình ngôn ngữ lớn (LLM), với tốc độ gấp đôi so với GPT-4o và GPT-3.5 Turbo

Related Post

Đăng nhận xét