Từ hôm nay, người dùng có thể sử dụng GPT-4o mini.
Mô hình AI nhỏ gọn mới nhất, GPT-4o mini, vừa được OpenAI
công bố. Theo OpenAI, GPT-4o mini, rẻ hơn và hoạt động nhanh hơn các mô hình AI
tiên tiến hiện tại, bắt đầu được cung cấp cho các nhà phát triển và người dùng
thông qua ứng dụng ChatGPT trên điện thoại và trên web. Vào tuần tới, nó dự
kiến đến tay người dùng doanh nghiệp.
Theo OpenAI, GPT-4o mini vượt trội trong các tác vụ văn bản
và thị giác so với các mô hình AI nhỏ hiện có. Do tốc độ và hiệu quả về chi phí
so với các mô hình AI lớn hơn, chẳng hạn như GPT-4 Omni hoặc Claude 3.5 Sonnet,
các mô hình AI nhỏ hơn được phát triển. Chúng rất hữu ích cho các nhiệm vụ đơn
giản và đòi hỏi mô hình AI phải thực hiện nhiều lần.
Mô hình nhỏ nhất của OpenAI sẽ là GPT-4o mini, thay thế cho GPT-3.5 Turbo. Theo
OpenAI, GPT-4o mini đạt điểm 82% trên MMLU, một điểm chuẩn để đánh giá khả năng
lý luận, so với 79% của Gemini 1.5 Flash và 75% của Claude 3 Haiku. Công cụ đo
lường khả năng toán học MGSM, GPT-4o mini đạt 87%, so với 78% và 72% của Flash
và Haiku.
Theo OpenAI, chi phí vận hành của GPT-4o mini thấp hơn 60% so với GPT-3.5 Turbo
và đáng kể thấp hơn so với các mô hình tiên tiến trước đó. Theo OpenAI, trong
tương lai, GPT-4o mini sẽ hỗ trợ xử lý hình ảnh và văn bản thông qua API. Ngoài
ra, nó có thể hỗ trợ xử lý video và âm thanh. Trong cuộc phỏng vấn với TechCrunch, Olivier Godement, Giám
đốc API Sản phẩm của OpenAI, nói: "Để mọi ngóc ngách trên thế giới được AI
hỗ trợ, chúng ta cần phải làm cho các mô hình trở nên dễ tiếp cận hơn
nhiều." "Tôi nghĩ GPT-4o mini là một tiến bộ rất lớn theo hướng
đó."
GPT-4o mini, được xây dựng trên API của OpenAI, có giá 15 cent cho mỗi triệu
token đầu vào và 60 cent cho mỗi triệu token đầu ra đối với các nhà phát triển.
Mô hình có cửa sổ ngữ cảnh 128.000 token, tương đương với một cuốn sách, và dữ liệu
được cập nhật đến tháng 10 năm 2023.
Mặc dù OpenAI không tiết lộ kích thước chính xác của GPT-4o mini, nhưng nó
tương đương với các mô hình AI nhỏ hơn như Gemini 1.5 Flash, Llama 3 8b và
Claude Haiku. Tuy nhiên, các bài kiểm tra trước khi ra mắt trên LMSYS.org, một
nền tảng thi đấu chatbot, cho thấy GPT-4o mini thông minh hơn, nhanh hơn và
tiết kiệm chi phí hơn so với các mô hình nhỏ nhất. Những bài kiểm tra đầu tiên
về độc lập dường như xác nhận điều này.
George Cameron, đồng sáng lập Artificial Analysis, nói trong email gửi
TechCrunch: "So với các mô hình tương đương, GPT-4o mini hoạt động rất
nhanh, với tốc độ xuất ra trung bình 202 token mỗi giây." Đây là một lựa
chọn hấp dẫn cho các trường hợp sử dụng phụ thuộc vào tốc độ, bao gồm nhiều ứng
dụng dành cho người tiêu dùng và các cách tiếp cận mới mẻ để sử dụng mô hình
ngôn ngữ lớn (LLM), với tốc độ gấp đôi so với GPT-4o và GPT-3.5 Turbo
Related Post