Google đã chính thức công bố Gemini 2.5 Flash, phiên bản mới nhất trong mô hình Trí tuệ nhân tạo Song Tử. Đây là một bước quan trọng trong chiến lược phát triển AI của Google, với những cải thiện đáng kể về tốc độ, khả năng xử lý và chi phí vận hành.
Song Tử 2.5 Flash vừa bỏ. ⚡
Là một mô hình lý luận lai, bạn có thể kiểm soát mức độ 'nghĩ' tùy thuộc vào 💰 của bạn – làm cho nó trở nên lý tưởng cho Tass như xây dựng các ứng dụng trò chuyện, trích xuất dữ liệu và hơn thế nữa.
Thử một phiên bản sớm trong @Google AI Studio → https://t.co/izjnqmooh pic.twitter.com/gukbk5x3yz
– Google DeepMind (@googleeepmind) Ngày 17 tháng 4 năm 2025
Tối ưu hóa hiệu suất và chi phí
Gemini 2.5 Flash (Xem trước 04-17) đang trong giai đoạn thử nghiệm trên Google AI Studio và Vertex AI. Với thiết kế hướng tới cả nhà phát triển và doanh nghiệp, mô hình này nổi bật với khả năng xử lý nhanh và chi phí vận hành thấp.
“Đây là một mô hình được thiết kế để cân bằng hiệu suất và chi phí, phù hợp cho các ứng dụng tốc độ cao như chatbot, hệ thống tóm tắt thông tin tự động hoặc phân tích dữ liệu đa phương tiện”, Đại diện Google chia sẻ tại buổi ra mắt. Google cũng thông báo rằng họ sẽ cập nhật flash Gemini 2.5 cho người dùng Advanced Advanced trong tương lai gần, mở rộng cơ hội để tiếp cận cộng đồng người dùng phổ biến.
Tính năng mới “Ngân sách tư duy”
Điểm đột phá của Flash Song Tử 2.5 là tính năng “Ngân sách Suy nghĩ”. Đây là một công cụ cho phép người dùng hoặc lập trình viên điều chỉnh mức độ “đào tạo sâu” của AI, từ 0 đến 24.576 mã thông báo.
Với tính năng này, người dùng có thể:
- Mức thấp cho các câu hỏi đơn giản, nhận phản hồi nhanh với chi phí thấp
- Mức độ cao để phân tích phức tạp, yêu cầu khấu trừ sâu
- Hãy để bất cứ ai tự động xác định mức độ lý luận dựa trên sự phức tạp của yêu cầu
Khi tăng “ngân sách suy nghĩ”, chất lượng và chi tiết của phản hồi sẽ cao hơn, nhưng chi phí cũng tăng. Đây là lần đầu tiên người dùng được cung cấp trực tiếp với “suy nghĩ” của “suy nghĩ”.
Xử lý đa phương tiện nổi bật
Gemini 2.5 Flash chấp nhận một loạt các đầu vào bao gồm văn bản, hình ảnh, video và âm thanh, tạo đầu ra dưới dạng văn bản. Với cửa sổ cảnh hơn 1 triệu mã thông báo, mô hình có thể xử lý các tài liệu dài và phức tạp mà không mất độ chính xác.
Dữ liệu đào tạo của mô hình được cập nhật cho đến tháng 1 năm 2025, đảm bảo thông tin mới nhất được cung cấp tại thời điểm ra mắt.
Chi phí cạnh tranh
Google Định vị Song Tử 2.5 Flash là một trong những mô hình AI kinh tế nhất trên thị trường với khả năng lý luận:
- Theo mặc định (không theo lý luận sâu sắc): Mã thông báo $ 0,60/1 triệu
- Khi bật lý luận sâu sắc: 3,50 đô la/1 triệu mã thông báo
Giá này được cho là áp đảo các đối thủ của cùng một phân khúc với mô hình của Claude hoặc Openai, nhờ vào lợi thế của việc sở hữu toàn bộ chuỗi giá trị từ phần cứng (chip TPU), dữ liệu, cho nhân viên.
Triển vọng và ảnh hưởng
Sự ra mắt của Gemini 2.5 Flash đánh dấu một bước quan trọng trong chiến lược AI của Google. Với khả năng xử lý nhanh, chi phí thấp và đặc biệt là tính năng “Ngân sách tư duy” đột phá, mô hình này không chỉ mang lại giá trị lớn cho người dùng mà còn cho thấy tầm nhìn của Google trong việc phát triển phương pháp AI gần hơn với tất cả các đối tượng.
https://www.youtube.com/watch?v=UK5NCCKDHII
Ý kiến bạn đọc (0)