Công nghệ

Alibaba Cloud ra mắt mô hình mới Qwen3: Bước tiến mới của trí tuệ nhân tạo Trung Quốc

4
Alibaba Cloud ra mắt mô hình mới Qwen3: Bước tiến mới của trí tuệ nhân tạo Trung Quốc

Alibaba Cloud vừa chính thức ra mắt QWEN3-loạt các mô hình ngôn ngữ (LLM) mới nhất dự kiến ​​sẽ cạnh tranh trực tiếp với các tên tuổi hàng đầu trong lĩnh vực trí tuệ nhân tạo như Gemini-2.5-Pro, Grok-3, Deepseek-R1 và O3-Mini.

Điểm nổi bật của Qwen3

QWEN3 bao gồm 8 phiên bản, bao gồm 6 mẫu (từ 0,6 tỷ đến 32 tỷ tham số) và 2 mô hình MOE (hỗn hợp của các chuyên gia), QWEN3-30B-A3B và QWEN3-235B-A22B. Điểm nổi bật của dòng mô hình này là khả năng cân bằng chi phí tính toán và tính toán, giúp tối ưu hóa cả cá nhân và doanh nghiệp lớn.

alt=”” >

Mô hình mạnh nhất, QWEN3-235B-A22B đã đạt được kết quả ấn tượng về nhiều tiêu chí đánh giá có uy tín như Arenahard, AIME'24 và CodeForces ELO. Cụ thể, mô hình này đã ghi được 95,6 trên Arenahard, gần bằng Gemini 2.5 Pro (96,4) và vượt qua DeepSeek-R1. Đáng chú ý, trên CodeForces ELO, QWEN3-235B-A22B đạt 2056 điểm, vượt qua cả Gemini 2.5 Pro và Deepseek-R1, cho thấy khả năng đặc biệt mạnh mẽ trong các nhiệm vụ lập trình phức tạp.

alt=”” >

Trong khi đó, phiên bản MOE nhỏ hơn, QWEN3-30B-A3B, mặc dù chỉ được kích hoạt khoảng 10% tham số, vẫn vượt qua QWQ-32B trong nhiều thử nghiệm, bao gồm Arenahard (91,0 điểm so với 89,5 điểm QWQ-32B).

Phiên bản nhỏ nhất, QWEN3-4B, cũng cho thấy hiệu ứng đáng ngạc nhiên khi nó tương đương với công cụ hướng dẫn QWEN2.5-72B, mặc dù số lượng tham số thấp hơn nhiều.

Các tính năng đột phá và mã nguồn mở

Qwen3 được thiết kế với nhiều tính năng nổi bật, đặc biệt là chế độ suy nghĩ linh hoạt. Người dùng có thể kích hoạt chế độ tư duy cho các tác vụ phức tạp như toán học và lập trình hoặc các tính năng khác như tạo hình ảnh, video, tìm kiếm sâu (nghiên cứu sâu), ….

alt=”” >

Ngoài ra, Qwen3 sở hữu khả năng đa ngôn ngữ vượt trội với việc hỗ trợ hơn 100 ngôn ngữ và phương ngữ khác nhau, bao gồm cả tiếng Việt. Điều này làm cho Qwen3 rất phù hợp cho các ứng dụng toàn cầu, đặc biệt là trong các thị trường đa dạng văn hóa.

Alibaba Cloud đã quyết định mở mã nguồn hoàn toàn QWEN3 theo giấy phép Apache 2.0, cho phép cộng đồng công nghệ và doanh nghiệp dễ dàng truy cập, phát triển và triển khai các ứng dụng mới dựa trên nền tảng này. Người dùng quan tâm có thể tìm thấy các tài liệu hướng dẫn chi tiết và nguồn trên GitHub Qwen3 hoặc các nền tảng phổ biến như ôm mặt và mô đun.

Sự ra mắt của Qwen3 không chỉ đáp ứng nhu cầu ngày càng tăng về hiệu suất và hiệu quả chi phí trong lĩnh vực AI mà còn thúc đẩy sự phát triển của các mô hình ngôn ngữ mở. Cùng với các đối thủ khác như Llama 3.3 và Mistral Small 3, Qwen3 đang đóng góp quan trọng cho sự phổ biến và quảng bá các ứng dụng AI rộng rãi hơn trên thế giới. Qwen3 dự kiến ​​sẽ cạnh tranh trực tiếp với các tên tuổi hàng đầu trong lĩnh vực trí tuệ nhân tạo như Song Tử, Grok, Deepseek và Tatgpt.

https://www.youtube.com/watch?v=YHWWO4TXB1G

VVS_Voucher>

Xem thêm  Chip Dimensity 9400+ của MediaTek có thể ra mắt sớm hơn dự kiến, hứa hẹn khuấy đảo thị trường nửa đầu năm 2025

0 ( 0 bình chọn )

Trầm Hương Sài Gòn

https://tramhuongsg.com
Nơi tổng hợp các kiến thức cơ bản nhất về trầm hương mang đến cho bạn cái nhìn khái quát và hữu ích khi tìm hiểu về sản vật tuyệt tác của thiên nhiên này.

Ý kiến bạn đọc (0)

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Bài viết liên quan

Bài viết mới

Xem thêm