(Baothanhhoa.vn) - Công ty công nghệ Trung Quốc Alibaba vừa phát hành phiên bản mới của mô hình trí tuệ nhân tạo Qwen 2.5 mà họ tuyên bố là vượt trội hơn DeepSeek-V3.

Alibaba phát hành mô hình AI vượt trội hơn DeepSeek

Công ty công nghệ Trung Quốc Alibaba vừa phát hành phiên bản mới của mô hình trí tuệ nhân tạo Qwen 2.5 mà họ tuyên bố là vượt trội hơn DeepSeek-V3.

Alibaba phát hành mô hình AI vượt trội hơn DeepSeek

Qwen 2.5 được phát hành vào ngày đầu tiên của Tết Nguyên đán khi hầu hết người dân Trung Quốc được nghỉ làm và ở bên gia đình, cho thấy áp lực mà sự phát triển chóng mặt của công ty khởi nghiệp AI Trung Quốc DeepSeek trong 3 tuần qua không chỉ đặt lên các đối thủ nước ngoài mà còn lên cả đối thủ cạnh tranh trong nước.

"Qwen 2.5 vượt trội hầu hết các mô hình GPT, DeepSeek-V3 và Llama-3.1", Alibaba cho biết trong thông báo đăng trên tài khoản WeChat chính thức của mình, đề cập đến các mô hình AI nguồn mở tiên tiến nhất của OpenAI và Meta.

Việc phát hành DeepSeek vào ngày 10/1, sử dụng mô hình DeepSeek-V3, cũng như việc phát hành mô hình R1 vào ngày 20/1 đã gây chấn động Thung lũng Silicon và khiến cổ phiếu công nghệ lao dốc, với chi phí phát triển và sử dụng được cho là thấp của công ty khởi nghiệp Trung Quốc này khiến các nhà đầu tư đặt câu hỏi về kế hoạch chi tiêu khổng lồ của các công ty AI hàng đầu tại Hoa Kỳ.

Nhưng thành công của DeepSeek cũng dẫn đến một cuộc chạy đua giữa các đối thủ cạnh tranh trong nước để nâng cấp các mô hình AI của riêng họ.

Hai ngày sau khi phát hành DeepSeek-R1, chủ sở hữu TikTok là ByteDance đã phát hành bản cập nhật cho mô hình AI hàng đầu của mình, được cho là vượt trội hơn của OpenAI do Microsoft hậu thuẫn trong AIME, một bài kiểm tra chuẩn đánh giá mức độ hiểu và phản hồi của các mô hình AI với các hướng dẫn phức tạp.

Điều này lặp lại tuyên bố của DeepSeek rằng mô hình R1 của họ có thể sánh ngang với mô hình của OpenAI trên một số điểm chuẩn hiệu suất.

Tiền thân của mô hình V3 của DeepSeek, DeepSeek-V2, đã gây ra một cuộc chiến về giá mô hình AI tại Trung Quốc sau khi được phát hành vào tháng 5 năm ngoái.

Thực tế là DeepSeek-V2 là mã nguồn mở và có giá rẻ chưa từng có, chỉ 1 nhân dân tệ (0,14 đô la) cho 1 triệu token - hoặc đơn vị dữ liệu được xử lý bởi mô hình AI - đã khiến Alibaba phải công bố mức giảm giá lên tới 97% cho một loạt các mô hình.

Liang Wenfeng, nhà sáng lập bí ẩn của DeepSeek, cho biết trong một cuộc phỏng vấn hiếm hoi với hãng truyền thông Trung Quốc Waves rằng công ty khởi nghiệp này “không quan tâm” đến cuộc chiến giá cả và việc đạt được AGI (trí tuệ nhân tạo tổng quát) là mục tiêu chính của họ.

OpenAI định nghĩa AGI là các hệ thống tự động vượt trội hơn con người trong hầu hết các nhiệm vụ có giá trị kinh tế.

Trong khi các công ty công nghệ lớn của Trung Quốc như Alibaba có hàng trăm nghìn nhân viên, DeepSeek hoạt động như một phòng thí nghiệm nghiên cứu, chủ yếu gồm những sinh viên mới tốt nghiệp và nghiên cứu sinh tiến sĩ từ các trường đại học hàng đầu Trung Quốc.

Trong cuộc phỏng vấn, Liang cho biết ông tin rằng các công ty công nghệ lớn nhất Trung Quốc có thể không phù hợp với tương lai của ngành công nghiệp AI, khi so sánh chi phí cao và cơ cấu áp đặt từ trên xuống của họ với hoạt động tinh gọn và phong cách quản lý của DeepSeek.

Ông cho biết: “Các mô hình nền tảng lớn đòi hỏi sự đổi mới liên tục, còn khả năng của những gã khổng lồ công nghệ thì có giới hạn”.

TD (theo Reuters)


TD (theo Reuters)

 {name} - {time}

 Trả lời

{body}
 {name} - {time}
{body}

0 bình luận

Ý kiến của bạn sẽ được biên tập trước khi đăng. Vui lòng gõ tiếng Việt có dấu

Địa phương

Xem thêm TP.Thanh Hóa

Thời tiết

Chia sẻ thông tin với bạn bè!
Tắt [X]