Cổ phiếu công nghệ lao dốc. Các công ty lớn như Meta và Nvidia phải đối mặt với hàng loạt câu hỏi về tương lai. Nhiều giám đốc điều hành trong giới công nghệ đã lên mạng xã hội để tuyên bố về nỗi sợ hãi của họ.

“AI giá rẻ” DeepSeek là gì và vì sao nó có khả năng đảo lộn thế giới trí tuệ nhân tạo?

Cổ phiếu công nghệ lao dốc. Các công ty lớn như Meta và Nvidia phải đối mặt với hàng loạt câu hỏi về tương lai. Nhiều giám đốc điều hành trong giới công nghệ đã lên mạng xã hội để tuyên bố về nỗi sợ hãi của họ.

AI giá rẻ DeepSeek là gì và vì sao nó có khả năng đảo lộn thế giới trí tuệ nhân tạo?Mô hình AI của DeepSeek gây chấn động vì có năng lực mạnh dù chi phí sản xuất rất thấp. (Nguồn: The Decoder)

Tất cả những chuyện trên diễn ra do tác động từ một công ty khởi nghiệp trí tuệ nhân tạo (AI) ít người biết đến của Trung Quốc có tên là DeepSeek.

DeepSeek đã thu hút sự chú ý của cả thế giới trong ngày 27/1 khi giới thiệu một trong những thành tựu của công ty: một mô hình AI rất mạnh mẽ, với chi phí chế tạo ít hơn nhiều so với những gì người ta tưởng, đặc biệt nếu so với các mô hình AI nổi tiếng khác như ChatGPT, Gemini.

DeepSeek đã mang tới một loạt câu hỏi, bao gồm việc liệu các công ty Mỹ có còn ở thế "cửa trên" trong lĩnh vực AI hay không?

Làm thế nào mà một công ty ít người biết đến lại có thể tạo ra tác động lớn như vậy? Sau đây là những điều cần biết về DeepSeek, công nghệ đứng sau nó và những tác động nó có thể tạo ra

DeepSeek là gì?

DeepSeek là một công ty khởi nghiệp, do công ty giao dịch chứng khoán Trung Quốc High-Flyer thành lập và nắm quyền sở hữu. Cả High-Flyer và DeepSeek đều do Liang Wenfeng, một doanh nhân người Trung Quốc điều hành. Mục tiêu của công ty là xây dựng hệ thống AI tương tự như chatbot ChatGPT của công ty OpenAI hoặc Gemini của Google.

Năm 2021, DeepSeek đã mua hàng nghìn chip máy tính từ nhà sản xuất chip Nvidia của Mỹ, đặt những viên gạch đầu tiên cho nỗ lực tạo ra hệ thống AI mạnh mẽ. Tại Trung Quốc, công ty này nổi tiếng với chính sách thu hút các nhà nghiên cứu AI trẻ và tài năng từ những trường đại học hàng đầu ở trong nước, hứa hẹn mức lương cao và cơ hội làm việc trong các dự án nghiên cứu tiên tiến.

Trong vài năm qua, DeepSeek đã phát hành một số mô hình ngôn ngữ lớn. Đây là loại công nghệ hỗ trợ các chatbot như ChatGPT và Gemini. Ngày 10/1 vừa qua, công ty đã phát hành ứng dụng chatbot miễn phí đầu tiên dựa trên một mô hình mới có tên là DeepSeek-V3.

Vì sao thị trường chứng khoán lại phản ứng mạnh với DeepSeek?

Ngay khi DeepSeek giới thiệu DeepSeek-V3, năng lực của chatbot này đã được đánh giá sánh ngang các chatbot tốt nhất từ ​​các công ty Mỹ như OpenAI và Google. Chỉ riêng điều này thôi cũng đã là một thành tích đặc biệt ấn tượng.

Nhưng nhóm nghiên cứu đằng sau hệ thống mới còn tiết lộ một bước tiến lớn hơn. Trong một bài báo khoa học giải thích cách xây dựng công nghệ AI, DeepSeek tiết lộ rằng công ty chỉ sử dụng một lượng nhỏ chip máy tính, so với lượng chip rất lớn mà các công ty AI hàng đầu ở Mỹ sử dụng để đào tạo hệ thống của họ.

Cụ thể hơn, các công ty hàng đầu thế giới thường đào tạo chatbot của họ bằng siêu máy tính sử dụng tới 16.000 con chip hoặc hơn thế. Tuy nhiên, các kỹ sư của DeepSeek cho biết họ chỉ cần sử dụng khoảng 2.000 chip do Nvidia sản xuất.

Tại sao việc dùng ít chip lại quan trọng?

Kể từ cuối năm 2022, khi OpenAI tạo ra cơn sốt AI mới, quan niệm phổ biến trong giới là không thể xây dựng được các hệ thống AI mạnh mẽ nhất nếu người ta không đầu tư hàng tỷ USD vào chip AI chuyên dụng. Điều đó có nghĩa là chỉ những công ty công nghệ lớn nhất, chẳng hạn như Microsoft, Google và Meta - tất cả đều có trụ sở tại Mỹ - mới đủ khả năng xây dựng các hệ thống AI hàng đầu.

Nhưng các kỹ sư của DeepSeek cho biết họ chỉ cần sức mạnh tính toán trị giá khoảng 6 triệu USD để đào tạo hệ thống mới của mình. Con số đó ít hơn khoảng 10 lần so với số tiền mà Meta đã chi để xây dựng công nghệ AI mới nhất của công ty.

Cách DeepSeek tạo ra công nghệ AI mạnh, dù dùng ít chip hơn?

New York Times trích phân tích của các kỹ sư AI hàng đầu tại Mỹ cho biết bài báo khoa học của DeepSeek đã nêu ra nhiều cách thức thông minh và ấn tượng để xây dựng công nghệ AI mạnh, với ít chip hơn. Nói ngắn gọn thì các kỹ sư của DeepSeek đã thể hiện một phương thức tiếp cận hiệu quả hơn, trong việc sử dụng chip để phân tích dữ liệu.

Các hệ thống AI hàng đầu hiện học các kỹ năng mới bằng cách xác định mẫu trong lượng dữ liệu khổng lồ bị trộn lẫn, bao gồm văn bản, hình ảnh và âm thanh. Trong khi đó, DeepSeek đã sử dụng một phương thức khác. Công ty đưa việc phân tích dữ liệu tới nhiều mô hình A.I. chuyên biệt hoạt động trong hệ thống chung — lối tiếp cận được giới nghiên cứu Mỹ gọi là phương pháp “sử dụng một tập thể với nhiều chuyên gia”. Phương pháp mới cũng giảm thiểu thời gian xử lý, do phải di chuyển mẫu so sánh dữ liệu từ kiểu này sang kiểu khác.

Trước đây từng có nơi đã sử dụng lối tiếp cận này. Nhưng việc di chuyển thông tin giữa các mô hình AI chuyên biệt có xu hướng làm giảm hiệu quả của hệ thống chung. DeepSeek đã tối ưu hóa hoạt động này, cho phép sử dụng ít sức mạnh tính toán hơn.

“Rõ ràng là không chỉ những công ty lớn như OpenAI, mà những doanh nghiệp khác cũng có thể xây dựng những hệ thống AI phức tạp”, Tim Dettmers, một nhà nghiên cứu tại Viện Trí tuệ nhân tạo Allen ở Seattle và là giáo sư khoa học máy tính tại Đại học Carnegie Mellon, đánh giá với New York Times. “DeepSeek đã sử dụng những lối tiếp cận mà bất kỳ ai cũng có thể sao chép”.

Bài báo khoa học của DeepSeek đặt ra câu hỏi quan trọng, về việc liệu các công ty lớn của Mỹ có thể duy trì vị trí dẫn đầu trong nghiên cứu AI hay không?

Công nghệ của DeepSeek có tốt như của đối thủ hàng đầu?

Theo các bài kiểm tra tiêu chuẩn, DeepSeek-V3 có thể trả lời nhiều câu hỏi, giải quyết các vấn đề logic và viết các chương trình máy tính, với hiệu quả tương đương bất kỳ sản phẩm AI nào đã có trên thị trường.

Ngay trước khi DeepSeek phát hành công nghệ của mình, OpenAI đã hé lộ thông tin về một hệ thống mới mang tên OpenAI o3, có vẻ mạnh hơn DeepSeek-V3. Nhưng OpenAI vẫn chưa cho đại bộ phận công chúng tiếp cận với hệ thống mới này.

OpenAI o3 được thiết kế để tự đưa ra lập luận thông qua các vấn đề liên quan đến toán học, khoa học và lập trình máy tính. Nhiều chuyên gia khi đó lên tiếng rằng DeepSeek chưa xây dựng một mô hình lập luận theo hướng này, thứ được xem như tương lai của AI. Nhưng chỉ tới ngày 20/1, DeepSeek đã phát hành mô hình với khả năng lập luận có tên là DeepSeek R1 và nó cũng gây ấn tượng rất tốt.

Đây dường như là điều khiến các nhà đầu tư Mỹ và những người khác hoảng sợ, gây tác động tới thị trường chứng khoán. Dường như họ đã nhận ra tầm quan trọng của công nghệ mới mà DeepSeek giới thiệu.

Dấu hỏi về vai trò của trung tâm dữ liệu lớn

Sau những gì DeepSeek đã cho thấy, liệu việc xây dựng nhiều trung tâm dữ liệu khổng lồ, trang bị hàng loạt chip AI chuyên dụng, mà các công ty công nghệ lớn ở Mỹ đang thực hiện, có còn là hướng tiếp cận đúng?

New York Times cho biết trước mắt thì câu trả lời vẫn là có.

Việc sở hữu một số lượng lớn chip AI vẫn có thể giúp các công ty theo nhiều cách khác nhau. Với nhiều chip hơn, họ có thể chạy nhiều thử nghiệm hơn khi khám phá những cách mới để xây dựng hệ thống AI. Nói cách khác, nhiều chip hơn vẫn có thể mang lại cho các công ty lợi thế về mặt kỹ thuật và cạnh tranh.

Các chuyên gia cũng cho rằng việc vận hành các mô hình AI với khả năng lập luận sẽ cần nhiều chip hơn. Nguyên nhân do những mô hình này đòi hỏi sức mạnh tính toán lớn hơn, khi ngày càng có nhiều người dùng và doanh nghiệp sử dụng chúng.

Không phải Mỹ đã giới hạn số lượng chip Nvidia bán cho Trung Quốc hay sao?

Đúng vậy. Để duy trì vị trí dẫn đầu của Mỹ trong cuộc đua AI toàn cầu, chính quyền Tổng thống Mỹ Joe Biden từng đưa ra các quy tắc hạn chế số lượng chip mạnh có thể bán cho Trung Quốc và các đối thủ khác.

Nhưng hiệu suất ấn tượng mà mô hình DeepSeek thể hiện đã đặt ra câu hỏi về những hậu quả không mong muốn hình thành từ các hạn chế thương mại của chính phủ Mỹ. Những biện pháp hạn chế đó buộc các nhà nghiên cứu ở Trung Quốc phải sáng tạo hơn khi sử dụng các công cụ có sẵn miễn phí trên Internet.

Một số chuyên gia tiếp tục ủng hộ các hạn chế thương mại của Mỹ, nói rằng chúng chỉ mới được áp dụng gần đây và về lâu dài sẽ có tác động lớn hơn đến khả nghiên cứu AI của Trung Quốc.

Có phải Trung Quốc đang vượt qua Mỹ về AI?

Không. Thế giới vẫn chưa được tiếp cận rộng rãi với mô hình o3 của OpenAI. Qua các bài kiểm tra chuẩn, mô hình này đã thể hiện hiệu suất cực kỳ ấn tượng, hơn bất kỳ mô hình nào khác có trên thị trường.

Nhưng các chuyên gia lo ngại rằng Trung Quốc đang vượt lên dẫn đầu về các hệ thống AI dùng nguồn mở.

AI mã nguồn mở là gì?

Giống như nhiều công ty khác, DeepSeek đã thực hiện “mã nguồn mở” với hệ thống AI mới nhất của mình. Điều này có nghĩa công ty chia sẻ toàn bộ mã máy tính nền tảng của hệ thống AI với các doanh nghiệp và nhà nghiên cứu khác. Việc chia sẻ công khai cho phép những người khác xây dựng và phân phối các sản phẩm của riêng họ, sử dụng chung một công nghệ do DeepSeek tạo ra.

Đây là một phần lý do khiến DeepSeek và những người khác ở Trung Quốc có thể xây dựng các hệ thống AI cạnh tranh, một cách nhanh chóng và không tốn kém.

Trong thế giới AI, mã nguồn mở lần đầu tiên thu hút sự chú ý vào năm 2023, khi Meta tự do chia sẻ một hệ thống AI có tên là Llama. Vào thời điểm đó, nhiều người cho rằng hệ sinh thái mã nguồn mở sẽ chỉ phát triển mạnh nếu các công ty như Meta - những doanh nghiệp lớn với trung tâm dữ liệu khổng lồ chứa đầy chip chuyên dụng - tiếp tục tiến hành cung cấp mã nguồn mở công nghệ của họ.

Nhưng DeepSeek và những công ty khác đã chỉ ra rằng hệ sinh thái này có thể phát triển theo những cách vượt ra ngoài các công ty công nghệ khổng lồ của Mỹ.

Tại sao mã nguồn mở lại quan trọng?

Nhiều chuyên gia ở Mỹ nêu ý kiến rằng các công ty lớn tại Mỹ không nên công khai mã nguồn công nghệ của mình, vì chúng có thể được sử dụng để phát tán thông tin sai lệch hoặc gây ra tác hại nghiêm trọng khác.

Nhưng cũng có những chuyên gia cho rằng nếu các cơ quan quản lý kìm hãm sự tiến bộ của công nghệ mã nguồn mở tại Mỹ, Trung Quốc sẽ giành được lợi thế đáng kể. Theo họ, nếu các công nghệ mã nguồn mở tốt nhất đến từ Trung Quốc, nhiều nhà nghiên cứu và công ty sẽ xây dựng hệ thống AI của họ trên các công nghệ đó.

Về lâu dài, điều này có thể đưa Trung Quốc vào trung tâm nghiên cứu và phát triển AI, giúp đẩy nhanh hơn nữa nỗ lực xây dựng nhiều công nghệ AI ngoài hoạt động dân sự, như vũ khí tự động và các hệ thống quân sự khác./.

Theo TTXVN



 {name} - {time}

 Trả lời

{body}
 {name} - {time}
{body}

0 bình luận

Ý kiến của bạn sẽ được biên tập trước khi đăng. Vui lòng gõ tiếng Việt có dấu

Địa phương

Xem thêm TP.Thanh Hóa

Thời tiết

Chia sẻ thông tin với bạn bè!
Tắt [X]