DeepSeek là gì và tại sao nó lại khiến ngành AI trên toàn thế giới chao đảo?

DeepSeek là gì và tại sao nó lại khiến ngành AI trên toàn thế giới chao đảo?

Nguyễn Tuấn Đạt

Nguyễn Tuấn Đạt

Junior Analyst

08:20 28/01/2025

DeepSeek, một startup AI của Trung Quốc mới chỉ hơn một năm tuổi, đã khiến Silicon Valley kinh ngạc và lo lắng sau khi trình diễn các mô hình trí tuệ nhân tạo đột phá với hiệu suất so sánh được với các chatbot hàng đầu thế giới, và chỉ tốn một phần nhỏ chi phí.

Sự xuất hiện của DeepSeek có thể phản bác lại niềm tin phổ biến rằng tương lai của AI sẽ đòi hỏi ngày càng nhiều năng lượng và sức mạnh để phát triển.

Cổ phiếu công nghệ toàn cầu đã lao dốc vào cuối tháng 1 khi sự đột phá của DeepSeek gây chấn động thị trường. Điều này đã khiến giới đầu tư lo ngại về triển vọng của các đối thủ Mỹ như OpenAI hay Meta, cũng như các nhà cung cấp phần cứng như Nvidia và ASML.

DeepSeek là gì?

DeepSeek được thành lập vào năm 2023 bởi Lương Văn Phong, người đứng đầu quỹ đầu tư định lượng dựa trên AI có tên High-Flyer. Công ty này phát triển các mô hình AI mã nguồn mở, nghĩa là cộng đồng nhà phát triển có thể kiểm tra và cải tiến phần mềm. Ứng dụng di động của DeepSeek đã vươn lên vị trí đầu bảng xếp hạng tải xuống trên iPhone tại Mỹ sau khi ra mắt vào đầu tháng 1.

Ứng dụng này khác biệt với các chatbot như ChatGPT của OpenAI ở chỗ nó diễn giải lý do trước khi đưa ra phản hồi cho một yêu cầu. Công ty tuyên bố rằng phiên bản R1 của họ đạt hiệu suất ngang với phiên bản mới nhất của OpenAI và đã cấp phép cho các cá nhân quan tâm phát triển chatbot dựa trên công nghệ này.

DeepSeek R1 so với OpenAI hoặc Meta AI thế nào?

Mặc dù công ty không tiết lộ đầy đủ chi tiết, chi phí đào tạo và phát triển các mô hình của DeepSeek dường như chỉ bằng một phần nhỏ so với OpenAI hoặc Meta Platforms. Hiệu quả vượt trội của mô hình này làm lung lay giả định rằng đầu tư lớn vào phần cứng là điều kiện bắt buộc để đạt được đột phá trong AI. Điều này cũng làm gia tăng sự chú ý đến các hạn chế xuất khẩu của Mỹ đối với các loại chip bán dẫn tiên tiến đến Trung Quốc – vốn được thiết kế để ngăn chặn những đột phá như những gì DeepSeek đang đại diện.

DeepSeek cho biết R1 đạt hiệu suất gần hoặc tốt hơn các mô hình đối thủ trong một số bảng xếp hạng hàng đầu như AIME 2024 cho các bài toán toán học, MMLU cho kiến thức tổng quát và AlpacaEval 2.0 cho hiệu suất hỏi-đáp. Nó cũng nằm trong nhóm dẫn đầu trên bảng xếp hạng Chatbot Arena liên kết với UC Berkeley.

Điều gì đang khiến Mỹ lo lắng?

Washington đã cấm xuất khẩu các công nghệ cao như chip GPU bán dẫn tới Trung Quốc nhằm ngăn chặn sự tiến bộ của nước này trong AI – lĩnh vực then chốt trong cuộc cạnh tranh công nghệ giữa Mỹ và Trung Quốc. Nhưng những bước tiến của DeepSeek cho thấy các kỹ sư AI Trung Quốc đã tìm cách vượt qua các hạn chế này, tập trung vào hiệu suất cao hơn với nguồn lực hạn chế.
Mặc dù chưa rõ DeepSeek được tiếp cận bao nhiêu phần cứng đào tạo AI tiên tiến, công ty này đã chứng minh rằng các biện pháp kiểm soát thương mại chưa hoàn toàn hiệu quả trong việc kìm hãm tiến bộ của Trung Quốc.

Khi nào DeepSeek bắt đầu thu hút sự chú ý toàn cầu?

Nhà phát triển AI này đã được theo dõi sát sao kể từ khi phát hành mô hình đầu tiên vào năm 2023. Vào tháng 11, DeepSeek giới thiệu mô hình lý luận R1, được thiết kế để mô phỏng tư duy của con người. Mô hình này là nền tảng của ứng dụng chatbot di động, cùng với giao diện web ra mắt vào tháng 1, đã nhanh chóng trở nên nổi tiếng toàn cầu như một giải pháp thay thế rẻ hơn cho OpenAI. Nhà đầu tư Marc Andreessen đã gọi đây là “khoảnh khắc Sputnik của AI.”

Ứng dụng di động DeepSeek đã được tải xuống 1.6 triệu lần tính đến ngày 25 tháng 1 và đứng đầu bảng xếp hạng App Store tại các quốc gia như Úc, Canada, Trung Quốc, Singapore, Mỹ và Anh, theo dữ liệu từ App Figures.

Người sáng lập DeepSeek là ai?

Sinh ra tại Quảng Đông năm 1985, Lương Văn Phong tốt nghiệp cử nhân và thạc sĩ ngành kỹ thuật điện tử và thông tin tại Đại học Chiết Giang. Ông thành lập DeepSeek với vốn đăng ký 10 triệu nhân dân tệ (1.4 triệu USD), theo cơ sở dữ liệu công ty Tianyancha.

Trong một cuộc phỏng vấn với 36kr, ông Lương cho rằng trở ngại lớn nhất để tiến xa hơn không phải là huy động vốn, mà là các hạn chế của Mỹ đối với việc tiếp cận chip tiên tiến nhất. Phần lớn các nhà nghiên cứu hàng đầu của ông đều là sinh viên mới tốt nghiệp từ các trường đại học hàng đầu Trung Quốc. Ông nhấn mạnh sự cần thiết phải xây dựng hệ sinh thái nội địa tương tự như hệ sinh thái xung quanh Nvidia và các chip AI của họ.

“Đầu tư nhiều hơn không nhất thiết dẫn đến nhiều đổi mới hơn. Nếu không, các công ty lớn sẽ nắm giữ toàn bộ sự đổi mới,” ông Lương nói.

Vị trí và vai trò của DeepSeek trong lĩnh vực AI tại Trung Quốc

Các tập đoàn công nghệ lớn của Trung Quốc như Alibaba Group, Baidu và Tencent đã đổ nhiều tiền của và nguồn lực vào cuộc đua giành khách hàng và phần cứng cho các dự án AI của họ. Cùng với startup 01.AI của Lý Khai Phục, DeepSeek nổi bật với cách tiếp cận mã nguồn mở – nhằm thu hút lượng người dùng lớn nhất nhanh chóng trước khi phát triển các chiến lược kiếm tiền dựa trên lượng khán giả đó.

DeepSeek đã tạo ra một bước ngoặt trong ngành AI tại Trung Quốc khi cung cấp các mô hình với chi phí phát triển thấp hơn đáng kể, từ đó đẩy mạnh áp lực cạnh tranh giữa các công ty lớn. Nhờ sự xuất hiện của DeepSeek, chi phí phát triển AI tại Trung Quốc đã giảm rõ rệt, mở ra cơ hội lớn cho các nhà phát triển nhỏ và thúc đẩy sự đổi mới trên diện rộng.

Hạn chế của DeepSeek là gì?

Giống như nhiều mô hình AI khác tại Trung Quốc, DeepSeek chịu sự kiểm duyệt chặt chẽ và né tránh các câu hỏi về những vấn đề nhạy cảm. Chatbot này từ chối trả lời về sự kiện Thiên An Môn năm 1989 hay khả năng Trung Quốc xâm lược Đài Loan, những chủ đề nằm trong danh sách kiểm duyệt nghiêm ngặt của chính phủ. Hạn chế này phản ánh một điểm yếu cố hữu của các công nghệ AI phát triển tại Trung Quốc, khi sự kiểm soát chặt chẽ có thể làm giảm sức cạnh tranh của chúng trên trường quốc tế.

Hạ tầng đám mây của DeepSeek cũng đang đối mặt với thách thức lớn do sự phổ biến đột ngột. Công ty đã gặp sự cố lớn vào ngày 27 tháng 1 và sẽ phải xử lý lưu lượng truy cập lớn hơn khi người dùng cũ và mới tiếp tục tăng.

Bloomberg

Broker listing

Thư mục bài viết

Cùng chuyên mục

Fed được dự đoán sẽ giữ nguyên lãi suất trong tuần này
Hoàng Thế Vinh

Hoàng Thế Vinh

Junior Analyst

Fed được dự đoán sẽ giữ nguyên lãi suất trong tuần này

Các quan chức Fed được dự đoán ​​sẽ giữ nguyên lãi suất trong tuần này, ''câu'' cho họ thêm thời gian để lạm phát hạ nhiệt và cũng có đủ thời gian để đánh giá các tác động về mặt chính sách của Tổng thống Donald Trump sẽ ảnh hưởng đến nền kinh tế như thế nào.
Mô hình AI của Deepseek - minh chứng cho câu "Cái khó ló cái khôn"
Nguyễn Tuấn Đạt

Nguyễn Tuấn Đạt

Junior Analyst

Mô hình AI của Deepseek - minh chứng cho câu "Cái khó ló cái khôn"

Phần mềm trí tuệ nhân tạo mạnh mẽ từ công ty khởi nghiệp Trung Quốc DeepSeek cho thấy công ty này đã xây dựng một mô hình cạnh tranh bất chấp những nỗ lực của Hoa Kỳ nhằm hạn chế sự phát triển công nghệ của Trung Quốc, làm dấy lên câu hỏi về hiệu quả của các biện pháp hạn chế thương mại của Washington.
Cổ phiếu công nghệ Mỹ lao dốc không phanh do cú sốc Deepseek
Nguyễn Tuấn Đạt

Nguyễn Tuấn Đạt

Junior Analyst

Cổ phiếu công nghệ Mỹ lao dốc không phanh do cú sốc Deepseek

DeepSeek, startup AI đến từ Hàng Châu, đã gây chấn động thế giới công nghệ khi mô hình R1 mới ra mắt của họ nhanh chóng vươn lên dẫn đầu bảng xếp hạng AI toàn cầu. Sự nổi tiếng bất ngờ này không chỉ khiến hệ thống của công ty quá tải mà còn tạo ra làn sóng bán tháo trên thị trường chứng khoán công nghệ, làm lung lay vị thế của các ông lớn như Nvidia và OpenAI.
Toàn cảnh thị trường crypto:  Ethereum thúc đẩy rollup mới, MicroStrategy đạt lợi nhuận khủng từ Bitcoin, Coinbase đề xuất cải cách niêm yết token
Trà Giang

Trà Giang

Junior Editor

Toàn cảnh thị trường crypto: Ethereum thúc đẩy rollup mới, MicroStrategy đạt lợi nhuận khủng từ Bitcoin, Coinbase đề xuất cải cách niêm yết token

Ethereum đang thúc đẩy chiến lược mở rộng với công nghệ rollup "based" và "native" để cải thiện bảo mật và tăng cường kết nối trong hệ sinh thái, trong khi MicroStrategy tiếp tục ghi nhận thành công lớn từ chiến lược đầu tư Bitcoin. Đồng thời, Coinbase đề xuất cải cách quy trình niêm yết token nhằm tối ưu hóa khả năng quản lý trong bối cảnh thị trường phát triển nhanh chóng, nhưng vẫn vấp phải ý kiến trái chiều từ các bên liên quan.
Forex Forecast - Diễn đàn dự báo tiền tệ