DeepSeek là gì và tại sao nó lại khiến ngành AI trên toàn thế giới chao đảo?
Nguyễn Tuấn Đạt
Junior Analyst
DeepSeek, một startup AI của Trung Quốc mới chỉ hơn một năm tuổi, đã khiến Silicon Valley kinh ngạc và lo lắng sau khi trình diễn các mô hình trí tuệ nhân tạo đột phá với hiệu suất so sánh được với các chatbot hàng đầu thế giới, và chỉ tốn một phần nhỏ chi phí.
Sự xuất hiện của DeepSeek có thể phản bác lại niềm tin phổ biến rằng tương lai của AI sẽ đòi hỏi ngày càng nhiều năng lượng và sức mạnh để phát triển.
Cổ phiếu công nghệ toàn cầu đã lao dốc vào cuối tháng 1 khi sự đột phá của DeepSeek gây chấn động thị trường. Điều này đã khiến giới đầu tư lo ngại về triển vọng của các đối thủ Mỹ như OpenAI hay Meta, cũng như các nhà cung cấp phần cứng như Nvidia và ASML.
DeepSeek là gì?
DeepSeek được thành lập vào năm 2023 bởi Lương Văn Phong, người đứng đầu quỹ đầu tư định lượng dựa trên AI có tên High-Flyer. Công ty này phát triển các mô hình AI mã nguồn mở, nghĩa là cộng đồng nhà phát triển có thể kiểm tra và cải tiến phần mềm. Ứng dụng di động của DeepSeek đã vươn lên vị trí đầu bảng xếp hạng tải xuống trên iPhone tại Mỹ sau khi ra mắt vào đầu tháng 1.
Ứng dụng này khác biệt với các chatbot như ChatGPT của OpenAI ở chỗ nó diễn giải lý do trước khi đưa ra phản hồi cho một yêu cầu. Công ty tuyên bố rằng phiên bản R1 của họ đạt hiệu suất ngang với phiên bản mới nhất của OpenAI và đã cấp phép cho các cá nhân quan tâm phát triển chatbot dựa trên công nghệ này.
DeepSeek R1 so với OpenAI hoặc Meta AI thế nào?
Mặc dù công ty không tiết lộ đầy đủ chi tiết, chi phí đào tạo và phát triển các mô hình của DeepSeek dường như chỉ bằng một phần nhỏ so với OpenAI hoặc Meta Platforms. Hiệu quả vượt trội của mô hình này làm lung lay giả định rằng đầu tư lớn vào phần cứng là điều kiện bắt buộc để đạt được đột phá trong AI. Điều này cũng làm gia tăng sự chú ý đến các hạn chế xuất khẩu của Mỹ đối với các loại chip bán dẫn tiên tiến đến Trung Quốc – vốn được thiết kế để ngăn chặn những đột phá như những gì DeepSeek đang đại diện.
DeepSeek cho biết R1 đạt hiệu suất gần hoặc tốt hơn các mô hình đối thủ trong một số bảng xếp hạng hàng đầu như AIME 2024 cho các bài toán toán học, MMLU cho kiến thức tổng quát và AlpacaEval 2.0 cho hiệu suất hỏi-đáp. Nó cũng nằm trong nhóm dẫn đầu trên bảng xếp hạng Chatbot Arena liên kết với UC Berkeley.
Điều gì đang khiến Mỹ lo lắng?
Washington đã cấm xuất khẩu các công nghệ cao như chip GPU bán dẫn tới Trung Quốc nhằm ngăn chặn sự tiến bộ của nước này trong AI – lĩnh vực then chốt trong cuộc cạnh tranh công nghệ giữa Mỹ và Trung Quốc. Nhưng những bước tiến của DeepSeek cho thấy các kỹ sư AI Trung Quốc đã tìm cách vượt qua các hạn chế này, tập trung vào hiệu suất cao hơn với nguồn lực hạn chế.
Mặc dù chưa rõ DeepSeek được tiếp cận bao nhiêu phần cứng đào tạo AI tiên tiến, công ty này đã chứng minh rằng các biện pháp kiểm soát thương mại chưa hoàn toàn hiệu quả trong việc kìm hãm tiến bộ của Trung Quốc.
Khi nào DeepSeek bắt đầu thu hút sự chú ý toàn cầu?
Nhà phát triển AI này đã được theo dõi sát sao kể từ khi phát hành mô hình đầu tiên vào năm 2023. Vào tháng 11, DeepSeek giới thiệu mô hình lý luận R1, được thiết kế để mô phỏng tư duy của con người. Mô hình này là nền tảng của ứng dụng chatbot di động, cùng với giao diện web ra mắt vào tháng 1, đã nhanh chóng trở nên nổi tiếng toàn cầu như một giải pháp thay thế rẻ hơn cho OpenAI. Nhà đầu tư Marc Andreessen đã gọi đây là “khoảnh khắc Sputnik của AI.”
Ứng dụng di động DeepSeek đã được tải xuống 1.6 triệu lần tính đến ngày 25 tháng 1 và đứng đầu bảng xếp hạng App Store tại các quốc gia như Úc, Canada, Trung Quốc, Singapore, Mỹ và Anh, theo dữ liệu từ App Figures.
Người sáng lập DeepSeek là ai?
Sinh ra tại Quảng Đông năm 1985, Lương Văn Phong tốt nghiệp cử nhân và thạc sĩ ngành kỹ thuật điện tử và thông tin tại Đại học Chiết Giang. Ông thành lập DeepSeek với vốn đăng ký 10 triệu nhân dân tệ (1.4 triệu USD), theo cơ sở dữ liệu công ty Tianyancha.
Trong một cuộc phỏng vấn với 36kr, ông Lương cho rằng trở ngại lớn nhất để tiến xa hơn không phải là huy động vốn, mà là các hạn chế của Mỹ đối với việc tiếp cận chip tiên tiến nhất. Phần lớn các nhà nghiên cứu hàng đầu của ông đều là sinh viên mới tốt nghiệp từ các trường đại học hàng đầu Trung Quốc. Ông nhấn mạnh sự cần thiết phải xây dựng hệ sinh thái nội địa tương tự như hệ sinh thái xung quanh Nvidia và các chip AI của họ.
“Đầu tư nhiều hơn không nhất thiết dẫn đến nhiều đổi mới hơn. Nếu không, các công ty lớn sẽ nắm giữ toàn bộ sự đổi mới,” ông Lương nói.
Vị trí và vai trò của DeepSeek trong lĩnh vực AI tại Trung Quốc
Các tập đoàn công nghệ lớn của Trung Quốc như Alibaba Group, Baidu và Tencent đã đổ nhiều tiền của và nguồn lực vào cuộc đua giành khách hàng và phần cứng cho các dự án AI của họ. Cùng với startup 01.AI của Lý Khai Phục, DeepSeek nổi bật với cách tiếp cận mã nguồn mở – nhằm thu hút lượng người dùng lớn nhất nhanh chóng trước khi phát triển các chiến lược kiếm tiền dựa trên lượng khán giả đó.
DeepSeek đã tạo ra một bước ngoặt trong ngành AI tại Trung Quốc khi cung cấp các mô hình với chi phí phát triển thấp hơn đáng kể, từ đó đẩy mạnh áp lực cạnh tranh giữa các công ty lớn. Nhờ sự xuất hiện của DeepSeek, chi phí phát triển AI tại Trung Quốc đã giảm rõ rệt, mở ra cơ hội lớn cho các nhà phát triển nhỏ và thúc đẩy sự đổi mới trên diện rộng.
Hạn chế của DeepSeek là gì?
Giống như nhiều mô hình AI khác tại Trung Quốc, DeepSeek chịu sự kiểm duyệt chặt chẽ và né tránh các câu hỏi về những vấn đề nhạy cảm. Chatbot này từ chối trả lời về sự kiện Thiên An Môn năm 1989 hay khả năng Trung Quốc xâm lược Đài Loan, những chủ đề nằm trong danh sách kiểm duyệt nghiêm ngặt của chính phủ. Hạn chế này phản ánh một điểm yếu cố hữu của các công nghệ AI phát triển tại Trung Quốc, khi sự kiểm soát chặt chẽ có thể làm giảm sức cạnh tranh của chúng trên trường quốc tế.
Hạ tầng đám mây của DeepSeek cũng đang đối mặt với thách thức lớn do sự phổ biến đột ngột. Công ty đã gặp sự cố lớn vào ngày 27 tháng 1 và sẽ phải xử lý lưu lượng truy cập lớn hơn khi người dùng cũ và mới tiếp tục tăng.
Bloomberg