Cuộc đua AI toàn cầu: Mỹ - Trung Quốc, ai sẽ là người chiến thắng?

Thái Linh
Junior Editor
Vào ngày thứ Hai, cả thế giới đã chứng kiến 1 nghìn tỷ USD bị xóa sổ khỏi thị trường chứng khoán chỉ trong một ngày, và người đứng sau việc này chính là công ty khởi nghiệp trí tuệ nhân tạo ít được biết đến của Trung Quốc, DeepSeek.

Việc công ty này phát hành một mô hình AI mới, được gọi là R1, đã đảo ngược các giả định về sự vượt trội của Mỹ trong lĩnh vực AI và làm dấy lên triển vọng rằng một số người ở Trung Quốc đang học cách đánh bại Thung lũng Silicon tại trò chơi của chính họ.
Mô hình này có thể "lập luận" để giải quyết các vấn đề khoa học phức tạp với khả năng hoạt động ngang bằng phần mềm tiên tiến từ các gã khổng lồ ngành công nghệ Hoa Kỳ, nhưng dường như lại được phát triển với một phần nhỏ chi phí của các mô hình đó.
DeepSeek nhanh chóng truất ngôi ChatGPT của OpenAI, trở thành ứng dụng miễn phí được tải xuống nhiều nhất trên App Store iOS của Hoa Kỳ.
Bên cạnh thách thức địa chính trị, bước đột phá của DeepSeek có hai ý nghĩa đối với ngành công nghệ. Thứ nhất, điều này có thể sẽ đẩy nhanh quá trình phát triển và ứng dụng thương mại của AI, giống như ChatGPT đã làm vào năm 2022.
Cổ phiếu các công ty công nghệ AI lớn sau khi DeepSeek bứt phá
Đồng thời, DeepSeek có thể phá vỡ các giả định đầu tư đã làm nền móng cho toàn bộ thị trường chứng khoán Hoa Kỳ, dường như cho thấy rằng việc phát triển các mô hình AI tiên tiến không đòi hỏi một lượng lớn cơ sở hạ tầng và vốn.
Câu hỏi đang được đặt ra với sự cấp bách bao trùm từ California đến Phố Wall: Liệu Trung Quốc đã bắt kịp trong lĩnh vực AI vào đúng thời điểm mà nhiều người làm việc trong lĩnh vực này tuyên bố rằng họ đang tiến gần đến bước đột phá lịch sử để đưa máy móc ngang hàng với trí thông minh của con người - một ngưỡng được gọi là trí tuệ nhân tạo tổng quát (AGI)?
"Những đổi mới trong thuật toán [của DeepSeek] cho thấy rằng Trung Quốc và Hoa Kỳ đang cạnh tranh nhau và lợi thế công nghệ của chúng ta không được đảm bảo, điều này càng thúc đẩy ngành công nghiệp của chúng ta làm cho AI hiệu quả hơn," Eric Schmidt, cựu giám đốc điều hành và chủ tịch của Google, cho biết.
"Để đạt được AGI trước tiên, chúng ta cần tiếp tục đầu tư vào nhân tài, hỗ trợ hệ sinh thái mã nguồn mở và đảm bảo chúng ta không chỉ chi tiêu nhiều hơn, mà còn đổi mới nhiều hơn so với các đối thủ cạnh tranh."
DeepSeek được thành lập với tham vọng tương tự như ở Thung lũng Silicon. Công ty này bắt đầu vào năm 2023 như một dự án phụ của tỷ phú quỹ phòng hộ Liang Wenfeng, ngay khi cuộc đua sao chép ChatGPT đang nóng lên. Kể từ đó, DeepSeek đã trở thành một trong những phòng thí nghiệm AI hàng đầu của Trung Quốc.
"Tại sao Thung lũng Silicon lại có khả năng đổi mới như vậy? Bởi vì họ dám làm mọi thứ," ông Liang nói trong một cuộc phỏng vấn năm ngoái. "Khi ChatGPT ra mắt, cộng đồng công nghệ ở Trung Quốc thiếu tự tin vào sự đổi mới tiên phong."
Ông nói thêm: "Từ các nhà đầu tư đến các công ty công nghệ lớn [của Trung Quốc], tất cả họ đều nghĩ rằng khoảng cách là quá lớn và chọn tập trung vào các ứng dụng. Nhưng sự đổi mới bắt đầu bằng sự tự tin."
Khi các quỹ nhà nước ở Trung Quốc đảm nhận vai trò lớn hơn trong việc tài trợ cho các công ty khởi nghiệp trong vài năm qua, hệ sinh thái khởi nghiệp cảm thấy áp lực hơn khi phải đảm bảo lợi nhuận vì sợ mất tài sản của đất nước.
DeepSeek khác biệt so với các công ty khởi nghiệp AI khác của Trung Quốc khi không huy động bất kỳ nguồn vốn bên ngoài nào và do đó không bị ràng buộc bởi những hạn chế này.
Là một phòng thí nghiệm nghiên cứu thuần túy, giống với những ngày đầu của DeepMind ở Anh và OpenAI ở Hoa Kỳ, DeepSeek đã tập trung tất cả nỗ lực vào việc thúc đẩy lĩnh vực AI tiến lên, thay vì cố gắng kiếm tiền. Mặc dù tự hào về việc hoàn toàn được thành lập dựa trên nhân tài trong nước, công ty này đã áp dụng một nền văn hóa thường thấy ở trung tâm công nghệ Hoa Kỳ.
"DeepSeek rất khác biệt so với các công ty AI Trung Quốc," một nhà đầu tư AI ở Trung Quốc cho biết. "Không có xung đột về mặt chính trị hay quản lý như ở các công ty công nghệ lớn và các công ty khởi nghiệp khác. Mọi người không có chức danh cụ thể hoặc một quy trình báo cáo cố định."
Với nguồn gốc là một quỹ phòng hộ định lượng, DeepSeek có những nhân tài kỹ thuật với hiểu biết sâu sắc về chip. Bước đột phá của công ty này xoay quanh thành công rõ ràng trong việc đào tạo các mô hình AI tiên tiến mà không tốn hàng trăm triệu USD như các đối thủ Hoa Kỳ.
Họ tuyên bố rằng bước đào tạo cuối cùng cho R1 chỉ tốn 5.6 triệu USD. Tuy nhiên, con số này không bao gồm nhiều chi phí khác liên quan đến việc phát triển các mô hình, bao gồm cơ sở hạ tầng điện toán và các lần đào tạo trước đó, khiến việc so sánh chính xác trở nên khó khăn.
Họ cũng có thể đã cắt giảm chi phí: OpenAI tuyên bố có bằng chứng cho thấy DeepSeek đã được đào tạo dựa trên đầu ra từ các mô hình của chính OpenAI - điều này không được phép theo các điều khoản sử dụng, mặc dù một số công ty Mỹ được cho là cũng đã thực hiện hành vi này.
Trớ trêu thay, nỗ lực của ông Washington nhằm kìm hãm lĩnh vực AI ở Trung Quốc bằng cách áp đặt kiểm soát xuất khẩu đối với chip cao cấp của Hoa Kỳ từ năm 2022 trở đi có thể đã góp phần vào bước đột phá của DeepSeek.
Nếu không có quyền truy cập vào silicon tiên tiến, công ty buộc phải tìm ra những cách sáng tạo để tận dụng hiệu suất cao hơn từ các chip ít tinh vi hơn mà họ có thể mua.
Những tuyên bố của công ty về chi phí thấp và khả năng tiên tiến của các mô hình đã gây ra một cuộc tranh luận sôi nổi về mức độ đột phá của DeepSeek. Các nhà lãnh đạo của Thung lũng Silicon đã bày tỏ sự kính trọng đối với những đổi mới đáng kể này, nhưng đồng thời cũng hạ thấp ý nghĩa của những thay đổi đó.
Giám đốc điều hành của OpenAI, Sam Altman, gọi mô hình R1 là "ấn tượng", trong khi Mark Zuckerberg, giám đốc điều hành của Meta, ghi nhận công ty đã đạt được "những tiến bộ mà chúng tôi hy vọng sẽ triển khai trong hệ thống của mình".
Tuy nhiên, ông Zuckerberg cũng coi bước đột phá của DeepSeek chỉ là một trong số rất nhiều bước đột phá trong một lĩnh vực đang phát triển với tốc độ chóng mặt, khiến việc biết được cách tiếp cận chi phí thấp sẽ thay đổi động lực của ngành sâu sắc như thế nào là rất khó nói.
Theo một số nhà quan sát công nghệ Trung Quốc, những tiến bộ của DeepSeek không đủ quan trọng để thay đổi sự thật rằng các công ty AI của đất nước này phần lớn dành thời gian cho việc mô phỏng các đối tác Hoa Kỳ thay vì tự thiết lập hướng đi.
"DeepSeek dường như cũng đang mô phỏng lại các đối thủ Hoa Kỳ. Điều thực sự sẽ xoay chuyển tình thế trong cuộc cạnh tranh Mỹ-Trung là nếu họ xây dựng thứ gì đó thực sự đẩy lùi giới hạn. Chúng ta sẽ xem liệu họ có đạt được điều đó không," Helen Toner, một nhà phân tích chính sách AI tại Trung tâm An ninh và Công nghệ Mới nổi của Georgetown, và là cựu thành viên hội đồng quản trị tại OpenAI, cho biết.
Tuy nhiên, những người khác nói rằng việc một công ty khởi nghiệp công nghệ Trung Quốc đứng đằng sau bước tiến gây chấn động này thể hiện một khoảnh khắc bước ngoặt, thay đổi cán cân trong cuộc đua AI giữa hai quốc gia.
"Các mô hình mới nhất của DeepSeek có thể không mang ý nghĩa rằng Trung Quốc đang vượt lên trước Hoa Kỳ trong cuộc đua AI, nhưng điều này chứng minh rằng các công ty Trung Quốc đang đạt được những bước tiến đáng kể trong đổi mới phần mềm, giúp giảm bớt những hạn chế do kiểm soát xuất khẩu của Mỹ," Tilly Zhang, một nhà phân tích công nghệ Trung Quốc tại Gavekal Dragonomics, một công ty nghiên cứu tập trung vào Trung Quốc, đã viết trong một ghi chú được công bố tuần này.
"Cuộc đua giành vị trí dẫn đầu AI không còn chỉ là ai sở hữu chip tốt nhất, mà là ai sử dụng chip tốt nhất."
Trong khi tầm quan trọng của những đột phá kỹ thuật đến từ DeepSeek vẫn là một vấn đề gây tranh cãi, thị trường chứng khoán đã trải qua một “làn sóng chấn động” khi các nhà đầu tư nhận ra ý nghĩa của sự đổi mới này: giảm đáng kể chi phí đào tạo cho các mô hình AI tiên tiến nhất.
Các mô hình của DeepSeek dường như làm suy yếu lập luận mà các công ty AI Hoa Kỳ đã đưa ra trong năm qua: rằng những tiến bộ của AI đòi hỏi một lượng lớn vốn và cơ sở hạ tầng để phát triển và triển khai công nghệ ở quy mô lớn.
Thay vào đó, DeepSeek đã cho thấy rằng các mô hình do Hoa Kỳ phát triển sẽ có rất ít điểm khác biệt nhưng lại đắt đỏ hơn nhiều, làm dấy lên lo ngại trong giới đầu tư về một cú sốc giảm phát mạnh.
"Đây từng là điểm đặc biệt của Mỹ - rằng chỉ có Mỹ mới có công nghệ này, và chỉ có người Mỹ mới có tiền để làm điều này," Jim Tierney, một nhà đầu tư cổ phiếu tăng trưởng của Hoa Kỳ tại Alliance Bernstein, cho biết. "Sự phổ biến hóa của các mô hình này đang diễn ra nhanh hơn chúng ta nghĩ."
Phần lớn Thung lũng Silicon tin rằng những người khác trong ngành sẽ nhanh chóng sao chép những đổi mới của DeepSeek, làm giảm chi phí đào tạo các mô hình AI. Các giám đốc điều hành như Satya Nadella của Microsoft tuyên bố rằng điều này sẽ làm cho giá cả công nghệ trở nên hợp lí hơn cho khách hàng, từ đó tăng cường việc sử dụng - điều sẽ mang lại lợi ích cho toàn bộ ngành.
Như một dấu hiệu cho thấy sự tự tin của công ty về vị thế của mình, DeepSeek đã công bố nghiên cứu và phát hành các mô hình của họ dưới dạng "open-weights", một phiên bản hạn chế hơn của phần mềm mã nguồn mở cho phép bất kỳ ai cũng có thể tải xuống, sử dụng và chỉnh sửa công nghệ này.
Động thái này sẽ thu hút một lượng lớn các nhà phát triển phần mềm đang tìm kiếm mô hình "mở" để xây dựng ứng dụng. Hầu hết mô hình được phát triển bởi các công ty AI hàng đầu của Thung lũng Silicon vẫn còn được bảo mật, mặc dù có một số ngoại lệ - đáng chú ý là Meta với các mô hình mở phổ biến.
Tuy nhiên, người dùng có thể truy cập mô hình của DeepSeek với chi phí thấp hơn nhiều. Công ty Trung Quốc này cho biết họ chỉ tính 1.4 xu cho mỗi 1 triệu token tạo ra - tương đương khoảng 700,000 từ. Trong khi đó, Meta tính 2.8 USD cho cùng một đầu ra từ các mô hình lớn nhất của mình.
"Một số lượng lớn các nhà phát triển đang thử nghiệm với những mã nguồn mở AI của Trung Quốc," Keegan McBride, một nhà nghiên cứu tại Viện Internet Oxford, người tập trung vào địa chính trị của AI, cho biết. "Điều này thực sự cho thấy rằng trong ngành công nghiệp AI, Hoa Kỳ không phải là lựa chọn duy nhất."
Trong khi Yann LeCun, nhà khoa học AI của Meta, mô tả DeepSeek bằng những lời lẽ tốt đẹp như là "các mô hình mã nguồn mở đang vượt trội hơn các mô hình độc quyền", công ty khởi nghiệp này vẫn đặt ra một thách thức trực tiếp đối với Meta.
"Tuyên bố nổi tiếng của Meta là tạo ra các mô hình trọng số mở không thua kém các công nghệ tiên tiến nhất, và DeepSeek vừa đánh bại họ trong trò chơi của chính họ," Toner nói.
Ngoài tác động của DeepSeek đối với thị trường sản phẩm AI, bước đột phá của công ty này cũng hứa hẹn sẽ có những tác động về mặt địa chính trị - thời điểm mà nhiều người tin là then chốt trong cuộc cạnh tranh giữa Hoa Kỳ và Trung Quốc để giành quyền tối cao về AI.
Nếu R1 và các phiên bản kế tiếp trở thành tiêu chuẩn toàn cầu cho các mô hình AI "mở", điều đó sẽ gây bất lợi cho Hoa Kỳ, ông Zuckerberg cảnh báo. "Vì lợi thế quốc gia, Mỹ cần trở thành nước đặt ra tiêu chuẩn," ông nói. "Chúng tôi muốn xây dựng hệ thống AI mà mọi người trên khắp thế giới sử dụng."
DeepSeek đã "thúc đẩy mọi người ở mọi quốc gia trong việc đánh giá... cán cân công nghệ đang hình thành giữa các quốc gia khác nhau," Craig Mundie, một cựu nhân viên kỳ cựu của Microsoft và cựu cố vấn của Nhà Trắng, người cố vấn cho Sam Altman của OpenAI về chính sách và chiến lược công nghệ, cho biết.
Nếu Trung Quốc đã thành công trong việc đạt được vị thế ngang bằng với Mỹ về AI, điều này có thể sẽ tác động đến tất cả những phương diện mà công nghệ này được sử dụng, Dario Amodei, giám đốc điều hành của công ty khởi nghiệp AI Hoa Kỳ Anthropic, cảnh báo.
"Có vẻ như Trung Quốc có thể hướng nhiều nhân tài, vốn và sự tập trung hơn vào các ứng dụng quân sự của công nghệ này," Amodei đã viết về những tiến bộ của DeepSeek. "Cùng với cơ sở công nghiệp lớn và lợi thế quân sự-chiến lược, điều này có thể giúp Trung Quốc dẫn đầu trên quy mô toàn cầu, không chỉ về AI mà về mọi thứ."
Ông Mundie, người cũng là chủ tịch của diễn đàn ngoại giao Đối thoại AI Mỹ-Trung do cố Ngoại trưởng Hoa Kỳ Henry Kissinger thành lập, chỉ ra rằng AI như “một con dao hai lưỡi”, có nghĩa là công nghệ này có cả mặt tích cực và tiêu cực.
Sự xuất hiện của DeepSeek có thể sẽ là chủ đề bao trùm các cuộc thảo luận khi nhóm ngoại giao họp trong vòng 90 ngày tới để thảo luận về một cấu trúc an toàn chung đa phương cho phần mềm AI, mà ông Mundie đã viết trong cuốn sách Genesis mới nhất, đồng tác giả với ông Kissinger và ông Schmidt.
"Điều đó không có nghĩa là mọi người sẽ có cùng luật pháp hoặc quy tắc, nhưng [xây dựng] kiến trúc mà qua đó những cỗ máy này phát triển, hiểu được giá trị con người và phù hợp với lựa chọn của xã hội ở khắp nơi trên thế giới, tôi nghĩ là một nhiệm vụ cấp bách," ông Mundie nói.
Trong khi đó, các doanh nhân trẻ đầy tham vọng ở Trung Quốc đang hướng tới DeepSeek và người sáng lập như một nguồn cảm hứng để xây dựng một thế hệ công nghệ mạnh mẽ mới.
Một thiếu niên đến bày tỏ lòng kính trọng tại nhà của ông Liang ở làng Mililing tuần này nói: “Ông ấy là một nhà công nghệ thực dụng. Ông ấy đã tập hợp một đội ngũ... vượt qua những công ty như OpenAI mà trước đây chúng ta không thể cạnh tranh. Ông ấy là một người tuyệt vời đã có những đóng góp cho Trung Quốc."
Financial Times