Deepseek: Gã khổng lồ thầm lặng dẫn dắt nền công nghiệp AI Trung Quốc (Phần 2)

Deepseek: Gã khổng lồ thầm lặng dẫn dắt nền công nghiệp AI Trung Quốc (Phần 2)

Kiều Hồng Minh

Kiều Hồng Minh

Junior Analyst

13:56 28/01/2025

Bài phỏng vấn nhà sáng lập của DeepSeek, Liang Wenfeng, người đứng sau thành công của doanh nghiệp này.

Phần 3: Nhiều khoản đầu tư hơn không bằng nhiều đổi mới hơn


Phóng viên: DeepSeek hiện tại khiến người ta gợi nhớ đến những ngày đầu của OpenAI. Liệu bạn sẽ ngừng công khai mã nguồn như OpenAI và Mistral đã làm hay không?

Liang Wenfeng: Chúng tôi sẽ không chuyển sang mã nguồn đóng. Chúng tôi tin rằng việc có một hệ sinh thái kỹ thuật mạnh mẽ trước tiên là quan trọng hơn.

Phóng viên: Bạn có kế hoạch gọi vốn không? Tôi đã xem các báo cáo trên phương tiện truyền thông nói rằng High-Flyer có kế hoạch IPO DeepSeek.

Liang Wenfeng: Chúng tôi không có kế hoạch tài chính trong ngắn hạn. Tiền chưa bao giờ là vấn đề đối với chúng tôi; lệnh cấm vận chuyển các con chip tiên tiến mới là vấn đề.

Phóng viên: Nhiều người tin rằng việc phát triển AGI và tài chính định lượng là những nỗ lực hoàn toàn khác nhau. Tài chính định lượng có thể được theo đuổi âm thầm, nhưng AGI có thể yêu cầu một cách tiếp cận táo bạo và nổi bật, hình thành một liên minh để gia tăng khoản đầu tư của bạn.

Liang Wenfeng: Nhiều khoản đầu tư hơn không bằng nhiều đổi mới hơn. Nếu thế, các công ty lớn đã độc quyền tất cả các đổi mới rồi.

Phóng viên: Bạn không tập trung vào các ứng dụng ở thời điểm hiện tại vì bạn thiếu chuyên môn vận hành?

Liang Wenfeng: Chúng tôi tin rằng giai đoạn hiện tại là giai đoạn bùng nổ về đổi mới công nghệ, chứ không phải về ứng dụng. Về lâu dài, chúng tôi hy vọng sẽ tạo ra một hệ sinh thái, nơi ngành công nghiệp trực tiếp sử dụng công nghệ và đầu ra của chúng tôi. Trọng tâm của chúng tôi sẽ vẫn là các mô hình nền tảng và đổi mới tiên tiến, trong khi các công ty khác có thể xây dựng các doanh nghiệp B2B và B2C dựa trên nền tảng của DeepSeek. Nếu một chuỗi giá trị ngành hoàn chỉnh có thể được thiết lập, thì chúng tôi không cần phải tự phát triển ứng dụng. Tất nhiên, nếu cần, không có gì ngăn cản chúng tôi làm việc trên các ứng dụng, nhưng nghiên cứu và đổi mới công nghệ sẽ luôn là ưu tiên hàng đầu của chúng tôi.

Waves: Nhưng khi khách hàng đang lựa chọn API, tại sao họ nên chọn DeepSeek hơn là dịch vụ từ các công ty lớn hơn?

Liang Wenfeng: Thế giới tương lai có thể là một thế giới chuyên môn hóa. Các mô hình lớn nền tảng yêu cầu đổi mới liên tục và các công ty lớn có giới hạn về khả năng của họ, điều này khiến họ chưa chắc đã là phù hợp nhất.

Phóng viên: Nhưng bản thân công nghệ có thực sự tạo ra khoảng cách đáng kể không? Bạn cũng đã đề cập rằng không có bí mật công nghệ tuyệt đối.

Liang Wenfeng: Không có bí mật nào trong công nghệ, nhưng việc sao chép cần có thời gian và chi phí. Về mặt lý thuyết, card đồ họa của Nvidia không có bí mật công nghệ và dễ dàng sao chép. Tuy nhiên, việc xây dựng một nhóm và bắt kịp với công nghệ thế hệ tiếp theo cần có thời gian, vì vậy con hào thực sự vẫn còn khá lớn.

Phóng viên: Khi DeepSeek hạ giá, ByteDance đã làm theo, điều này cho thấy rằng họ cảm thấy một mức độ đe dọa nhất định. Bạn nhìn nhận cách tiếp cận mới đối với cạnh tranh giữa các công ty khởi nghiệp và các công ty lớn như thế nào?

Liang Wenfeng: Thành thật mà nói, chúng tôi không thực sự quan tâm, bởi vì đó chỉ là điều chúng tôi đã làm một cách vô tình. Cung cấp dịch vụ đám mây không phải là mục tiêu chính của chúng tôi. Mục tiêu cuối cùng của chúng tôi vẫn là đạt được AGI.

Ngay bây giờ, tôi không thấy bất kỳ cách tiếp cận mới nào, nhưng các công ty lớn không có lợi thế rõ ràng. Các công ty lớn có khách hàng hiện tại, nhưng hoạt động kinh doanh của họ cũng là gánh nặng của họ, và điều này khiến họ dễ bị gián đoạn bất cứ lúc nào.

Phóng viên: Bạn thấy kết cục của sáu công ty khởi nghiệp ở lĩnh vực mô hình lớn khác là gì?

Liang Wenfeng: Hai hoặc ba công ty có thể tồn tại. Tất cả bọn họ đều đang trong giai đoạn “đốt tiền” ngay bây giờ, vì vậy những người định vị rõ ràng vị trí của họ và tinh chỉnh hoạt động tốt hơn có cơ hội thành công cao hơn. Các công ty khác có thể trải qua những biến đổi đáng kể. Những thứ có giá trị sẽ không biến mất mà thay vào đó sẽ mang một hình thức khác.

Phóng viên: Cách suy nghĩ của bạn đối với sự cạnh tranh là gì?

Liang Wenfeng: Điều tôi thường nghĩ đến là liệu điều gì đó có thể cải thiện hiệu quả hoạt động của xã hội hay không, và liệu bạn có thể tìm thấy điểm mạnh trong chuỗi công nghiệp của nó hay không. Miễn là mục tiêu cuối cùng là làm cho xã hội hiệu quả hơn, thì nó luôn đúng. Nhiều thứ ở giữa chỉ là giai đoạn tạm thời và quá tập trung vào chúng có thể dẫn đến nhầm lẫn.

Phần 4: Một nhóm người trẻ tuổi “bí hiểm”


Phóng viên: Jack Clark, cựu giám đốc chính sách tại OpenAI và đồng sáng lập Anthropic, cho biết DeepSeek đã thuê “những phù thủy bí hiểm”. Vậy kiểu người như thế nào có thể đứng sau DeepSeek V2?

Liang Wenfeng: Không có phù thủy nào cả. Chúng tôi chủ yếu là sinh viên mới tốt nghiệp từ các trường đại học hàng đầu, các tiến sĩ tiềm năng đang theo học học năm thứ tư hoặc thứ năm và một số người trẻ tuổi tốt nghiệp chỉ vài năm trước.

Phóng viên: Nhiều công ty LLM (Mô hình Ngôn ngữ lớn) bị ám ảnh bởi việc tuyển dụng nhân tài từ nước ngoài, và người ta thường nói rằng 50 nhân tài hàng đầu trong lĩnh vực này thậm chí có thể không làm việc cho các công ty Trung Quốc. Các thành viên trong nhóm của bạn đến từ đâu?

Liang Wenfeng: Nhóm đứng sau mô hình V2 không bao gồm bất kỳ ai trở về Trung Quốc từ nước ngoài - tất cả họ đều là người địa phương. 50 chuyên gia hàng đầu có thể không ở Trung Quốc, nhưng có lẽ chúng tôi có thể tự đào tạo những nhân tài như vậy.

Phóng viên: Đổi mới trong kiến trúc MLA đã ra đời như thế nào? Tôi nghe nói ý tưởng này bắt nguồn từ sở thích cá nhân của một nhà nghiên cứu trẻ?

Liang Wenfeng: Sau khi tóm tắt một số xu hướng tiến hóa chủ đạo, anh ấy đã nghĩ đến việc thiết kế một giải pháp thay thế. Tuy nhiên, biến ý tưởng thành hiện thực là một quá trình dài. Chúng tôi đã thành lập một nhóm dành riêng cho việc này và mất hàng tháng trời để nó hoạt động.

[Điều này gợi nhớ đến các đóng góp ban đầu của Alec Radford cho GPT và nói lên luận điểm mà chúng tôi đã tranh luận trong quá khứ trên ChinaTalk rằng thay vì cần bằng tiến sĩ và nhiều năm kinh nghiệm trong ngành, bạn có thể vượt qua ranh giới bằng cách trở thành một người 20 tuổi thực sự sắc bén và có khao khát đổi mới (Trung Quốc có rất nhiều). Cuộc phỏng vấn của Dwarkesh với Sholto Douglass của OpenAI và Trenton Bricken của Anthropic minh họa rất rõ động lực này. Dwarkesh đã mở đầu cuộc phỏng vấn bằng câu: “Noam Brown, đã nói điều này về Sholto: “anh ấy mới chỉ tham gia lĩnh vực này được 1.5 năm, nhưng những người trong lĩnh vực AI biết rằng anh ấy là một trong những người quan trọng nhất đằng sau thành công của Gemini.”]

Phóng viên: Sự xuất hiện của tư duy khác biệt như vậy dường như có liên quan chặt chẽ đến cấu trúc tổ chức. Đối với High-Flyer, nhóm của bạn hiếm khi giao mục tiêu hoặc nhiệm vụ từ trên xuống. Nhưng AGI liên quan đến việc khám phá các giới hạn kỹ thuậtvới nhiều sự không chắc chắn - điều đó có dẫn đến sự can thiệp quản lý nhiều hơn không?

Liang Wenfeng: DeepSeek vẫn hoàn toàn được vận hành từ dưới lên. Chúng tôi thường không xác định trước vai trò; thay vào đó, sự phân công lao động diễn ra một cách tự nhiên. Mọi người đều có hành trình riêng của mình và họ mang theo những ý tưởng, vì vậy không cần phải thúc ép bất kỳ ai. Trong khi chúng tôi khám phá, nếu ai đó thấy vấn đề, họ sẽ tự nhiên thảo luận với người khác. Tuy nhiên, nếu một ý tưởng cho thấy tiềm năng, chúng tôi sẽ phân bổ nguồn lực từ trên xuống.

Phóng viên: Tôi nghe nói rằng DeepSeek rất linh hoạt trong việc huy động các nguồn lực như GPU và con người.

Liang Wenfeng: Bất kỳ ai trong nhóm đều có thể truy cập GPU hoặc mọi người bất kỳ lúc nào. Nếu ai đó có ý tưởng, họ có thể truy cập hệ thống bất cứ lúc nào mà không cần phê duyệt. Tương tự, vì chúng tôi không có hệ thống phân cấp hoặc các bộ phận riêng biệt, mọi người có thể cộng tác giữa các nhóm, miễn là có sự quan tâm lẫn nhau.

Phóng viên: Phong cách quản lý lỏng lẻo như vậy cần phải dựa trên những con người phù hợp. Tôi nghe nói bạn xuất sắc trong việc xác định nhân tài đặc biệt thông qua các tiêu chí đánh giá phi truyền thống.

Liang Wenfeng: Tiêu chuẩn tuyển dụng của chúng tôi luôn là niềm đam mê và sự tò mò. Nhiều thành viên trong nhóm của chúng tôi có những kinh nghiệm khác thường, và điều đó rất thú vị. Mong muốn làm nghiên cứu của họ thường đến trước việc kiếm tiền.

Phóng viên: Bạn so sánh giá trị của những đổi mới tại các phòng thí nghiệm AI của các công ty lớn so với các công ty khởi nghiệp như thế nào?

Liang Wenfeng: Phòng thí nghiệm AI của Google, OpenAI và thậm chí cả phòng thí nghiệm AI của các công ty công nghệ Trung Quốc đều vô cùng giá trị. Việc OpenAI thành công một phần là do một vài trùng hợp ngẫu nhiên trong lịch sử.

Phóng viên: Vậy, các phát kiến đổi mới phần lớn là nhờ may mắn?

Liang Wenfeng: Tôi tin rằng đổi mới bắt đầu bằng niềm tin. Tại sao Thung lũng Silicon lại đổi mới như vậy? Bởi vì họ dám làm mọi việc. Khi ChatGPT ra đời, cộng đồng công nghệ ở Trung Quốc thiếu tự tin vào sự đổi mới tiên tiến. Từ các nhà đầu tư đến các công ty công nghệ lớn, tất cả họ đều nghĩ rằng khoảng cách quá lớn và chọn tập trung vào các ứng dụng thay thế. Nhưng đổi mới bắt đầu từ sự tự tin, điều mà chúng ta thường thấy nhiều hơn ở những người trẻ tuổi.

Phóng viên: Nhưng bạn không gây quỹ hay thậm chí nói chuyện với công chúng, vì vậy hình ảnh của bạn và doanh nghiệp không quá nổi bật so với những công ty tích cực gây quỹ. Làm thế nào để bạn đảm bảo DeepSeek vẫn là lựa chọn hàng đầu cho những người làm việc trên LLM?

Liang Wenfeng: Bởi vì chúng tôi đang giải quyết những vấn đề khó khăn nhất. Nhân tài hàng đầu bị thu hút nhiều nhất vào việc giải quyết những thách thức khó khăn nhất thế giới. Trên thực tế, những nhân tài hàng đầu ở Trung Quốc bị đánh giá thấp vì có rất ít sự đổi mới mạnh mẽ đang diễn ra ở cấp độ xã hội, khiến họ không được công nhận. Chúng tôi đang giải quyết những vấn đề khó khăn nhất, điều này khiến chúng tôi vốn dĩ trở nên hấp dẫn đối với họ.

Phóng viên: Khi bản phát hành mới nhất của OpenAI không có GPT5, nhiều người cảm thấy rằng các tiến bộ công nghệ đang chậm lại. Bạn nghĩ sao?

Liang Wenfeng: Chúng tôi tương đối lạc quan. Ngành công nghiệp của chúng tôi nói chung dường như đang đáp ứng được kỳ vọng. OpenAI không phải là thần thánh, họ không nhất thiết phải luôn đi đầu.

Phóng viên: Bao lâu nữa thì AGI được hiện thực hóa? Những cột mốc chính trên lộ trình AGI của bạn là gì?

Liang Wenfeng: Có thể là hai, năm hoặc mười năm–trong mọi trường hợp, nó sẽ xảy ra trong cả cuộc đời của chúng ta. Không có ý kiến thống nhất về lộ trình ngay cả trong công ty chúng tôi. Chúng tôi đã thực hiện đặt cược thực sự vào ba hướng. Đầu tiên là toán học và mã, thứ hai là đa phương thức và thứ ba là bản thân ngôn ngữ tự nhiên. Chúng tôi vẫn cởi mở với những khả năng khác nhau.

Phóng viên: Anh nghĩ gì về kết cục của các mô hình lớn?

Liang Wenfeng: Sẽ có những công ty chuyên biệt cung cấp các mô hình và dịch vụ nền tảng, đạt được sự chuyên môn hóa sâu rộng trong chuỗi cung ứng, đáp ứng nhu cầu đa dạng của xã hội.

Phần 5: Tất cả các phương pháp đều là sản phẩm của thế hệ trước


Phóng viên: Trong năm qua, đã có nhiều thay đổi trong các công ty khởi nghiệp mô hình lớn của Trung Quốc. Ví dụ, Wang Huiwen [đồng sáng lập của RenRen, một bản sao của Facebook và Meituan, một công ty giao đồ ăn], người rất tích cực vào đầu năm ngoái, đã rút lui giữa chừng và các công ty tham gia sau đó bắt đầu cho thấy sự khác biệt.

Liang Wenfeng: Wang Huiwen tự gánh chịu tất cả các khoản lỗ, cho phép những người khác rút lui mà không hề hấn gì. Anh ấy đã đưa ra một lựa chọn tồi tệ nhất cho bản thân nhưng tốt cho mọi người khác, vì vậy anh ấy rất đứng đắn trong cách cư xử của mình - đây là điều tôi thực sự ngưỡng mộ.

Phóng viên: Anh đang tập trung vào điều gì ở thời điểm hiện tại?

Liang Wenfeng: Tôi vẫn tập trung vào việc nghiên cứu thế hệ mô hình lớn tiếp theo. Vẫn còn nhiều vấn đề chưa được giải quyết.

Phóng viên: Các công ty khởi nghiệp mô hình lớn khác đang khăng khăng theo đuổi cả hai [công nghệ và thương mại hóa], xét cho cùng, công nghệ sẽ không mang lại vị trí dẫn đầu vĩnh viễn vì điều quan trọng nữa là tận dụng thời cơ để chuyển đổi lợi thế công nghệ thành sản phẩm. DeepSeek tập trung vào nghiên cứu mô hình vì khả năng của nó vẫn chưa đủ?

Liang Wenfeng: Tất cả những mô hình kinh doanh này đều là sản phẩm của thế hệ trước và có thể không còn đúng trong tương lai.

Phóng viên: Trước đây, quỹ định lượng High-Flyer của anh có nền tảng vững chắc về công nghệ và đổi mới, và sự tăng trưởng của quỹ tương đối tốt. Đây có phải là lý do cho sự lạc quan của anh không?

Liang Wenfeng: Theo một cách nào đó, High-Flyer đã củng cố niềm tin của chúng tôi vào sự đổi mới do công nghệ thúc đẩy, nhưng đó không phải là một hành trình suôn sẻ. Chúng tôi đã trải qua một quá trình tích lũy lâu dài. Những gì người ngoài nhìn thấy là một phần của High-Flyer sau năm 2015, nhưng trên thực tế, chúng tôi đã làm việc đó được 16 năm.

Phóng viên: Quay trở lại chủ đề đổi mới. Giờ đây, nền kinh tế đang bắt đầu suy yếu và nguồn cung vốn không còn lỏng lẻo như trước nữa, liệu điều này có kìm hãm việc nghiên cứu không?

Liang Wenfeng: Tôi không nghĩ như vậy. Việc điều chỉnh cơ cấu công nghiệp của Trung Quốc nhất thiết sẽ phụ thuộc nhiều hơn vào sự đổi mới công nghệ cốt lõi. Khi mọi người nhận ra rằng việc kiếm tiền nhanh chóng trong quá khứ có thể là do những cơ hội may mắn, họ sẽ sẵn sàng khiêm tốn hơn và tham gia vào sự đổi mới thực sự.

Phóng viên: Vậy anh cũng lạc quan về điều này?

Liang Wenfeng: Tôi lớn lên vào những năm 1980 tại một thành phố hạng năm ở Quảng Đông. Cha tôi là một giáo viên tiểu học. Vào những năm 1990, có rất nhiều cơ hội kiếm tiền ở Quảng Đông. Khi đó, nhiều phụ huynh của cha tôi đã nghĩ rằng học tập là vô ích. Nhưng hiện tại, tất cả họ đều đã thay đổi quan điểm. Bởi vì kiếm tiền không còn dễ dàng nữa — ngay cả cơ hội làm nghề lái taxi cũng có thể sớm biến mất. Chỉ mất có một thế hệ.

Trong tương lai, sự đổi mới mạnh mẽ sẽ ngày càng trở nên phổ biến. Hiện tại điều này không dễ hiểu, bởi vì toàn xã hội cần được giáo dục về điểm này. Một khi xã hội cho phép những người cống hiến cho sự đổi mới mạnh mẽ đạt được danh tiếng và tài sản, thì tư duy tập thể của chúng ta sẽ thích nghi. Chúng ta chỉ cần một số ví dụ và một quá trình dài.

ChinaTalk

Broker listing

Thư mục bài viết

Cùng chuyên mục

Năm 2025: Thị trường năng lượng chuyển mình như thế nào?
Thái Linh

Thái Linh

Junior Editor

Năm 2025: Thị trường năng lượng chuyển mình như thế nào?

Thị trường năng lượng đang chuẩn bị cho một năm 2025 có thể đầy biến động trong bối cảnh các xung đột toàn cầu đang diễn ra, sự thay đổi trong chính quyền Mỹ, những trở ngại tiềm tàng trong quá trình chuyển đổi năng lượng, các chính sách thương mại liên quan đến thuế quan và nhiều hạn chế về nguồn cung.
Triển vọng kinh tế 2025: Kinh tế toàn cầu vững vàng giữa làn sóng giảm tốc từ Trung Quốc (Phần 2)
Ngọc Lan

Ngọc Lan

Junior Editor

Triển vọng kinh tế 2025: Kinh tế toàn cầu vững vàng giữa làn sóng giảm tốc từ Trung Quốc (Phần 2)

Thị trường ngoại hối năm 2025 dự kiến sẽ chịu ảnh hưởng mạnh mẽ từ các chính sách hậu bầu cử Mỹ. Song song với điều này, các yếu tố nền tảng truyền thống của thị trường như sự khác biệt về chu kỳ kinh tế, chính sách tiền tệ và định giá cũng đóng vai trò then chốt.
Nhịp đập kinh tế: Tốc độ tăng trưởng của Mỹ và Canada vẫn "bứt phá", chưa có dấu hiệu chững lại
Thái Linh

Thái Linh

Junior Editor

Nhịp đập kinh tế: Tốc độ tăng trưởng của Mỹ và Canada vẫn "bứt phá", chưa có dấu hiệu chững lại

Thị trường lao động Canada kết thúc năm 2024 với kết quả ấn tượng. Nền kinh tế ghi nhận số lượng việc làm nhiều nhất mới trong gần hai năm qua, trong khi tỷ lệ thất nghiệp giảm và số giờ làm việc tăng mạnh, thúc đẩy sức mạnh nền kinh tế vào năm 2025.
Đồng USD mạnh lên trong bối cảnh những nghi ngờ về động lực cắt giảm lãi suất của Fed
Tuấn Hưng

Tuấn Hưng

Junior Analyst

Đồng USD mạnh lên trong bối cảnh những nghi ngờ về động lực cắt giảm lãi suất của Fed

Thị trường Hoa Kỳ tuần trước được định hình bởi hai chủ đề chính: sự không chắc chắn xung quanh các chính sách thương mại của chính quyền Hoa Kỳ sắp tới và tác động của dữ liệu kinh tế mạnh mẽ của Hoa Kỳ. Sự nhầm lẫn ban đầu của thị trường, do các tín hiệu mơ hồ liên quan đến thuế quan, đã tạo ra sự biến động đáng kể. Tuy nhiên, sự do dự này đã nhường chỗ cho sự rõ ràng khi dữ liệu mạnh mẽ của Hoa Kỳ khẳng định lại khả năng phục hồi của nền kinh tế, gây nghi ngờ về khả năng Fed sẽ cắt giảm lãi suất nhiều hơn vào năm 2025.
Báo cáo Kaiko Research tuần 2 tháng 1: Thị trường sau một năm ra mắt ETF BTC
Tuấn Hưng

Tuấn Hưng

Junior Analyst

Báo cáo Kaiko Research tuần 2 tháng 1: Thị trường sau một năm ra mắt ETF BTC

Bitcoin đóng cửa tuần trước ở mức thấp nhất trong hai tháng do báo cáo việc làm của Hoa Kỳ nóng hơn dự kiến. Trong tin tức khác, Bộ Tư pháp Hoa Kỳ đã chấp thuận bán 6.5 tỷ USD BTC, làm tăng thêm tâm lý tránh rủi ro. Tuần này, chúng ta sẽ tìm hiểu về BTC sau một năm xuất hiện ETF giao ngay, Bitcoin đang thu hút dòng tiền trú ẩn an toàn tại Hàn Quốc và khả năng chính phủ Hoa Kỳ tiếp tục bán BTC.
Forex Forecast - Diễn đàn dự báo tiền tệ