Chi phí sử dụng AI rẻ hơn nhưng lợi ích kinh doanh vẫn rất mơ hồ
Đặng Thùy Linh
Junior Analyst
Mặc dù hứa hẹn giúp doanh nghiệp cắt giảm chi phí, trí tuệ nhân tạo (AI) lại đang gặp phải một vấn đề lớn: giá thành quá cao.
Các quy luật mở rộng của AI, cho rằng cần nhiều sức mạnh tính toán hơn để tạo ra các mô hình mạnh mẽ hơn, đã đẩy các công ty công nghệ vào cuộc đua chi hàng tỷ USD để xây dựng các trung tâm dữ liệu khổng lồ và mua các chip mạnh mẽ – những chi phí mà họ không thể không chuyển cho khách hàng. Công cụ AI của Google để tạo tài liệu hoặc email cho nhân viên văn phòng không hề rẻ. Nó làm tăng thêm 20 USD chi phí hàng tháng (6 USD) của công ty cho bộ sản phẩm Workspace đối với mỗi nhân viên. Trợ lý AI Copilot của Microsoft có giá 30 USD một tháng cho mỗi nhân viên.
Trong khi đó, chi phí triển khai AI trực tiếp vào hệ thống của một công ty có thể lên tới từ 5 triệu - 20 triệu USD, theo công ty nghiên cứu Gartner. Công ty này ước tính rằng 30% dự án AI tạo sinh sẽ bị bỏ dở vào cuối năm 2025, một phần do tất cả những khoản chi phí đó.
Tin tốt cho những khách hàng đó là chi phí AI dường như đang giảm xuống, giúp thu hẹp khoảng cách giữa lợi ích và đầu tư. Tin xấu là điều đó vẫn chưa giải quyết được vấn đề lớn hơn về tiện ích, và có thể sẽ mất vài năm nữa mới giải quyết được.
Quan điểm phổ biến ở Thung lũng Silicon là tiếp tục chi tiêu để có được chỗ đứng trong tương lai. Vào thứ Ba, Microsoft thông báo rằng capex của họ đạt kỷ lục 19 tỷ USD trong quý trước, cao hơn 80% so với năm ngoái. Giám đốc điều hành Satya Nadella cho biết tất cả các khoản đầu tư đó sẽ tiếp tục "nắm bắt cơ hội của AI". Giám đốc điều hành của Alphabet, Sundar Pichai, cũng có quan điểm tương tự khi chia sẻ về báo cáo kết quả kinh doanh của Google: "Đối với chúng tôi, rủi ro của việc đầu tư quá ít sẽ lớn hơn nhiều so với rủi ro của việc đầu tư quá mạnh tay." Nhà đầu tư không hoàn toàn tin điều đó: cổ phiếu của Microsoft giảm khoảng 2% kể từ khi công bố kết quả kinh doanh mới nhất, còn cổ phiếu của Google mất 5%.
Việc xây dựng các mô hình AI mạnh mẽ nhất đã trở nên tốn kém hơn trong bảy năm qua.
Tuy nhiên, ngay cả khi chi phí training AI đã tăng lên trong những năm qua như trong biểu đồ trên, các dịch vụ AI của cả hai gã khổng lồ công nghệ dường như đang hướng đến mức giá rẻ hơn. Google cho biết mô hình Gemini mới nhất của công ty - doanh nghiệp có thể sử dụng để tự động hóa các hoạt động chăm sốc khách hàng hoặc tóm tắt các tài liệu nội bộ - mạnh hơn mô hình trước đó, nhưng giá chỉ bằng gần một nửa.
Mô hình mới nhất của OpenAI, GPT-4o, nhanh hơn nhưng cũng rẻ hơn 50% so với phiên bản tiền nhiệm GPT-4 Turbo. Một phát ngôn viên cho biết chi phí truy cập các mô hình của họ, được đo bằng cách xử lý các token, đã giảm 99% kể từ năm 2022. "Chúng tôi cam kết tiếp tục theo xu hướng này", cô ấy chia sẻ thêm.
Trong giới khoa học, việc cắt giảm chi phí bằng các kỹ thuật như “sparsity” và “quantization” đã trở thành trọng tâm chính tại các hội nghị gần đây. Neerav Kingsland, một giám đốc điều hành tại Anthropic, đối thủ của OpenAI, chia sẻ rằng có khả năng các mô hình của họ có thể giảm xuống còn 25% so với giá hiện tại trong vòng một đến hai năm tới, và công ty - đã huy động được 8.8 tỷ USD từ các nhà đầu tư bao gồm Google và Amazon - đã giảm một nửa chi phí xây dựng mô hình gần đây thông qua các phương pháp nghiên cứu mới.
Có những dấu hiệu khác cho thấy chi phí đang giảm. Tại Trung Quốc, các công ty AI đã tham gia vào một cuộc chiến về giá khiến chi phí sử dụng generative AI giảm mạnh, một phần nhờ vào môi trường pháp lý lỏng lẻo hơn, chi phí lao động thấp hơn và trợ cấp của chính phủ. Ví dụ, một công ty khởi nghiệp AI - DeepSeek - tính phí 0.14 USD cho một triệu token dành cho người dùng doanh nghiệp, trong khi một mô hình tương tự từ OpenAI có giá 10 USD.
Nhiều người nhận ra rằng họ không cần AI mạnh nhất để mang lại cho nhân viên của mình lợi thế về năng suất, vì vậy họ đang thử nghiệm các mô hình open-weight từ các công ty như Meta hay các mô hình nhỏ hơn, rẻ hơn hoặc chậm hơn. Một chatbot dịch vụ khách hàng có thể cần một công cụ AI hiện đại, nhưng việc phân tích các cuộc gọi của khách hàng nhằm cải thiện chúng thì có thể được thực hiện bằng công nghệ ít tiên tiến hơn.
Man Group, một công ty quản lý tài sản toàn cầu, cho rằng các mô hình mà họ sử dụng để tóm tắt văn bản cho các nhà quản lý danh mục đầu tư hoặc để cắt giảm thời gian làm việc một ngày xuống 30 phút cho các nhân viên khác, thực sự đang giúp họ giảm chi phí. Tuy nhiên, liệu xu hướng giá đó sẽ bền vững như thế nào trong tương lai?.
Thung lũng Silicon có lịch sử về trợ giá, các nền tảng phát trực tuyến, ứng dụng chia sẻ về chuyến đi và dịch vụ cloud đều chấp nhận giảm lợi nhuận để tăng thị phần. Mục tiêu là vượt qua đối thủ cạnh tranh, cuối cùng là tăng giá, và có lãi. Nhưng đây là điểm mấu chốt đối với generative AI: Câu hỏi được đặt ra là mức độ hữu ích của công cụ này tác động như thế nào đến lợi nhuận ròng của doanh nghiệp, đó là lý do chính khiến Gartner dự đoán rằng 30% dự án sẽ bị hủy bỏ vào cuối năm sau.
Nếu công nghệ vẫn chỉ dừng lại ở việc phân phối chatbot và tóm tắt văn bản, thì nó có thể không đáng mua ngay cả với mức giá thấp hơn. Đó là vấn đề mà các công ty công nghệ có lẽ nên quan tâm hơn cả chi phí.
Bloomberg