Global Soul Limited liyi@gs-smt.com 86-755-27962186
Vào tháng 1 năm nay, công ty khởi nghiệp trí tuệ nhân tạo DeepSeek đã phát hành hai bước đột phá thông qua mô hình R1 mới của nó, lặng lẽ xác định lại nền kinh tế của trí tuệ nhân tạo.Mô hình này đạt được hiệu suất hàng đầu ở 1/40 chi phí của mô hình trước đóTính đến tháng 12 năm 2024, mô hình ngôn ngữ lớn V3 của DeepSeek đã giảm chi phí đào tạo hơn 90%.
Hai trong số những đột phá của DeepSeek đã thu hút sự chú ý rộng rãi: Thứ nhất,DeepSeek tiết lộ rằng yêu cầu các mô hình AI để làm chi tiết về quy trình lý luận của họ - một phương pháp nghiên cứu được gọi là chuỗi tư tưởng thúc đẩy - cải thiện độ chính xác và hiệu quảThứ hai, DeepSeek sử dụng trí tuệ nhân tạo để tạo ra các bộ dữ liệu của riêng mình, hoàn toàn độc lập với việc dán nhãn bằng tay dữ liệu.Trong khi có những lập luận rằng DeepSeek không rẻ như nó tuyên bố, những đột phá này chắc chắn đã mở ra một kỷ nguyên mới của nền kinh tế AI.
Cấu trúc chi phí của trí tuệ nhân tạo đang thay đổi đáng kể.và đầu tư hạ tầngSự thay đổi này có thể đảo ngược các lực lượng thị trường, cuối cùng giúp các công ty khởi nghiệp nhanh chóng bắt kịp những gã khổng lồ công nghệ trong ngắn hạn trong khi tăng tỷ lệ lợi nhuận.
Những gã khổng lồ công nghệ đã đầu tư hơn 100 tỷ đô la vào phát triển cơ sở hạ tầng AI, và nó tiếp tục tăng lên.Bây giờ họ phải xem xét làm thế nào để tạo ra lợi nhuận từ những khoản đầu tư khổng lồ này và duy trì lợi thế so với các thuật toán nhanh nhẹn hơnĐối mặt với một môi trường thay đổi nhanh chóng, cả những gã khổng lồ công nghệ và các công ty khởi nghiệp đều phải đối mặt với một tín hiệu rõ ràng: nắm bắt cơ hội của tiến bộ công nghệ nhanh chóng,hoặc bị loại bỏ.
Khung cảnh thị trường AI trước và sau DeepSeek
Trước khi DeepSeek nổi lên, các công ty mới bắt đầu đã phải vật lộn để cạnh tranh với chi tiêu cơ sở hạ tầng của những gã khổng lồ công nghệ,đã đổ hàng tỷ đô la vào việc xây dựng các trung tâm dữ liệu khổng lồ mỗi quý và đạt được những lợi thế lớn từ những tiến bộ trong công nghệ trí tuệ nhân tạoNhững người khổng lồ này không chỉ có nguồn dữ liệu khổng lồ, mà còn thu thập một số lượng lớn tài năng tiến sĩ, và sự tiến bộ của thuật toán cũng phụ thuộc vào sức mạnh kỹ thuật mạnh mẽ của họ.mạng lưới phân phối lâu đời cho phép họ chuyển sản phẩm nhanh chóng đến khách hàng hiện có và đẩy nhanh tiến bộ công nghệ thông qua các vòng phản hồi.
Tuy nhiên, ngày nay, các công ty khởi nghiệp đủ lớn để cạnh tranh với những gã khổng lồ công nghệ.giảm đáng kể lợi thế cơ sở hạ tầng của những gã khổng lồ công nghệChi phí lý luận đã giảm gần một ngàn lần trong ba năm qua và dự kiến sẽ giảm hơn nữa trong tương lai.Thời gian của lợi thế thuật toán đã được giảm xuống còn 45 đến 100 ngày và có thể tiếp tục giảm.
Khi chi phí đào tạo không còn là một nút chai chính, hiệu suất suy luận (tức là các mô hình AI hoạt động tốt trong các ứng dụng thời gian thực) trở thành một trọng tâm mới.Các mô hình rẻ hơn cung cấp sức mạnh tương đương với các mô hình lớn hơn và có thể chạy trên Gpus hiệu suất thấp hơnNếu các sản phẩm AI thông minh hơn có thể được cung cấp với chi phí rất thấp, thì các công ty khởi nghiệp cuối cùng có cơ hội vượt trội hơn các gã khổng lồ công nghệ trong khi tăng lợi nhuận.
Việc phân bổ nhân lực hiệu quả sẽ tăng thêm lợi thế của đối thủ cạnh tranh.tối ưu hóa, và phân phối các mô hình với chi phí thấp hơn nhiều so với những gã khổng lồ công nghệ.những người thách thức có thể tận hưởng lợi nhuận cao hơn theo cách tương tự như các công ty khởi nghiệp đám mây đã đạt được lợi thế bằng cách cải thiện kinh tế đơn vị 15 năm trước.
Xu hướng này không chỉ tốt cho các công ty khởi nghiệp. Nó cũng đặt các công ty như Nvidia vào nguy cơ lớn hơn. Sau thông báo của DeepSeek, giá cổ phiếu của Nvidia giảm 12%, mặc dù nó đã phục hồi kể từ đó.Các rủi ro cho các nhà sản xuất chip tăng lên vì nhu cầu đang chuyển từ phần cứng tập trung vào đào tạo sang các giải pháp suy luận hiệu quả hơnSự gia tăng của các đơn vị xử lý thần kinh cấp tiêu dùng (Npus) có thể tăng tốc sự thay đổi này, cho phép các mô hình AI chạy một cách bản địa trên các thiết bị như điện thoại thông minh và máy tính xách tay.
Chi tiêu trí tuệ nhân tạo
Những gì tốt cho những người thách thức là xấu cho những gã khổng lồ công nghệ.Những gã khổng lồ AI gần như theo bản năng đã liên kết sự thống trị của DeepSeek với các tác động an ninh quốc gia trong một nỗ lực thu hút sự hỗ trợ cho sự phát triển của công nghệ tương tự, bỏ qua thực tế là các nhà nghiên cứu Mỹ, bao gồm cả tại Đại học Stanford, đã có thể sao chép và thậm chí vượt qua công nghệ của DeepSeek.Các công ty đầu tư rất nhiều tiền vào các dự án cơ sở hạ tầng dữ liệu có thể hỏi: Chi tiêu khổng lồ cho nghiên cứu và phát triển mô hình AI đã bị lãng phí? Nếu công nghệ rẻ tiền hoạt động tốt như công nghệ đắt tiền, tại sao lại chi tiêu nhiều tiền như vậy?
Các xu hướng lịch sử cho thấy hầu hết các tiến bộ AI đã thực sự dựa vào đầu tư vốn quá lớn về quy mô.vượt quá những gì được coi là tối ưu trong thuật toán vào thời điểm đóNhững tiến bộ công nghệ mới đang chứng minh rằng chúng ta có thể đạt được hiệu suất tương tự với chi phí thấp hơn.việc mở rộng các nhà cung cấp đám mây siêu quy mô vẫn đòi hỏi các trung tâm dữ liệu lớn hơn và phải chịu chi phí suy luận tăng vọt.
Tuy nhiên, những gã khổng lồ công nghệ không ngồi yên. Chúng ta đã thấy một cuộc chạy đua vũ trang cho những thành tựu của DeepSeek, với những người như mô hình Gemini của Google,Azure AI Foundry của Microsoft và LLaMA mã nguồn mở của Meta đều cạnh tranh để thống trịCác mô hình mã nguồn mở có thể đóng một vai trò quan trọng. Mark Zuckerberg, CEO của Meta, nhấn mạnh tầm quan trọng của AI cá nhân - nghĩa là các mô hình phù hợp với nhu cầu, văn hóa và sở thích của từng người dùng.Tầm nhìn này phù hợp với xu hướng phát triển AI rộng hơn: mô hình nhỏ hơn, chuyên biệt hơn có khả năng cung cấp hiệu suất cao mà không cần cơ sở hạ tầng đám mây lớn.
Các công ty khởi nghiệp giành được những con chip mới
Đồng thời, các gã khổng lồ mã nguồn mở và mã nguồn đóng có mục tiêu khác nhau, tăng thêm lợi thế của đối thủ.Các mô hình mã nguồn mở được tạo ra bởi các công ty như Meta sẽ tiếp tục cạnh tranh và giảm chi phí trên toàn hệ sinh thái, trong khi các mô hình mã nguồn đóng cố gắng tính phí cao hơn thông qua công nghệ tốt hơn.trong khi tăng lợi nhuận.
Bất kể quy mô của doanh nghiệp, thông điệp rõ ràng: Tận dụng những lợi thế cụ thể có sẵn cho họ - động lực thị trường, sức mạnh tính toán và tài năng - nhanh chóng hoặc phải đối mặt với thất bại.Chu kỳ tiến bộ công nghệ ngày càng ngắn hơn, từ những tháng hoặc thậm chí nhiều năm để thiết lập các tiêu chuẩn hiệu suất mới, đến sự đột phá công nghệ của DeepSeek cho thấy nó có thể mất ít nhất 41 ngày.Đổi mới đang tiến bộ với tốc độ chưa từng có, và không gian dung nạp lỗi đang thu hẹp nhanh chóng.