Sự xuất hiện của DeepSeek AI, một startup công nghệ từ Trung Quốc, đang tạo ra một cơn sốt lớn trong cộng đồng AI toàn cầu khi mô hình chatbot mới của họ thể hiện khả năng cạnh tranh trực tiếp với OpenAI’s ChatGPT, nhưng với chi phí phát triển thấp hơn đáng kể. Ngay tại thời điểm viết bài này, DeepSeek đã vượt qua ChatGPT để trở thành ứng dụng miễn phí được tải xuống nhiều nhất trên Apple App Store tại Hoa Kỳ, Vương quốc Anh, Trung Quốc và nhiều quốc gia khác, cho thấy sức hút mạnh mẽ của công nghệ này.
DeepSeek hoạt động tương tự như các chatbot AI khác, nơi người dùng nhập câu hỏi và mô hình mã nguồn mở của nó sẽ tạo ra câu trả lời. Điểm nổi bật là mô hình DeepSeek-V3 ẩn sâu bên trong sở hữu 671 tỷ tham số, cho phép ứng dụng có khả năng “suy nghĩ” trước khi đưa ra giải pháp cho vấn đề.
Lợi Thế Cạnh Tranh và Công Nghệ Đột Phá của DeepSeek
Không giống như các mô hình của OpenAI chỉ có thể chạy trên máy chủ riêng của họ, DeepSeek có thể chạy cục bộ trên các máy tính cấu hình cao hoặc nhiều máy chủ được tăng tốc GPU. Công ty khẳng định rằng mô hình của họ có thể sánh ngang với mô hình o1 của OpenAI trên các tiêu chuẩn cụ thể. Một điểm khác biệt quan trọng nữa của DeepSeek so với nhiều chatbot AI khác là khả năng hiển thị minh bạch quá trình suy luận và cách nó đưa ra câu trả lời. Tuy nhiên, do là một ứng dụng của Trung Quốc, DeepSeek vẫn thực hiện kiểm duyệt đối với một số chủ đề nhạy cảm, điển hình như sự kiện Thiên An Môn.
Giao diện ứng dụng DeepSeek AI trên iPhone hiển thị ví dụ về khả năng suy luận và giải thích của chatbot.
Ứng dụng DeepSeek, ra mắt vào ngày 20 tháng 1, cũng đã có mặt trên Google Play Store. Sự phổ biến đột ngột của DeepSeek phần lớn đến từ khả năng sánh ngang hoặc thậm chí vượt trội hơn các mô hình AI đã có tên tuổi. Tài liệu nghiên cứu của họ, được công bố vào thứ Hai, đã tiết lộ về việc DeepSeek-V3 được đào tạo hiệu quả về chi phí đến mức nào.
Hiệu Quả Chi Phí Đào Tạo: Yếu Tố Thay Đổi Cuộc Chơi
Mặc dù các tuyên bố của DeepSeek vẫn đang chờ xác minh, nhưng có vẻ như DeepSeek chỉ sử dụng 2.048 chip Nvidia H800 chuyên dụng để đào tạo mô hình R1 của mình. Con số này ít hơn rất nhiều so với hơn 16.000 chip Nvidia mà các mô hình hàng đầu của OpenAI đã sử dụng để đào tạo. DeepSeek cho biết việc giảm đáng kể số lượng GPU tiên tiến cần thiết cho việc đào tạo AI đã giúp họ chỉ tốn 5,6 triệu đô la để đào tạo R1. Để so sánh, OpenAI đã chi hơn 100 triệu đô la để đào tạo mô hình GPT-4 có kích thước tương đương. Tuy nhiên, công ty chưa định lượng mức tiêu thụ năng lượng của DeepSeek so với các đối thủ.
Bản thân R1 được xây dựng dựa trên mô hình ngôn ngữ lớn (LLM) V3 của DeepSeek, mà công ty cho biết có thể sánh ngang với GPT-4o của OpenAI và Claude 3.5 Sonnet của Anthropic. Thành tựu của DeepSeek càng trở nên ấn tượng hơn trong bối cảnh chính phủ Mỹ đang áp đặt các lệnh trừng phạt thương mại đối với chip Nvidia tinh vi được sử dụng để đào tạo AI. Với việc các “ông lớn” trong ngành AI như Nvidia, OpenAI, Meta và Microsoft đang chi hàng tỷ đô la vào các trung tâm dữ liệu AI của họ, tuần này chúng ta sẽ thấy rất nhiều tiêu đề đặt câu hỏi về vị thế dẫn đầu của Mỹ trong lĩnh vực AI.
Tác Động và Ý Nghĩa của DeepSeek Đối với Ngành AI Toàn Cầu
Thật thú vị khi chứng kiến bước đột phá của DeepSeek sẽ ảnh hưởng như thế nào đến dự án Stargate trị giá tỷ đô la của chính quyền Trump—được hỗ trợ bởi OpenAI, Softbank và Oracle—với mục tiêu đầu tư 500 tỷ đô la để xây dựng cơ sở hạ tầng và trung tâm dữ liệu AI mới cho OpenAI trong bốn năm tới. Mọi thứ sẽ đặc biệt hấp dẫn khi OpenAI chuyển đổi từ một tổ chức phi lợi nhuận sang một tổ chức vì lợi nhuận, bởi vì DeepSeek đã mã nguồn mở các mô hình AI của mình.
Meta cũng đã mã nguồn mở một số khía cạnh công nghệ AI của họ, như LLM Lama. Tuy nhiên, DeepSeek là một tân binh đang được mọi người bàn tán, và thực tế là các nhà phát triển có thể tự do xây dựng dựa trên công nghệ của DeepSeek có thể khiến OpenAI phải dè chừng.
Kết Luận
DeepSeek AI không chỉ là một chatbot mới mà còn là một minh chứng rõ ràng cho thấy khả năng đổi mới và hiệu quả chi phí trong lĩnh vực trí tuệ nhân tạo. Với mô hình mạnh mẽ, khả năng chạy cục bộ, tính minh bạch và đặc biệt là chi phí đào tạo thấp kỷ lục, DeepSeek đang tạo ra một làn sóng mới, thách thức vị thế của những gã khổng lồ AI. Sự trỗi dậy của DeepSeek không chỉ thay đổi cục diện cạnh tranh trên thị trường AI mà còn mở ra những hướng đi mới, khuyến khích xu hướng mã nguồn mở và đặt ra nhiều câu hỏi về chiến lược phát triển AI toàn cầu trong tương lai.
Hãy theo dõi webthuthuat.net để cập nhật những thông tin mới nhất về DeepSeek AI và các đột phá công nghệ khác!
Tài liệu tham khảo:
- TechCrunch
- New York Times
- Bloomberg