Image default
Điện Thoại Di Động

DeepSeek: Đối Thủ AI Trung Quốc Bất Ngờ “Đánh Bại” ChatGPT, Thay Đặt Ra Câu Hỏi Lớn Cho Ngành Công Nghệ Toàn Cầu

Startup DeepSeek của Trung Quốc đã gây chấn động làng công nghệ khi giới thiệu chatbot AI mới, không chỉ sánh ngang hiệu suất với ChatGPT của OpenAI mà còn có chi phí phát triển thấp hơn đáng kể. Tính đến thời điểm hiện tại, DeepSeek đã vượt qua ChatGPT trên Apple App Store để trở thành ứng dụng miễn phí được tải xuống nhiều nhất tại Hoa Kỳ, Vương quốc Anh, Trung Quốc và nhiều quốc gia khác, khẳng định vị thế của AI Trung Quốc trên bản đồ toàn cầu.

DeepSeek hoạt động như một chatbot thông thường: bạn nhập câu hỏi và mô hình mã nguồn mở của nó sẽ tạo ra câu trả lời. Mô hình DeepSeek-V3 cơ bản sở hữu 671 tỷ tham số, cho phép ứng dụng này khả năng “suy nghĩ” trước khi đưa ra giải pháp. Không giống như mô hình của OpenAI chỉ chạy trên máy chủ riêng, DeepSeek có thể hoạt động cục bộ trên các máy tính cấu hình cao và nhiều máy chủ tăng tốc GPU, mở ra tiềm năng lớn cho các nhà phát triển. Công ty tuyên bố mô hình của họ đạt được hiệu suất tương đương OpenAI o1 trên các tiêu chuẩn cụ thể. Một điểm nổi bật khác là DeepSeek minh bạch hiển thị quá trình suy luận và cách nó đưa ra câu trả lời, dù như một ứng dụng Trung Quốc, nó vẫn kiểm duyệt một số chủ đề nhạy cảm như Thiên An Môn.

Ứng dụng DeepSeek, ra mắt vào ngày 20 tháng 1, cũng đã có mặt trên Google Play Store. Sự phổ biến nhanh chóng của DeepSeek đến từ khả năng sánh hoặc thậm chí vượt trội các mô hình AI đã có tên tuổi. Báo cáo nghiên cứu được công bố vào thứ Hai tiết lộ cách thức đào tạo DeepSeek-V3 với chi phí cực kỳ hiệu quả, làm dấy lên nhiều tranh luận về chi phí phát triển mô hình ngôn ngữ lớn (LLM).

Giao diện ứng dụng chatbot DeepSeek trên iPhone với tính năng hiển thị quá trình suy luận, minh chứng cho hiệu quả của AI Trung Quốc DeepSeek.Giao diện ứng dụng chatbot DeepSeek trên iPhone với tính năng hiển thị quá trình suy luận, minh chứng cho hiệu quả của AI Trung Quốc DeepSeek.

Dù các tuyên bố chưa được kiểm chứng đầy đủ, DeepSeek dường như chỉ sử dụng 2.048 chip Nvidia H800 chuyên dụng để đào tạo mô hình R1 của mình. Con số này ít hơn đáng kể so với hơn 16.000 chip Nvidia mà các mô hình hàng đầu của OpenAI đã sử dụng. DeepSeek cho biết việc giảm mạnh số lượng GPU tiên tiến cần thiết cho việc đào tạo AI đã giúp họ chỉ tốn 5.6 triệu USD để đào tạo R1. Con số này tương phản gay gắt với OpenAI, đơn vị đã chi hơn 100 triệu USD để đào tạo mô hình GPT-4 có quy mô tương đương. Tuy nhiên, công ty chưa định lượng mức tiêu thụ năng lượng của DeepSeek so với các đối thủ.

Mô hình R1 của DeepSeek dựa trên LLM V3, mà công ty cho rằng sánh ngang với GPT-4o của OpenAI và Claude 3.5 Sonnet của Anthropic. Thành tựu của DeepSeek càng ấn tượng hơn khi xét đến việc chính phủ Hoa Kỳ đã áp đặt lệnh trừng phạt thương mại đối với các chip Nvidia tinh vi dùng để đào tạo AI. Với việc các “ông lớn” trong lĩnh vực AI như Nvidia, OpenAI, Meta và Microsoft đang chi hàng tỷ USD cho các trung tâm dữ liệu AI của họ, nhiều tiêu đề tuần này sẽ đặt câu hỏi về vị thế dẫn đầu của Mỹ trong công nghệ AI.

Sẽ rất thú vị để xem bước đột phá của DeepSeek ảnh hưởng như thế nào đến dự án Stargate trị giá tỷ đô của chính quyền Trump – được hỗ trợ bởi OpenAI, Softbank và Oracle – với mục tiêu đầu tư 500 tỷ USD vào việc xây dựng cơ sở hạ tầng và trung tâm dữ liệu AI mới cho OpenAI trong bốn năm tới. Mọi thứ sẽ đặc biệt hấp dẫn khi OpenAI chuyển đổi từ một tổ chức phi lợi nhuận sang một tổ chức vì lợi nhuận, bởi vì DeepSeek đã mở mã nguồn các mô hình AI của mình. Meta cũng đã mở mã nguồn một số khía cạnh của công nghệ AI của mình, như LLM Lama. DeepSeek là một tân binh đáng gờm mà mọi người đang nói đến, và việc các nhà phát triển có thể tự do xây dựng trên công nghệ của DeepSeek có thể tạo ra một thách thức lớn cho OpenAI.

DeepSeek đang định hình lại cuộc đua AI bằng cách chứng minh rằng hiệu suất vượt trội không nhất thiết phải đi đôi với chi phí khổng lồ. Điều này mở ra một chương mới cho sự phát triển của công nghệ AI và đặt ra câu hỏi về vị thế dẫn đầu toàn cầu.

Nguồn tham khảo:

Related posts

ADB Trên Android: 3 Lý Do Hàng Đầu Bạn Nên Kích Hoạt Ngay Lập Tức

Administrator

Sạc Dự Phòng Tích Hợp Chân Sạc AC: Tiện Ích Thay Đổi Trải Nghiệm Sạc Của Bạn

Administrator

Google Calendar Đã Chính Thức Có Mặt Trên Apple Watch: Đơn Giản, Tiện Lợi Cho Mọi Lịch Trình

Administrator