DeepSeek AI: Khi Phương Đông Thách Thức Độc Quyền AI của Phương Tây - Phân Tích Chuyên Sâu
Bài viết về sự khuynh đảo thế giới AI của startup DeepSeek đến từ Trung Quốc
Thân chúc quý vị độc giả của Lẩu, AiArt101, Tin Tốt một năm Ất Tỵ 2025 nhiều thành công, sức khỏe và vạn sự hanh thông. Năm 2025 này, cả ba newsletter sẽ hòa thành một và cập nhật nội dung đều đặn. Mong mọi người sẽ có trải nghiệm mới cùng với những nội dung mà bạn đã từng thích và thấy có ích.
Xin cảm ơn và chúc mọi người năm mới an vui! Enjoy!
Phần 1: Một Ngày Đẹp Trời ở Thung Lũng Silicon...
Hãy tưởng tượng bạn là một nhà đầu tư công nghệ đang ngồi trong văn phòng sang trọng tại Thung Lũng Silicon. Trước mặt bạn là một ly cà phê Blue Mountain đắt đỏ vừa pha bằng máy Simonelli trị giá 15.000 đô, và trên màn hình Dell 49 inch cong là biểu đồ cổ phiếu các công ty công nghệ lớn đang tăng vọt nhờ cơn sốt AI. Meta vừa tăng 20% sau tin tức về Llama 3, Microsoft đạt đỉnh mới nhờ tin đồn GPT-5, và NVIDIA vẫn đang phi như tên lửa với doanh số GPU AI không ngừng tăng trưởng.
Mọi thứ thật hoàn hảo... cho đến khi điện thoại iPhone 15 Pro Max của bạn rung lên với một thông báo từ Bloomberg:
"DeepSeek - AI miễn phí từ Trung Quốc vượt mặt ChatGPT trong hầu hết các benchmark!"
"Chắc là đùa", bạn nghĩ. Nhưng không, đây là sự thật 100%. Và chỉ trong vòng 24 giờ, 1000 tỷ đô la đã bay hơi khỏi thị trường chứng khoán Mỹ, với NVIDIA dẫn đầu đà giảm, mất 17% vốn hóa chỉ trong một phiên.
Giống Chuyện Xưa Không?
Nếu câu chuyện này nghe quen quen, có lẽ vì chúng ta đã từng thấy nó xảy ra trước đây. Nhớ về những năm cuối 90 đầu 2000, khi xe máy Honda Dream II độc chiếm thị trường Việt Nam với giá 30 triệu đồng/chiếc? Rồi bỗng một ngày, Lifan và các hãng xe Trung Quốc xuất hiện với công thức ma thuật:
"Mẫu mã, công dụng tương đương + Giá chỉ 10 triệu = Người dùng phát cuồng".
Giờ đây, lịch sử đang lặp lại trong thế giới AI. Các mô hình ngôn ngữ lớn (LLM) đang ở giai đoạn tương tự như thị trường xe máy Việt Nam những năm 90 - khi mà một cuộc cách mạng về giá đang chờ đợi để bùng nổ.
Phần 2: David và Goliath Phiên Bản AI
Cuộc Chiến Không Cân Sức?
Hãy thử tưởng tượng một cuộc đấu lôi đài giữa 2 đối thủ trong mảng trí tuệ nhân tạo.
Trong góc này, chúng ta có các gã khổng lồ công nghệ Mỹ:
Vũ khí: 200 tỷ đô đầu tư vào hạ tầng AI (riêng Microsoft đã chi 13 tỷ cho OpenAI)
Áo giáp: Trung tâm dữ liệu với hàng trăm nghìn GPU H100 trị giá 40.000 đô/card
Quân sĩ: Đội ngũ tiến sĩ AI từ Stanford, MIT, Berkeley với mức lương trung bình 400.000 đô/năm
Hậu phương: Nguồn tiền dồi dào từ phố Wall và các quỹ đầu tư mạo hiểm
Và trong góc kia... một startup Trung Quốc với đội ngũ dưới 200 người:
Vũ khí: Thuật toán tối ưu thông minh được phát triển nội bộ
Áo giáp: GPU "cũ" tận dụng lại từ thời đào Bitcoin
Quân sĩ: Các kỹ sư trẻ từ Đại học Thanh Hoa, phần lớn chỉ có bằng cử nhân
Chiến thuật: "Làm nhiều, ăn ít" - triết lý kinh doanh châu Á điển hình
Sovereign AI: Giấc Mơ Không Còn Xa
Hồi tưởng một chút về hội nghị ASOCIO 2023 ở Seoul, Hàn Quốc. Khi đó, lần đầu tiên tôi được nghe về một ý tưởng, một phong trào các nước châu Á đang khao khát một giấc mơ: xây dựng các mô hình AI của riêng mình, được huấn luyện trên dữ liệu bản địa và hiểu sâu sắc văn hóa địa phương. Họ gọi nó là "Sovereign AI" - AI Tự Chủ.
Tại sao điều này quan trọng? Hãy lấy ví dụ về việc dạy AI hiểu câu "Anh đi ăn cơm không?". Một mô hình được huấn luyện bởi người phương Tây có thể hiểu đây là câu hỏi về bữa ăn. Nhưng một mô hình được huấn luyện với văn hóa Việt Nam sẽ hiểu đây còn là cách bày tỏ sự quan tâm, là lời mời gọi thân tình, và đôi khi còn là cách gián tiếp để mở đầu một cuộc trò chuyện quan trọng.
Nghe có vẻ viễn tưởng? Không hẳn. Như cách mỗi quốc gia cần có quân đội riêng để bảo vệ chủ quyền, giờ đây mỗi quốc gia cần có AI riêng để bảo vệ bản sắc văn hóa và tương lai số của mình. Và DeepSeek đã chứng minh: điều này hoàn toàn khả thi với chi phí hợp lý.
Phần 3: "Bí Kíp Võ Công" của DeepSeek
Dù mới vào cuộc ở hiệp một, đấu thủ AI đến từ Trung Quốc đã đấm knock-out tay đấm nổi tiếng của Mỹ. Vậy DeepSeek có chiêu gì để làm nên cú lật đổ ngoạn mục vậy. Hãy cùng xem:
Mixture-of-Experts (MoE): Nghệ Thuật Phân Công Chuyên Gia AI
Hãy tưởng tượng bạn đang điều hành một công ty phần mềm AI. Bạn có hai chiến lược để xây dựng mô hình:
Mô hình truyền thống (như một số mô hình của OpenAI):
Ưu điểm: Tất cả "chuyên gia" (neuron) luôn sẵn sàng
Nhược điểm: Sử dụng tài nguyên tính toán cao
Thực tế: Nhiều "chuyên gia" có thể không cần thiết cho mọi tác vụ
Mô hình MoE (như DeepSeek):
Ưu điểm: Chỉ kích hoạt "chuyên gia" cần thiết cho từng tác vụ
Nhược điểm: Cần cơ chế phức tạp để chọn "chuyên gia" phù hợp
Thực tế: Có thể giảm đáng kể chi phí tính toán, thường từ 30-50%
DeepSeek áp dụng chiến lược thứ hai, sử dụng triết lý "theo nhu cầu" trong kiến trúc AI của họ. Kết quả là họ chỉ cần kích hoạt khoảng 37 tỷ tham số trong số 671 tỷ tham số của mình cho mỗi lần suy luận. Điều này giống như việc một công ty có sẵn kết nối và hợp đồng hợp tác với nhóm chuyên gia, và chỉ huy động đúng các chuyên gia cần thiết cho từng dự án, thay vì huy động toàn bộ nhân sự mỗi lần.
Tuy nhiên, cần lưu ý rằng tất cả 671 tỷ tham số vẫn cần được lưu trữ trong bộ nhớ. MoE không giảm kích thước tổng thể của mô hình, mà tối ưu hóa việc sử dụng tài nguyên tính toán. Kết quả là một mô hình có khả năng xử lý đa dạng tác vụ với hiệu quả cao hơn về mặt tính toán, mở ra tiềm năng cho AI mạnh mẽ hơn trên cùng một hạ tầng phần cứng.
Công Nghệ Nén Trí Tuệ: Đóng Gói Não Bộ AI
Đã bao giờ bạn thấy một gia đình 4 người Việt Nam di chuyển trên một chiếc xe máy? Đó chính xác là những gì DeepSeek làm với AI của họ. DeepSeek đã thực hiện một bước tiến đáng kể trong việc nén mô hình AI, giảm kích thước từ 671B parameters xuống còn 37B - như một file nén siêu việt của trí tuệ. Họ đã sử dụng nhiều kỹ thuật tiên tiến để đạt được điều này:
Pruning (Tỉa cành):
Loại bỏ các kết nối và neuron ít quan trọng
Giống như tỉa cây bonsai - chỉ giữ lại những nhánh quan trọng
Kết quả: Có thể giảm đáng kể kích thước mô hình, nhưng thường đi kèm với sự đánh đổi về hiệu năng
Quantization (Lượng tử hóa):
Giảm độ chính xác của các số từ 32-bit xuống 8-bit hoặc thậm chí 4-bit
Tương tự như việc nén ảnh PNG thành JPG, nhưng cho dữ liệu số
Kết quả: Có thể giảm kích thước mô hình lên đến 75% trong một số trường hợp
Knowledge Distillation (Chưng cất kiến thức):
Mô hình lớn (giáo viên) dạy mô hình nhỏ hơn (học sinh)
Tương tự việc một giáo sư truyền đạt kiến thức cho sinh viên
Kết quả: Mô hình nhỏ hơn có thể đạt được hiệu suất từ 85-95% so với mô hình lớn, tùy thuộc vào tác vụ cụ thể
Mặc dù DeepSeek đã đạt được tiến bộ đáng kể trong việc nén mô hình, nhưng mô hình đầy đủ (671B parameters) vẫn yêu cầu phần cứng mạnh mẽ, có thể lên tới 256GB VRAM hoặc RAM. Tuy nhiên, phiên bản nén (37B parameters) có thể chạy trên các GPU có ít bộ nhớ hơn, giúp giảm đáng kể chi phí phần cứng và mở rộng khả năng tiếp cận của AI cho nhiều ứng dụng hơn.
Những tiến bộ này trong công nghệ nén AI đang giúp đưa sức mạnh của các mô hình lớn đến gần hơn với các thiết bị phổ thông, tương tự như việc bạn có thể tận hưởng hiệu suất cao mà không cần đầu tư vào phần cứng đắt tiền. Trong khi các mô hình AI khác đòi hỏi GPU 80GB RAM trị giá 40.000 đô, DeepSeek chạy ngon lành trên GPU 16GB giá 2.000 đô. Điều này giống như việc bạn vẫn có thể đi làm bằng xe máy phổ thông thay vì phải mua xe sang.
Phần 4: Tương Lai Không Xa
Cuộc Giải Phóng và Dân Chủ Hóa AI
Silicon Valley đã thống trị AI quá lâu, tạo ra một hệ sinh thái khép kín nơi:
Chi phí nghiên cứu cao ngất ngưởng
Nguồn nhân tài bị giới hạn trong một số trường đại học
Công nghệ bị kiểm soát bởi một số ít công ty
Giờ đây, như cách mà xe máy Trung Quốc đã giúp người Việt Nam có phương tiện đi lại và kinh doanh, AI phương Đông đang phá vỡ thế độc quyền này. DeepSeek đang chứng minh rằng:
AI có thể được phát triển với chi phí hợp lý
Nhân tài có thể đến từ bất kỳ đâu, hay anh hùng không câu nệ xuất thân
Công nghệ có thể được chia sẻ và cải tiến bởi cộng đồng
Cơ Hội cho Việt Nam và Các Nước Đang Phát Triển
Chúng ta không nhất thiết phải là người tiên phong, nhưng chúng ta có thể là người biết nắm bắt cơ hội. DeepSeek đã chứng minh rằng để xây dựng một hệ thống AI hiệu quả, bạn cần:
Tư duy đúng:
Tối ưu hóa thay vì tối đa hóa
Hiệu quả thay vì hoành tráng
Thực tế thay vì lý thuyết
Công nghệ phù hợp:
Tận dụng mô hình mở
Áp dụng kỹ thuật nén và tối ưu
Xây dựng trên nền tảng sẵn có
Chiến lược đúng:
Tập trung vào nhu cầu địa phương
Xây dựng hệ sinh thái bền vững
Phát triển theo từng bước nhỏ
Những Gợi Mở Thú Vị: Khi "Con Voi" AI Bị "Con Chuột" DeepSeek Làm Cho Hoảng Loạn
Dot-com 2.0? Có thể lắm!
Nếu đủ già thì bạn sẽ nhớ những năm 2000 (hoặc là bạn có thể tìm hiểu lại)? Khi mà mọi thứ có ".com" đều được định giá như vàng? Vài ví dụ điển hình:
Pets.com: Từ 11 tỷ đô xuống 0 trong 268 ngày
Webvan.com: Đốt 800 triệu đô trong 3 năm
Boo.com: Tiêu 188 triệu đô trong 18 tháng
Giờ chúng ta đang chứng kiến một thứ tương tự với đuôi ".ai":
Mọi startup gắn mác AI đều được định giá cao ngất
Các quỹ đầu tư đổ tiền vào bất cứ thứ gì có chữ "AI"
Các công ty truyền thống vội vàng "AI-washing"
Chỉ một startup nhỏ từ Trung Quốc cũng có thể làm bay hơi hơn 1000 tỷ đô la từ NASDAQ trong một ngày - điều này nghe quen không? Đây không phải là câu chuyện đùa. Khi NVIDIA mất 17% giá trị chỉ trong một phiên giao dịch, các nhà đầu tư bắt đầu tự hỏi: "Liệu chúng ta có đang định giá quá cao cho công nghệ AI?"
Sovereign AI: Từ Seoul đến Giấc Mơ AI Bản Địa
Tháng 11/2023, tại hội nghị ASOCIO ở Seoul, tôi được nghe một Head of AI đến từ Naver trình bày bài tham luận có đề cập đến đến khái niệm "Sovereign AI". Trong bài thuyết trình kéo dài 30 phút, ông đã vẽ ra một bức tranh về tương lai nơi mỗi quốc gia có thể:
Phát triển AI theo ngôn ngữ và văn hóa của riêng mình
Kiểm soát hoàn toàn dữ liệu và thuật toán
Tạo ra các ứng dụng phù hợp với nhu cầu địa phương
Lúc đó, trong khán phòng, nhiều người còn tỏ ra hoài nghi. Một là có phải ông anh này đang bán cơ sở hạ tầng và best practice của Naver AI cho các nước không dùng tiếng Anh không? Và làm sao một quốc gia đang phát triển có thể cạnh tranh với các gã khổng lồ công nghệ có ngân sách không giới hạn?
Và rồi DeepSeek xuất hiện năm nay.
Đột nhiên, Sovereign AI không còn là giấc mơ xa vời. DeepSeek cho thấy các nước đang phát triển không cần phải:
Đốt hàng tỷ đô la vào phần cứng siêu đắt đỏ
Sở hữu công nghệ lõi phức tạp từ các phòng lab hàng đầu
Phụ thuộc vào các mô hình của phương Tây vốn không thực sự hiểu văn hóa địa phương
Thay vào đó, họ có thể:
Tận dụng mô hình mở như DeepSeek làm nền tảng
Huấn luyện bằng dữ liệu địa phương để tạo ra AI "hiểu" văn hóa bản địa
Xây dựng AI phù hợp với từng ngành nghề và lĩnh vực cụ thể
Phát triển các ứng dụng đáp ứng nhu cầu thực tế của người dùng trong nước
Kết Luận: Một Khởi Đầu Mới
Hai năm trước, ChatGPT đã khởi động cuộc cách mạng AI. Giờ đây, DeepSeek đang mở ra một chương mới: thời đại của AI dân chủ, nơi công nghệ không còn là đặc quyền của người giàu.
Nếu ChatGPT là iPhone của thế giới AI, thì DeepSeek đang trở thành... Xiaomi của nó. Và đừng coi thường Xiaomi - họ đang là nhà sản xuất smartphone lớn thứ 3 thế giới đấy!
Nếu thấy newsletter này có ích, hãy chia sẻ với bạn hoặc là đăng ký nhận thư này nếu bạn chưa sub nha. :D
Thân,
Trí 👋🏼
Cảm ơn bạn đã ủng hộ. Cheers! :D