Sau chatbot và AI Agent, Trung Quốc đang bùng nổ ‘cơn sốt vàng’ mới, giá trị thị trường lên tới 36 tỷ USD

28/04/2026 20:28

Trung Quốc đang bùng nổ cơn sốt mới về AI với tổng giá trị thị trường có thể lên đến 36 tỷ USD.

Tờ SCMP cho hay sau cuộc chiến giá rẻ của chatbot và làn sóng AI Agent, ngành công nghiệp trí tuệ nhân tạo (AI) tại quốc gia tỷ dân đã nhanh chóng tìm thấy "long mạch" mới: Video do AI tạo ra. Đây không còn là một cuộc dạo chơi về công nghệ mà đã trở thành một cuộc đua thương mại hóa khốc liệt, nơi mỗi giây hình ảnh đều được định giá bằng USD.

Tháng 2/2026, giới công nghệ Trung Quốc chứng kiến một cuộc chiến trợ giá chatbot tàn khốc. Bước sang tháng 3, AI Agent (đại lý AI) trở thành từ khóa thời thượng. Nhưng chỉ chưa đầy 30 ngày sau, tiêu điểm đã dịch chuyển hoàn toàn sang video AI.

Cuộc cạnh tranh này không chỉ diễn ra giữa các nhà phát triển mô hình mà còn lan rộng ra toàn bộ hệ sinh thái từ nền tảng nội dung, studio game cho đến các công ty quảng cáo.

Điểm khác biệt lớn nhất của giai đoạn này chính là tính thực tế. Tại Trung Quốc, video AI đang trở thành một trong số ít các ứng dụng tạo sinh có khả năng hái ra tiền thực sự, nhờ vào nhu cầu khổng lồ từ thị trường nội dung và thương mại điện tử.

Tuy nhiên, đi kèm với sự bùng nổ là những rủi ro về bản quyền, an toàn nội dung và sự kiểm soát ngày càng chặt chẽ từ phía cơ quan quản lý.

Cuộc đua "tam mã" và những kẻ thách thức

Chỉ trong vòng vài tháng đầu năm 2026, thị trường đã chứng kiến sự xuất hiện của gần 10 mô hình tạo video mới, phần lớn đến từ các doanh nghiệp Trung Quốc.

Kuaishou Technology, cái tên vốn được coi là "lão làng" trong lĩnh vực này, đã tung ra phiên bản nâng cấp của mô hình Kling vào ngày 5/2. Không để đối thủ độc chiếm hào quang, ByteDance ngay lập tức phản đòn bằng Seedance 2.0 chỉ vài ngày sau đó. Seedance 2.0 nhanh chóng chiếm lĩnh truyền thông nhờ khả năng chuyển động camera linh hoạt và ngôn ngữ hình ảnh có độ nhất quán cao hơn hẳn người tiền nhiệm.

Không dừng lại ở đó, danh sách các đối thủ nặng ký liên tục kéo dài. Kunlun Tech ra mắt SkyReels V4 vào cuối tháng 2, chiếm vị trí đầu bảng xếp hạng của đơn vị phân tích Artificial Analysis về khả năng tạo video từ văn bản kèm âm thanh. Đến đầu tháng 4, Alibaba cũng chính thức nhập cuộc với HappyHorse 1.0.

Cuộc chiến giờ đây không còn là sân chơi riêng của những "tay chơi" mô hình ngôn ngữ lớn (LLM). Bilibili đã bắt đầu thử nghiệm công cụ Updream, trong khi iQiyi ra mắt nền tảng AI Agent dành riêng cho các nhà sản xuất phim chuyên nghiệp.

Thậm chí, "ông trùm" Tencent Games cũng giới thiệu công cụ chuyển đổi video sang hoạt hình 3D và mô hình tạo lập thế giới game từ văn bản. Đáng chú ý nhất phải kể đến sự xuất hiện của Cai Haoyu - đồng sáng lập Mihoyo (cha đẻ của Genshin Impact) với một startup tại Mỹ có khả năng tạo ra các nhân vật ảo có biểu cảm sinh động như người thật.

Sức nóng của thị trường được minh chứng qua những con số thống kê thực tế. Tính đến tháng 3/2026, lượng sử dụng token hàng ngày trên mô hình Doubao của ByteDance đã vượt ngưỡng 120 nghìn tỷ, tăng gấp đôi chỉ trong vòng 3 tháng.

Theo báo cáo từ Hiệp hội Dịch vụ Truyền dẫn Netcasting Trung Quốc công bố ngày 14/4, hơn 2 tỷ đoạn video và âm thanh do AI tạo ra đã xuất hiện trong năm 2025, tăng gấp 14 lần so với năm trước. Douyin ước tính thị trường ứng dụng video AI cho doanh nghiệp toàn cầu có thể đạt quy mô 36 tỷ USD vào năm 2030.

Theo SCMP, thị trường video AI đã có sự phân hóa rõ rệt ở Trung Quốc. Thứ nhất là nhóm "thu hoạch sớm". Mô hình Kling của Kuaishou đã mang về doanh thu hơn 1 tỷ nhân dân tệ (tương đương khoảng 147 triệu USD) trong năm 2025 nhờ hàng chục triệu người dùng cá nhân và hàng nghìn khách hàng doanh nghiệp.

Dù con số này còn khiêm tốn so với tổng doanh thu của Kuaishou, CEO Cheng Yixiao khẳng định sẽ tiếp tục đầu tư mạnh mẽ với kỳ vọng doanh thu từ mảng này sẽ tăng gấp đôi vào năm 2026.

Thứ hai là nhóm "định giá cao cấp". ByteDance đang chứng minh rằng nhu cầu lớn có thể duy trì mức giá cao. Seedance 2.0 hiện có mức phí khoảng 13,8 nhân dân tệ cho một đoạn clip 15 giây (tương đương gần 1 nhân dân tệ cho mỗi giây video).

Đây là mức giá cao hơn mặt bằng chung nhưng khách hàng doanh nghiệp vẫn sẵn sàng chi trả để không phải chờ đợi hàng giờ đồng hồ do hệ thống quá tải.

Thứ ba là nhóm "chiếm lĩnh thị trường bằng miễn phí". HappyHorse của Alibaba hiện đang cho phép truy cập miễn phí. Tuy nhiên, một giám đốc điều hành của Alibaba Cloud thừa nhận đây chỉ là chiến lược marketing ngắn hạn và khó có thể duy trì lâu dài do chi phí tính toán cực kỳ đắt đỏ.

Rào cản pháp lý

Bên cạnh đó, tờ SixthTone đánh giá dù tiến bộ thần tốc, ngành công nghiệp video AI tại Trung Quốc đang phải đối mặt với những thách thức pháp lý và đạo đức nghiêm trọng.

Vấn đề bản quyền hình ảnh và quyền sở hữu trí tuệ đang trở nên nhức nhối. Tháng 3 vừa qua, Tòa án Internet Bắc Kinh đã thụ lý vụ việc nữ diễn viên Địch Lệ Nhiệt Ba khởi kiện một đơn vị sản xuất sử dụng khuôn mặt tổng hợp giống hệt cô.

ByteDance cũng từng phải gỡ bỏ hàng loạt phim ngắn trên nền tảng Hongguo sau khi không chứng minh được tính hợp pháp của nguyên liệu đầu vào.

Thậm chí, tham vọng vươn ra toàn cầu của ByteDance cũng gặp trở ngại khi Seedance 2.0 vấp phải sự phản đối dữ dội tại Hollywood do người dùng tạo ra các video vi phạm bản quyền nhân vật. Điều này buộc công ty phải tạm dừng triển khai tại nước ngoài để thiết lập hệ thống bảo vệ bản quyền toàn diện hơn.

Bên cạnh đó, áp lực từ cơ quan quản lý cũng đang gia tăng. Chỉ trong một tháng, 6 nền tảng lớn bao gồm Douyin và Kuaishou đã gỡ bỏ hơn 37.000 clip vi phạm và xử lý hơn 3.400 tài khoản theo yêu cầu tiêu chuẩn hóa nhãn dán nội dung AI. Các nội dung xuyên tạc lịch sử hoặc thiếu chuẩn mực đạo đức cũng bị truy quét gắt gao với gần 29.000 video bị xóa bỏ.

Có thể thấy, Trung Quốc đang trở thành "phòng thí nghiệm" lớn nhất thế giới để kiểm chứng liệu video AI có thể trở thành một ngành công nghiệp bền vững hay không. Trong khi các thị trường phương Tây còn đang dè chừng vì rào cản bản quyền, sự bứt tốc của Trung Quốc có thể sẽ tạo ra một lợi thế chiến lược trong cuộc đua AI toàn cầu.

*Nguồn: SCMP, SixthTone