Tập đoàn Việt vừa ra mắt công ty AI mục tiêu doanh thu 1 tỷ USD: Từng có sản phẩm vượt cả Deepseek, Baidu
Tập đoàn này cho biết đã làm chủ 25 công nghệ lõi và đặt mục tiêu có nền tảng điện toán đám mây số 1 của người Việt.
Mục tiêu doanh thu từ AI đạt 1 tỷ USD
Hôm 21/8, Tập đoàn Công nghệ CMC chính thức ra mắt Công ty CMC OpenAI (C-OpenAI) với mục tiêu doanh thu đạt trên 1 tỷ USD vào năm 2028.
CMC OpenAI được xây dựng trên nền tảng 25 công nghệ lõi do Tập đoàn CMC nghiên cứu và phát triển, gồm thị giác máy tính, xử lý ngôn ngữ tự nhiên (NLP), mô hình ngôn ngữ lớn (LLM), xử lý giọng nói và hồ dữ liệu (Data Lake House). Toàn bộ hệ thống của C-OpenAI vận hành trên hạ tầng CMC Cloud, bảo đảm chủ quyền dữ liệu Việt Nam.
Theo tiết lộ của ông Đặng Văn Tú, Tổng giám đốc CMC OpenAI, các công nghệ trên đã được thương mại hóa và lọt vào các bảng xếp hạng quốc tế. Công ty này định hướng ứng dụng AI vào nhiều lĩnh vực như hành chính công (trợ lý ảo pháp lý quốc gia, trợ lý công dân), giáo dục, y tế, tài chính - ngân hàng và sản xuất.
Có mô hình hiểu tài liệu hơn cả Deepseek

Ảnh minh họa.
Trên website của tập đoàn cũng giới thiệu, trước đó, Viện Ứng dụng Công nghệ CMC cũng đã ra mắt mô hình hiểu tài liệu thị giác CATI-VLM, sử dụng 3 tỷ tham số.
Mô hình đã lọt Top 12 thế giới với hạng mục Document Visual Question Answering (DocVQA) tại cuộc thi khoa học trong lĩnh vực thị giác máy tính và nhận dạng văn bản Robust Reading Competition (RRC) tháng 6/2025.
Thành tích này vượt nhiều mô hình như Deepseek (27 tỷ tham số), GPT-4 Vision Turbo kết hợp Amazon Textract OCR (Top 34) hay Baidu (Top 22).
Mô hình hiểu tài liệu thị giác CATI-VLM được phát triển từ kho dữ liệu lớn 5TB. Theo giới thiệu của tập đoàn này, điểm nổi bật của mô hình là không chỉ nhận dạng và chuyển đổi văn bản như các hệ thống OCR (Nhận dạng ký tự quang học) truyền thống, mà còn hiểu được nhiều thông tin như checkbox, biểu đồ, chữ ký, công thức; nhận diện bố cục trang, form mẫu và phong cách trình bày. Mô hình có thể trực tiếp trả lời các câu hỏi từ ảnh chụp tài liệu như ChatGPT mà không cần học trước.