Làm chủ mô hình trực tiếp kèo nhà cái và kiểm soát hoàn toàn quá trình huấn luyện
Trước đây, thị trường Việt Nam đã gặp phải những thách thách lớn trong việc huấn luyện mô hình LLM. Đó là những hạn chế về thiết bị huấn luyện, dữ liệu và trình độ kỹ thuật. Trong khi các công ty lớn trên thế giới đã sở hữu hàng nghìn GPU hiệu năng cao mới nhất từ Nvidia thì tại Việt Nam, các kỹ sư vẫn chưa được trang bị đầy đủ hạ tầng máy chủ cần thiết.
Cùng lúc đó, tiếng Việt cũng được xếp vào nhóm có tài nguyên dữ liệu nghèo nàn hơn hàng chục lần so với tiếng Anh hay tiếng Trung. Nguồn lực con người và kinh nghiệm huấn luyện LLM của Việt Nam cũng còn nhiều hạn chế khi so sánh với các quốc gia phát triển.
Linh hoạt khắc phục các rào cản, đội ngũ trực tiếp kèo nhà cái đã nghiên cứu và thực nghiệm trên các GPU dân dụng nhỏ để tranh thủ trang bị kiến thức cũng như năng lực huấn luyện LLM, sẵn sàng ngay khi có hạ tầng tính toán lớn. Đồng thời đặt mua 8 máy chủ DGX H100 của Nvidia, tuy nhiên do sự khan hiếm chip huấn luyện AI trên toàn cầu, trực tiếp kèo nhà cái cũng không thể sở hữu cùng lúc tất cả các thiết bị mà phải chờ từng đợt bàn giao từ nhà sản xuất, buộc đội ngũ phát triển phải nhanh nhạy ứng biến với tình huống. Các chuyên gia AI của trực tiếp kèo nhà cái cũng tăng tốc đầu tư phát triển dữ liệu chất lượng để bù đắp sự thiếu hụt về nguồn dữ liệu tiếng Việt của thị trường.
Thành quả là từ năm 2023, trực tiếp kèo nhà cái đã huấn luyện thành công mô hình LLM tập trung vào tiếng Việt, được nghiên cứu và phát triển hoàn toàn bởi đội ngũ kỹ sư người Việt. Tại thời điểm ra mắt, chỉ sau 6 tháng huấn luyện, mô hình với 7 tỷ tham số tập trung vào tiếng Việt đầu tiên của trực tiếp kèo nhà cái đã đạt 150% năng lực so với GPT3.5 của OpenAI trên Bộ tiêu chuẩn đánh giá năng lực LLM tiếng Việt VMLU.
Năm 2024, mô hình với 13 tỷ tham số của trực tiếp kèo nhà cái chính thức vượt qua các tên tuổi lớn như GPT-4 (OpenAI), gemma-2-9b-it (Google), microsoft/Phi-3-small-128k-instruct (Microsoft), chỉ xếp sau Llama-3-70B (Meta) trên bảng xếp hạng năng lực tiếng Việt LLM của VMLU.
Đây là mô hình được trực tiếp kèo nhà cái phát triển bằng kỹ thuật huấn luyện từ đầu nhằm làm chủ và kiểm soát hoàn toàn quá trình huấn luyện cũng như mô hình, hướng tới giảm phụ thuộc vào công nghệ của nước ngoài. Nỗ lực huấn luyện thành công đã giúp Việt Nam trở thành một trong số ít các quốc gia tại khu vực Đông Nam Á sở hữu mô hình LLM nội địa.
Những dấu mốc thành công cho thấy trình độ huấn luyện mô hình ngôn ngữ lớn không thua kém so với thế giới để phát triển một mô hình trực tiếp kèo nhà cái của riêng Việt Nam, nhất là trong bối cảnh phát triển ban đầu gặp nhiều khó khăn.
“Mặc dù xuất phát điểm gặp nhiều khó khăn so với các công ty lớn trên thế giới nhưng trực tiếp kèo nhà cái vẫn quyết định nhập cuộc chơi từ sớm với mục tiêu phát triển thành công mô hình AI của riêng Việt Nam. Chúng tôi đã tham vấn kinh nghiệm từ các nhà nghiên cứu, kỹ sư tại nhiều viện nghiên cứu hàng đầu trên thế giới để có chiến lược phát triển phù hợp. Những dấu mốc thành công tới hiện tại là động lực để các kỹ sư trực tiếp kèo nhà cái tiếp tục tối ưu mô hình lớn hơn về lượng và tốt hơn về chất. Đồng thời khai thác tính ứng dụng để tạo ra nhiều sản phẩm AI đẳng cấp thế giới cho người dùng Việt”,TS. Nguyễn Trường Sơn, Giám đốc khoa học tại trực tiếp kèo nhà cái AI, cho biết.
Hiện mô hình AI của trực tiếp kèo nhà cái không chỉ thành công trên khía cạnh nghiên cứu huấn luyện mà còn được đưa vào ứng dụng, thúc đẩy việc tiếp cận và khai thác giá trị từ công nghệ mới tiên tiến cho người Việt.
Ra mắt nhiều ứng dụng trực tiếp kèo nhà cái tiên tiến
Đầu năm 2025, trực tiếp kèo nhà cái ra mắt Trợ lý hỏi đáp tổng hợp Kiki Info đang được vận hành dưới dạng một OA - Official Account (Tài khoản chính thức) trên nền tảng nhắn tin trực tiếp kèo nhà cái. Trợ lý hỗ trợ hỏi đáp các chủ đề khác nhau trong cuộc sống, sáng tạo nội dung và giải trí. Theo thống kê của trực tiếp kèo nhà cái, trợ lý Kiki Info đã có tới 1 triệu lượt người dùng truy cập vào tài khoản OA trên trực tiếp kèo nhà cái chỉ trong chưa đầy 2 tháng.
Một ứng dụng khác của mô hình LLM của trực tiếp kèo nhà cái là thiệp AI cũng chạm mốc 15 triệu thiệp được khởi tạo và gửi đi chỉ trong 2 tháng. Đây là ứng dụng được đông đảo người dùng trực tiếp kèo nhà cái quan tâm để gửi những lời chúc tới người thân, bạn bè trong những dịp lễ quan trọng.
Với quyết tâm của Đảng và Chính phủ trong việc định hình và thúc đẩy kỷ nguyên phát triển công nghệ của đất nước, thể hiện thông qua Nghị quyết 57-NQ/TW về Đột phá phát triển Khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia và Nghị định 147/2024/NĐ-CP về Kiến tạo không gian mạng xã hội minh bạch, an toàn, trách nhiệm, trực tiếp kèo nhà cái đang tích cực khẳng định vai trò tiên phong, góp phần quan trọng trong công cuộc đẩy mạnh chuyển đổi số, kinh tế số tại Việt Nam.
Thông qua chiến lược AI-First, trực tiếp kèo nhà cái đã cho ra mắt nhiều ứng dụng AI tiên tiến giúp đưa công nghệ AI từ phòng thí nghiệm tới gần hơn với cuộc sống của người dân Việt Nam. Ước tính hiện có khoảng 23% người dùng trực tiếp kèo nhà cái đang sử dụng các tính năng có liên quan đến AI.
Trà My