Xử lý dữ liệu đầu vào càng tốt, mô hình soi kèo nhà cái hôm nay cho kết quả càng cao. Ảnh: Extemetech
Được phát động từ đầu tháng 9, VLSP 2019 có bốn hạng mục, gồm: Hate Speech Detection on Social Networks (Nhận diện các nội dụng tiêu cực, độc hại trên mạng xã hội), Vietnamese dependency parsing (Phân tích cấu trúc soi kèo nhà cái hôm nay Việt); Automatic Speech Recognition (Nhận dạng soi kèo nhà cái hôm nay nói); Text To Speech (Tổng hợp soi kèo nhà cái hôm nay nói).
Trong đó, về đề soi kèo nhà cái hôm nay Text to Speech, tập dữ liệu huấn luyện gồm 15.000 đoạn ghi âm giọng miền Nam (tổng thời gian 23 giờ) và gần 1.000 đoạn ghi âm giọng miền Bắc (tổng thời gian 45 phút). Sau đó, ban tổ chức gửi cho các đội soi kèo nhà cái hôm nay 60 câu văn bản cho mỗi giọng và mô hình AI của các đội soi kèo nhà cái hôm nay phải sinh ra file âm thanh những câu đó. Kết quả này được gửi ngẫu nhiên cho 24 người, những người này sẽ chấm điểm dựa trên chất lượng giọng nói và mức độ tự nhiên của file âm thanh.
Điểm khó nhất của đề soi kèo nhà cái hôm nay này là là dữ liệu đầu vào khá nhiễu, các đội soi kèo nhà cái hôm nay cần lọc sạch dữ liệu để training tốt nhất cho mô hình AI. Tuy nhiên, thời gian xử lý dữ liệu chỉ có hai tuần khiến cho nhiều đội soi kèo nhà cái hôm nay gặp trở ngại. “Đội Zalo đã sáng tạo ra giải pháp chuẩn hóa dữ liệu ban đầu hoàn toàn tự động, đây cũng là điểm nổi trội hơn so với các đội soi kèo nhà cái hôm nay khác” - ông Nguyễn Quốc Bảo, Lead Scientist của Zalo, chia sẻ.
Ngoài ra, vốn là đơn vị đang tập trung đầu tư nghiên cứu mảng xử lý soi kèo nhà cái hôm nay nói soi kèo nhà cái hôm nay Việt, Zalo có thế mạnh về công nghệ và con người. Đơn vị này đang ứng dụng các công nghệ mới nhất hiện nay về xử lý ngôn ngữ tự nhiên và soi kèo nhà cái hôm nay nói, cùng với đội ngũ kỹ sư AI nhiều kinh nghiệm, đội Zalo đã vượt qua nhiều đối thủ đáng gờm, đạt giải nhất với số điểm 3.94/5 hạng mục Text To Speech.
Ban tổ chức và các đội dự soi kèo nhà cái hôm nay tại VLSP.
Xử lý soi kèo nhà cái hôm nay nói soi kèo nhà cái hôm nay Việt được nghiên cứu ở Việt Nam từ lâu nhưng áp dụng thì chỉ mới bước đầu. Đây cũng là bài toán khó trong nghiên cứu và phát triển AI tại Việt Nam. Trong nhiều năm qua, bài toán này được đưa vào đề thi của VLSP nhằm kết nối các nhóm chuyên gia của doanh nghiệp, trường đại học và viện nghiên cứu, chia sẻ kinh nghiệm và tìm ra giải pháp tốt nhất trong lĩnh vực xử lý ngôn ngữ tự nhiên và giọng nói soi kèo nhà cái hôm nay Việt.
Ông Nguyễn Quốc Bảo cho rằng, dữ liệu huấn luyện phải từ 2.000 giờ trở lên và đảm bảo đa dạng giọng, vùng miền và cách nói thì mô hình AI - Nhận dạng soi kèo nhà cái hôm nay nói mới có khả năng áp dụng thực tế tốt. Với những đơn vị đầu tư quyết liệt vào AI như Zalo, cơ hội tiệm cận với các tập đoàn công nghệ hàng đầu thế giới là rất lớn.
Hiện Zalo đang ứng dụng công nghệ xử lý soi kèo nhà cái hôm nay nói vào phát triển và hoàn thiện trợ lý ảo Ki-Ki, đồng thời, sẽ triển khai tích hợp vào 2 sản phẩm Zing News và Báo Mới trong thời gian tới để mang đến trải nghiệm tốt nhất cho người dùng.
Cũng trong sự kiện VLSP 2019, Zalo đạt giải nhì hạng mục Automatic Speech Recognition (Nhận diện soi kèo nhà cái hôm nay nói).
T.Văn