Dòng Nội dung
1
Cách tiếp cận dịch máy thông kê dựa trên cú pháp giải bài toán tự động khôi phục dấu cho văn bản / Nguyễn Minh Hải, Nguyễn Minh Tuấn // Tạp chí Tin học và Điều khiển học = Journal of Computer Science And Cybernetics . - 2014. - Tr. 39-48. - ISSN:


10 tr.
Ký hiệu phân loại (DDC): 600
Trong bài báo này việc tự động hóa khôi phục dấu cho văn bản được mô hình hóa như một bài toán dịch máy thông kê dựa trên cú pháp với đầu vào là các văn bản không dấu và đầu ra là các văn bản có dấu của cùng một ngôn ngữ. Kỹ thật suy diễn văn phạm ABL trong [2] được mở rộng để xây dựng văn phạm phi ngữ cảnh đồng bộ xác suất từ ngữ liệu chỉ chưa các câu phẳng (plain text) có dấu. Việc khôi phục dấu cho văn bản chính là việc phân tích cú pháp cho các câu của văn bản bằng phiên bản xác suất của thuật toán phân tích cú pháp CKY trên văn phạm nhận được. Phương pháp được thử nghiêm trên tiếng Việt và cho kết quả tốt. Do tính độc lập của ngôn ngữ cao nên hệ thống có thể áp dụng cho các ngôn ngữ khác
Số bản sách: (0) Tài liệu số: (0)