thông tin biểu ghi
  • Bài trích
  • Ký hiệu PL/XG: 600
    Nhan đề: Cách tiếp cận dịch máy thông kê dựa trên cú pháp giải bài toán tự động khôi phục dấu cho văn bản /

DDC 600
Tác giả CN Nguyễn, Minh Hải
Nhan đề Cách tiếp cận dịch máy thông kê dựa trên cú pháp giải bài toán tự động khôi phục dấu cho văn bản / Nguyễn Minh Hải, Nguyễn Minh Tuấn
Mô tả vật lý 10 tr.
Tóm tắt Trong bài báo này việc tự động hóa khôi phục dấu cho văn bản được mô hình hóa như một bài toán dịch máy thông kê dựa trên cú pháp với đầu vào là các văn bản không dấu và đầu ra là các văn bản có dấu của cùng một ngôn ngữ. Kỹ thật suy diễn văn phạm ABL trong [2] được mở rộng để xây dựng văn phạm phi ngữ cảnh đồng bộ xác suất từ ngữ liệu chỉ chưa các câu phẳng (plain text) có dấu. Việc khôi phục dấu cho văn bản chính là việc phân tích cú pháp cho các câu của văn bản bằng phiên bản xác suất của thuật toán phân tích cú pháp CKY trên văn phạm nhận được. Phương pháp được thử nghiêm trên tiếng Việt và cho kết quả tốt. Do tính độc lập của ngôn ngữ cao nên hệ thống có thể áp dụng cho các ngôn ngữ khác
Từ khóa tự do Automatic diacritization
Từ khóa tự do Grammatical inference
Từ khóa tự do Khôi phục dấu tự động
Từ khóa tự do Suy diễn văn phạm
Từ khóa tự do Syntax-based machine translation
Từ khóa tự do Thuật toán phân tích cú pháp
Từ khóa tự do Văn phạm phi ngữ cảnh đồng bộ
Từ khóa tự do CKY parsing algorithm
Từ khóa tự do Synchronous context-free grammar
Tác giả(bs) CN Nguyễn, Minh Tuấn
Nguồn trích Tạp chí Tin học và Điều khiển học = Journal of Computer Science And Cybernetics 2014Tr. 39-48 Số: 1 Tập: 30
000 00000nab#a2200000ui#4500
00120199
0029
004041B8EF7-9356-4684-9EED-670492FEC91C
005202003242240
008081223s vm| vie
0091 0
039|y20200324224003|zthaopt
082 |a600
100 |aNguyễn, Minh Hải
245 |aCách tiếp cận dịch máy thông kê dựa trên cú pháp giải bài toán tự động khôi phục dấu cho văn bản / |cNguyễn Minh Hải, Nguyễn Minh Tuấn
300 |a10 tr.
520 |aTrong bài báo này việc tự động hóa khôi phục dấu cho văn bản được mô hình hóa như một bài toán dịch máy thông kê dựa trên cú pháp với đầu vào là các văn bản không dấu và đầu ra là các văn bản có dấu của cùng một ngôn ngữ. Kỹ thật suy diễn văn phạm ABL trong [2] được mở rộng để xây dựng văn phạm phi ngữ cảnh đồng bộ xác suất từ ngữ liệu chỉ chưa các câu phẳng (plain text) có dấu. Việc khôi phục dấu cho văn bản chính là việc phân tích cú pháp cho các câu của văn bản bằng phiên bản xác suất của thuật toán phân tích cú pháp CKY trên văn phạm nhận được. Phương pháp được thử nghiêm trên tiếng Việt và cho kết quả tốt. Do tính độc lập của ngôn ngữ cao nên hệ thống có thể áp dụng cho các ngôn ngữ khác
653 |aAutomatic diacritization
653 |aGrammatical inference
653 |aKhôi phục dấu tự động
653 |aSuy diễn văn phạm
653 |aSyntax-based machine translation
653 |aThuật toán phân tích cú pháp
653 |aVăn phạm phi ngữ cảnh đồng bộ
653|aCKY parsing algorithm
653|aSynchronous context-free grammar
700 |aNguyễn, Minh Tuấn
773 |tTạp chí Tin học và Điều khiển học = Journal of Computer Science And Cybernetics |d2014|gTr. 39-48|v30|i1
890|a0|b0|c0|d0
Không tìm thấy biểu ghi nào