thông tin biểu ghi
  • Bài trích
  • Ký hiệu PL/XG: 005
    Nhan đề: Cách tiếp cận dịch may thông kê dựa trên cú pháp giải bài toán tự động khôi phục dấu cho văn bản /

DDC 005
Tác giả CN Nguyễn, Minh Hải
Nhan đề Cách tiếp cận dịch may thông kê dựa trên cú pháp giải bài toán tự động khôi phục dấu cho văn bản / Nguyễn Minh Hải, Nguyễn Minh Tuấn
Mô tả vật lý 10 tr.
Tóm tắt Trình bày việc tự động hóa khôi phục dấu cho văn bản được mô hình hóa như một bài toán dịch máy thông kê dựa trên cú pháp với đầu vào là các văn bản không dấu và đầu ra là các văn bản có dấu của cùng một ngôn ngữ. Kỹ thật suy diễn văn phạm ABL được mở rộng để xây dựng văn phạm phi ngữ cảnh đồng bộ xác suất từ ngữ liệu chỉ chưa các câu phẳng (plain text) có dấu. Việc khôi phục dấu cho văn bản chính là việc phân tích cú pháp cho các câu của văn bản bằng phiên bản xác suất của thuật toán phân tích cú pháp CKY trên văn phạm nhận được. Phương pháp được thử nghiêm trên tiếng Việt và cho kết quả tốt. Do tính độc lập của ngôn ngữ cao nên hệ thống có thể áp dụng cho các ngôn ngữ khác.
Từ khóa tự do Khôi phục dấu tự động
Từ khóa tự do Suy diễn văn phạm
Từ khóa tự do Thuật toán phân tích cú pháp
Từ khóa tự do Văn phạm phi ngữ cảnh đồng bộ
Từ khóa tự do Dịch máy dựa trên cú pháp
Tác giả(bs) CN Nguyễn, Minh Tuấn
Nguồn trích Tạp chí Tin học và Điều khiển học = Journal of Computer Science And Cybernetics 2014Tr. 39-48 Số: 01 Tập: 30
000 00000nab#a2200000ui#4500
00120218
0029
0045523BBA5-41B5-436F-B768-8BB3215F0B99
005202005071519
008081223s vm| vie
0091 0
039|a20200507152150|bngantk|y20200325164430|zthaopt
082 |a005
100 |aNguyễn, Minh Hải
245 |aCách tiếp cận dịch may thông kê dựa trên cú pháp giải bài toán tự động khôi phục dấu cho văn bản / |cNguyễn Minh Hải, Nguyễn Minh Tuấn
300 |a10 tr.
520 |aTrình bày việc tự động hóa khôi phục dấu cho văn bản được mô hình hóa như một bài toán dịch máy thông kê dựa trên cú pháp với đầu vào là các văn bản không dấu và đầu ra là các văn bản có dấu của cùng một ngôn ngữ. Kỹ thật suy diễn văn phạm ABL được mở rộng để xây dựng văn phạm phi ngữ cảnh đồng bộ xác suất từ ngữ liệu chỉ chưa các câu phẳng (plain text) có dấu. Việc khôi phục dấu cho văn bản chính là việc phân tích cú pháp cho các câu của văn bản bằng phiên bản xác suất của thuật toán phân tích cú pháp CKY trên văn phạm nhận được. Phương pháp được thử nghiêm trên tiếng Việt và cho kết quả tốt. Do tính độc lập của ngôn ngữ cao nên hệ thống có thể áp dụng cho các ngôn ngữ khác.
653 |aKhôi phục dấu tự động
653 |aSuy diễn văn phạm
653 |aThuật toán phân tích cú pháp
653 |aVăn phạm phi ngữ cảnh đồng bộ
653 |aDịch máy dựa trên cú pháp
700 |aNguyễn, Minh Tuấn
773 |tTạp chí Tin học và Điều khiển học = Journal of Computer Science And Cybernetics |d2014|gTr. 39-48|v30|i01
890|c1|a0|b0|d7
Không tìm thấy biểu ghi nào