DDC
| 600 |
Tác giả CN
| Nguyễn, Minh Hải |
Nhan đề
| Cách tiếp cận dịch máy thông kê dựa trên cú pháp giải bài toán tự động khôi phục dấu cho văn bản / Nguyễn Minh Hải, Nguyễn Minh Tuấn |
Mô tả vật lý
| 10 tr. |
Tóm tắt
| Trong bài báo này việc tự động hóa khôi phục dấu cho văn bản được mô hình hóa như một bài toán dịch máy thông kê dựa trên cú pháp với đầu vào là các văn bản không dấu và đầu ra là các văn bản có dấu của cùng một ngôn ngữ. Kỹ thật suy diễn văn phạm ABL trong [2] được mở rộng để xây dựng văn phạm phi ngữ cảnh đồng bộ xác suất từ ngữ liệu chỉ chưa các câu phẳng (plain text) có dấu. Việc khôi phục dấu cho văn bản chính là việc phân tích cú pháp cho các câu của văn bản bằng phiên bản xác suất của thuật toán phân tích cú pháp CKY trên văn phạm nhận được. Phương pháp được thử nghiêm trên tiếng Việt và cho kết quả tốt. Do tính độc lập của ngôn ngữ cao nên hệ thống có thể áp dụng cho các ngôn ngữ khác |
Từ khóa tự do
| Automatic diacritization |
Từ khóa tự do
| Grammatical inference |
Từ khóa tự do
| Khôi phục dấu tự động |
Từ khóa tự do
| Suy diễn văn phạm |
Từ khóa tự do
| Syntax-based machine translation |
Từ khóa tự do
| Thuật toán phân tích cú pháp |
Từ khóa tự do
| Văn phạm phi ngữ cảnh đồng bộ |
Từ khóa tự do
| CKY parsing algorithm |
Từ khóa tự do
| Synchronous context-free grammar |
Tác giả(bs) CN
| Nguyễn, Minh Tuấn |
Nguồn trích
| Tạp chí Tin học và Điều khiển học = Journal of Computer Science And Cybernetics 2014Tr. 39-48
Số: 1
Tập: 30 |
|
000
| 00000nab#a2200000ui#4500 |
---|
001 | 20199 |
---|
002 | 9 |
---|
004 | 041B8EF7-9356-4684-9EED-670492FEC91C |
---|
005 | 202003242240 |
---|
008 | 081223s vm| vie |
---|
009 | 1 0 |
---|
039 | |y20200324224003|zthaopt |
---|
082 | |a600 |
---|
100 | |aNguyễn, Minh Hải |
---|
245 | |aCách tiếp cận dịch máy thông kê dựa trên cú pháp giải bài toán tự động khôi phục dấu cho văn bản / |cNguyễn Minh Hải, Nguyễn Minh Tuấn |
---|
300 | |a10 tr. |
---|
520 | |aTrong bài báo này việc tự động hóa khôi phục dấu cho văn bản được mô hình hóa như một bài toán dịch máy thông kê dựa trên cú pháp với đầu vào là các văn bản không dấu và đầu ra là các văn bản có dấu của cùng một ngôn ngữ. Kỹ thật suy diễn văn phạm ABL trong [2] được mở rộng để xây dựng văn phạm phi ngữ cảnh đồng bộ xác suất từ ngữ liệu chỉ chưa các câu phẳng (plain text) có dấu. Việc khôi phục dấu cho văn bản chính là việc phân tích cú pháp cho các câu của văn bản bằng phiên bản xác suất của thuật toán phân tích cú pháp CKY trên văn phạm nhận được. Phương pháp được thử nghiêm trên tiếng Việt và cho kết quả tốt. Do tính độc lập của ngôn ngữ cao nên hệ thống có thể áp dụng cho các ngôn ngữ khác |
---|
653 | |aAutomatic diacritization |
---|
653 | |aGrammatical inference |
---|
653 | |aKhôi phục dấu tự động |
---|
653 | |aSuy diễn văn phạm |
---|
653 | |aSyntax-based machine translation |
---|
653 | |aThuật toán phân tích cú pháp |
---|
653 | |aVăn phạm phi ngữ cảnh đồng bộ |
---|
653 | |aCKY parsing algorithm |
---|
653 | |aSynchronous context-free grammar |
---|
700 | |aNguyễn, Minh Tuấn |
---|
773 | |tTạp chí Tin học và Điều khiển học = Journal of Computer Science And Cybernetics |d2014|gTr. 39-48|v30|i1 |
---|
890 | |a0|b0|c0|d0 |
---|
|
|
Không tìm thấy biểu ghi nào
Không có liên kết tài liệu số nào