DDC
| 005 |
Tác giả CN
| Nguyễn, Minh Hải |
Nhan đề
| Cách tiếp cận dịch may thông kê dựa trên cú pháp giải bài toán tự động khôi phục dấu cho văn bản / Nguyễn Minh Hải, Nguyễn Minh Tuấn |
Mô tả vật lý
| 10 tr. |
Tóm tắt
| Trình bày việc tự động hóa khôi phục dấu cho văn bản được mô hình hóa như một bài toán dịch máy thông kê dựa trên cú pháp với đầu vào là các văn bản không dấu và đầu ra là các văn bản có dấu của cùng một ngôn ngữ. Kỹ thật suy diễn văn phạm ABL được mở rộng để xây dựng văn phạm phi ngữ cảnh đồng bộ xác suất từ ngữ liệu chỉ chưa các câu phẳng (plain text) có dấu. Việc khôi phục dấu cho văn bản chính là việc phân tích cú pháp cho các câu của văn bản bằng phiên bản xác suất của thuật toán phân tích cú pháp CKY trên văn phạm nhận được. Phương pháp được thử nghiêm trên tiếng Việt và cho kết quả tốt. Do tính độc lập của ngôn ngữ cao nên hệ thống có thể áp dụng cho các ngôn ngữ khác. |
Từ khóa tự do
| Khôi phục dấu tự động |
Từ khóa tự do
| Suy diễn văn phạm |
Từ khóa tự do
| Thuật toán phân tích cú pháp |
Từ khóa tự do
| Văn phạm phi ngữ cảnh đồng bộ |
Từ khóa tự do
| Dịch máy dựa trên cú pháp |
Tác giả(bs) CN
| Nguyễn, Minh Tuấn |
Nguồn trích
| Tạp chí Tin học và Điều khiển học = Journal of Computer Science And Cybernetics 2014Tr. 39-48
Số: 01
Tập: 30 |
|
000
| 00000nab#a2200000ui#4500 |
---|
001 | 20218 |
---|
002 | 9 |
---|
004 | 5523BBA5-41B5-436F-B768-8BB3215F0B99 |
---|
005 | 202005071519 |
---|
008 | 081223s vm| vie |
---|
009 | 1 0 |
---|
039 | |a20200507152150|bngantk|y20200325164430|zthaopt |
---|
082 | |a005 |
---|
100 | |aNguyễn, Minh Hải |
---|
245 | |aCách tiếp cận dịch may thông kê dựa trên cú pháp giải bài toán tự động khôi phục dấu cho văn bản / |cNguyễn Minh Hải, Nguyễn Minh Tuấn |
---|
300 | |a10 tr. |
---|
520 | |aTrình bày việc tự động hóa khôi phục dấu cho văn bản được mô hình hóa như một bài toán dịch máy thông kê dựa trên cú pháp với đầu vào là các văn bản không dấu và đầu ra là các văn bản có dấu của cùng một ngôn ngữ. Kỹ thật suy diễn văn phạm ABL được mở rộng để xây dựng văn phạm phi ngữ cảnh đồng bộ xác suất từ ngữ liệu chỉ chưa các câu phẳng (plain text) có dấu. Việc khôi phục dấu cho văn bản chính là việc phân tích cú pháp cho các câu của văn bản bằng phiên bản xác suất của thuật toán phân tích cú pháp CKY trên văn phạm nhận được. Phương pháp được thử nghiêm trên tiếng Việt và cho kết quả tốt. Do tính độc lập của ngôn ngữ cao nên hệ thống có thể áp dụng cho các ngôn ngữ khác. |
---|
653 | |aKhôi phục dấu tự động |
---|
653 | |aSuy diễn văn phạm |
---|
653 | |aThuật toán phân tích cú pháp |
---|
653 | |aVăn phạm phi ngữ cảnh đồng bộ |
---|
653 | |aDịch máy dựa trên cú pháp |
---|
700 | |aNguyễn, Minh Tuấn |
---|
773 | |tTạp chí Tin học và Điều khiển học = Journal of Computer Science And Cybernetics |d2014|gTr. 39-48|v30|i01 |
---|
890 | |c1|a0|b0|d7 |
---|
| |
Không tìm thấy biểu ghi nào
|
|
|
|