DDC
| 495 |
Tác giả CN
| Trần, Thanh Phước |
Nhan đề
| Dịch lại từ chưa biết dạng biểu thức số trong dịch truyền thống kê Hoa – Việt / Trần Thanh Phước, Đinh Điền |
Mô tả vật lý
| 12 tr. |
Tóm tắt
| Ranh giới trong tiếng Hoa và tiếng Việt không được xác định bởi khoảng trắng. Do đó, phân đoạn từ Hoa - Việt luôn được thực hiện đầu tiên trong bài toán xử lý ngôn ngữ Hoa - Việt nói chung và trong dịch máy thống kê Hoa-Việt nói riêng. Việc phân đoạn từ làm tăng chất lượng dịch chung cuộc nhưng lại xuất hiện nhiều “từ chưa biết” (Unknown Word: UKW) ở bản dịch đích. Dạng từ chưa biết phổ biến trong hệ thống dịch Hoa-Việt đó là thực thể có tên (name entity : NE). Nghiên cứu trình bày một phương pháp lai, kết hợp luật và thống kê, để dịch lại các UKW dạng thực thể có tên biểu thức số. Áp dụng phương pháp này vào trong hệ dịch thống kê Hoa - Việt, kết quả thử nghiệm đã cải tiến đáng kể hiệu suất dịch máy thống kê Hoa - Việt. |
Từ khóa tự do
| Number expression |
Từ khóa tự do
| Thực thể có tên |
Từ khóa tự do
| Từ chưa biết |
Từ khóa tự do
| Dịch thống kê Hoa - Việt |
Tác giả(bs) CN
| Đinh, Điền |
Nguồn trích
| Tạp chí Tin học và Điều khiển học = Journal of Computer Science And Cybernetics 2014Tr. 127-138
Số: 02
Tập: 30 |
|
000
| 00000nab#a2200000ui#4500 |
---|
001 | 20235 |
---|
002 | 9 |
---|
004 | 646528DF-E011-4E95-9901-FD9C3EAD25D9 |
---|
005 | 202005071527 |
---|
008 | 081223s vm| vie |
---|
009 | 1 0 |
---|
039 | |a20200507152950|bngantk|y20200325201705|zthaopt |
---|
082 | |a495 |
---|
100 | |aTrần, Thanh Phước |
---|
245 | |aDịch lại từ chưa biết dạng biểu thức số trong dịch truyền thống kê Hoa – Việt / |cTrần Thanh Phước, Đinh Điền |
---|
300 | |a12 tr. |
---|
520 | |aRanh giới trong tiếng Hoa và tiếng Việt không được xác định bởi khoảng trắng. Do đó, phân đoạn từ Hoa - Việt luôn được thực hiện đầu tiên trong bài toán xử lý ngôn ngữ Hoa - Việt nói chung và trong dịch máy thống kê Hoa-Việt nói riêng. Việc phân đoạn từ làm tăng chất lượng dịch chung cuộc nhưng lại xuất hiện nhiều “từ chưa biết” (Unknown Word: UKW) ở bản dịch đích. Dạng từ chưa biết phổ biến trong hệ thống dịch Hoa-Việt đó là thực thể có tên (name entity : NE). Nghiên cứu trình bày một phương pháp lai, kết hợp luật và thống kê, để dịch lại các UKW dạng thực thể có tên biểu thức số. Áp dụng phương pháp này vào trong hệ dịch thống kê Hoa - Việt, kết quả thử nghiệm đã cải tiến đáng kể hiệu suất dịch máy thống kê Hoa - Việt. |
---|
653 | |aNumber expression |
---|
653 | |aThực thể có tên |
---|
653 | |aTừ chưa biết |
---|
653 | |aDịch thống kê Hoa - Việt |
---|
700 | |aĐinh, Điền |
---|
773 | |tTạp chí Tin học và Điều khiển học = Journal of Computer Science And Cybernetics |d2014|gTr. 127-138|v30|i02 |
---|
890 | |c1|a0|b0|d10 |
---|
| |
Không tìm thấy biểu ghi nào
|
|
|
|