thông tin biểu ghi
  • Bài trích
  • Ký hiệu PL/XG: 495
    Nhan đề: Dịch lại từ chưa biết dạng biểu thức số trong dịch truyền thống kê Hoa – Việt /

DDC 495
Tác giả CN Trần, Thanh Phước
Nhan đề Dịch lại từ chưa biết dạng biểu thức số trong dịch truyền thống kê Hoa – Việt / Trần Thanh Phước, Đinh Điền
Mô tả vật lý 12 tr.
Tóm tắt Ranh giới trong tiếng Hoa và tiếng Việt không được xác định bởi khoảng trắng. Do đó, phân đoạn từ Hoa - Việt luôn được thực hiện đầu tiên trong bài toán xử lý ngôn ngữ Hoa - Việt nói chung và trong dịch máy thống kê Hoa-Việt nói riêng. Việc phân đoạn từ làm tăng chất lượng dịch chung cuộc nhưng lại xuất hiện nhiều “từ chưa biết” (Unknown Word: UKW) ở bản dịch đích. Dạng từ chưa biết phổ biến trong hệ thống dịch Hoa-Việt đó là thực thể có tên (name entity : NE). Nghiên cứu trình bày một phương pháp lai, kết hợp luật và thống kê, để dịch lại các UKW dạng thực thể có tên biểu thức số. Áp dụng phương pháp này vào trong hệ dịch thống kê Hoa - Việt, kết quả thử nghiệm đã cải tiến đáng kể hiệu suất dịch máy thống kê Hoa - Việt.
Từ khóa tự do Number expression
Từ khóa tự do Thực thể có tên
Từ khóa tự do Từ chưa biết
Từ khóa tự do Dịch thống kê Hoa - Việt
Tác giả(bs) CN Đinh, Điền
Nguồn trích Tạp chí Tin học và Điều khiển học = Journal of Computer Science And Cybernetics 2014Tr. 127-138 Số: 02 Tập: 30
000 00000nab#a2200000ui#4500
00120235
0029
004646528DF-E011-4E95-9901-FD9C3EAD25D9
005202005071527
008081223s vm| vie
0091 0
039|a20200507152950|bngantk|y20200325201705|zthaopt
082 |a495
100 |aTrần, Thanh Phước
245 |aDịch lại từ chưa biết dạng biểu thức số trong dịch truyền thống kê Hoa – Việt / |cTrần Thanh Phước, Đinh Điền
300 |a12 tr.
520 |aRanh giới trong tiếng Hoa và tiếng Việt không được xác định bởi khoảng trắng. Do đó, phân đoạn từ Hoa - Việt luôn được thực hiện đầu tiên trong bài toán xử lý ngôn ngữ Hoa - Việt nói chung và trong dịch máy thống kê Hoa-Việt nói riêng. Việc phân đoạn từ làm tăng chất lượng dịch chung cuộc nhưng lại xuất hiện nhiều “từ chưa biết” (Unknown Word: UKW) ở bản dịch đích. Dạng từ chưa biết phổ biến trong hệ thống dịch Hoa-Việt đó là thực thể có tên (name entity : NE). Nghiên cứu trình bày một phương pháp lai, kết hợp luật và thống kê, để dịch lại các UKW dạng thực thể có tên biểu thức số. Áp dụng phương pháp này vào trong hệ dịch thống kê Hoa - Việt, kết quả thử nghiệm đã cải tiến đáng kể hiệu suất dịch máy thống kê Hoa - Việt.
653 |aNumber expression
653 |aThực thể có tên
653 |aTừ chưa biết
653 |aDịch thống kê Hoa - Việt
700 |aĐinh, Điền
773 |tTạp chí Tin học và Điều khiển học = Journal of Computer Science And Cybernetics |d2014|gTr. 127-138|v30|i02
890|c1|a0|b0|d10
Không tìm thấy biểu ghi nào