:::

學術研究

:::
標題自動擷取英文搭配語及中英文例句:雙語辭典編纂學的計算工具
作者高照明
作者說明國立臺灣大學
摘要

本文描述英中雙語搭配語自動編纂線上系統EXEC的設計流程。EXEC由一千三百萬英文詞及二千七百萬中文字的中英雙語平行語料庫建立而成,結合英語搭配語檢索和中英雙語檢索功能。EXEC利用統計以及具有依存關係的英文句法剖析器擷取英文搭配語。使用者在查詢時輸入關鍵詞和關鍵詞的詞性以及所搜尋的搭配語的詞性,程式依據英文句法剖析器的依存關係和mutual information、t-score、log likelihood ratio等統計訊息自動擷取可能的英文搭配語,並連結包含英文搭配語的英文例句及中文翻譯。實驗顯示EXEC在擷取的正確率和辭典的涵蓋率都超過80%且可以很有效率地自動從平行語料擷取英文搭配語、例句、及中文翻譯。

關鍵詞:搭配語、依存關係、計算辭典編纂學、雙語平行語料庫、mutual information、t-score、log likelihood ratio

cron web_use_log