Natural Language Processing
人工智慧與語言學的分支,探討如何處理及運用自然語言,包含:
自然語言理解系統:把自然語言轉化成電腦容易處理的形式
自然語言生成系統:把電腦程式數據轉化成自然語言 如Google翻譯 問答系統http://www.wolframalpha.com/ 輸入法自動選字
處理流程
純文字輸入:我們都喜歡蝴蝶
斷詞:我們 都 喜歡 蝴蝶
詞性標記:我們(Nh) 都(D) 喜歡(VK) 蝴蝶(Nh)
句法剖析: http://rocling.iis.sinica.edu.tw/CKIP/parser.htm
Parser剖析系統,進行斷詞/斷詞標記/中文剖析/角色指派
語意剖析
歧異(Ambiguity)
斷詞歧異:台大便餐車、特殊性關係 句法結構歧異: Tina is not tall and thin. Tina is (not tall) and thin Tina is not (tall and thin)
一字多義:淡水
代名詞指涉(Anaphora Resolution) eg: 同樣是it,可能依據上下文代表不同的字詞句