規則式機器翻譯

機器翻譯

前言

簡介

歷史

翻譯輔助

逐字翻譯

輔助介面

規則翻譯

簡介

翻譯規則

比對方法

統計翻譯

簡介

語料庫

統計學習

案例翻譯

簡介

案例比對

翻譯過程

評測方法

人工評測

自動評測

程式實作

逐字翻譯

規則翻譯

統計翻譯

案例翻譯

自動評測

網頁翻譯

相關書籍

自然語言處理

人工智慧

正規語言

編譯器實作

相關資源

語料辭典

程式工具

相關網站

相關文獻

統計訊息

最新修改

訊息

相關網站

參考文獻

最新修改

簡體版

English

簡介

規則式翻譯就是依靠是語法規則以及語意規則進行翻譯的方法,在前述章節當中,我們已經說明了語法規則的形式,不論是生成語法或格狀語法的規則,都可以用來剖析自然語言的語句。一但剖析完成之後,就可以透過樹狀結構之間的轉換,將樹狀結構轉成目標語言的語法,輸出目標語句。

要利用規則比對的方式進行翻譯,首先必須利用語法規則進行語法剖析,將英文語句轉換成語法樹,以下是一組簡單的語法規則,其中前三條同時適用於中文與英文,第四條則是英文的動詞片語規則,第五條則是中文的動詞片語規則,這兩台在中文與英文的語法上有所差異,因此,分成兩種語文列出。

中文與英文的語法規則

規則 適用語文 說明
S=>NP VP 中英 句子=名詞片語 動詞片語
NP => Det Adj* N PP* 中英 名詞片語=定詞 名詞
PP => P NP 中英 介係詞片語=副詞 名詞片語
VP => V (NP PP*) 英文 動詞片語=動詞 名詞片語 介係詞片語
VP => V (PP*的NP) 中文 動詞片語=動詞 介係詞片語 名詞片語

舉例而言,針對『I like the girl in red dressing』這個句子,其語法樹可能如圖一所示。

其實,不論語句的剖析樹是否得以完全建立,我們都可以透過語法規則對翻譯語句的好壞進行加減分的動作,辦法是對每一規則都給予一個權重。然後,當規則比對成功時,就進行加減分的動作。當加減的分數確定之後,就能根據這些分數,進行最佳化的計算,以便找出所有被列舉出的語句當中,最好的翻譯語句。

RuleMtParseTree.jpg

圖一、語句 I like the girl in red dressing的剖析樹

一但剖析動作完成之後,就可以利用中文的語法規則,進行結構上的調整,以便輸出。例如,在圖一的剖析樹當中,由於英文動詞片語上的規則 VP => V (NP PP*) ,在中文上的對應規則為 VP => V (PP*的NP)。因此,生成中文語句時,必須先經過中文語法的調整,這個調整使得圖一當中的 NP 與 VP 會先反轉後再輸出,於是從『NP(這個女孩) PP(穿著紅色的衣服)』轉換為『PP(穿著紅色的衣服) 的NP (這個女孩)』。於是,『I like the girl in red dressing』這個句子就被翻譯成了『我喜歡穿著紅色的衣服的這個女孩』。

當然,這句話在中文上仍有些小問題,太多『的』這個字在中文裡是不好的用法。因此,必須再經過修飾規則才能將結果翻譯得更好,像是變成『我喜歡穿著紅色衣服的這個女孩』。但是,這距離較好的翻譯,像是『我喜歡這個穿著紅衣服的女孩』,仍有一段距離。這有可能靠著更精細的語法規則達成。

以往,採用規則比對方式的人,可能沒有使用任何的統計資訊,於是採用人為給定規則權重的方式,以進行剖析或詞性標記等動作。然而,由於權重是人為給定的,這使得每條規則的影響力落入主觀的判斷之中,難以科學化。這是規則式方法的主要問題所在,如果能利用統計資訊改進這樣的問題,就能較為客觀。另外,語料庫當中的資訊暨大量又多樣,可以完成某些規則式方法所難以達到的工作,這也是我們接下來要看的主題,統計式的機器翻譯方式。

Facebook

Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-NonCommercial-ShareAlike 3.0 License