機器翻譯與 EM 學習法
機器翻譯前言簡介歷史翻譯輔助逐字翻譯輔助介面規則翻譯簡介翻譯規則比對方法統計翻譯簡介語料庫統計學習案例翻譯簡介案例比對翻譯過程評測方法人工評測自動評測程式實作逐字翻譯規則翻譯統計翻譯案例翻譯自動評測網頁翻譯相關書籍自然語言處理人工智慧正規語言編譯器實作相關資源語料辭典程式工具相關網站相關文獻統計訊息最新修改訊息相關網站參考文獻最新修改簡體版English |
閱讀本文前請先閱讀:EM 學習法簡介 機器翻譯的相關機率最佳化函數EM 演算法 (1)\begin{align} \arg\max_p \sum_z P(z|x,p) L(z,x|p) \end{align}
(2)
\begin{equation} L(z,x|p) = log p(x,z) \end{equation}
已知:x: 觀察值, 學習:z: 隱變數, p:機率分布參數 英翻中 (無規則)(3)\begin{align} \arg\max_p \sum_se,we P(sc,wc|se,we, p) L(sc,wc,se,we|p) \end{align}
已知:se:英文句子, we:英文詞彙 ; 學習:sc:中文句子, wc:中文詞彙, p:機率分布參數 學習規則 (語句文法)(4)\begin{align} \arg\max_p \sum_r P(r|s,w,p) L(r,s,w|p) \end{align}
說明:r: 規則, w:詞彙, s:句子, p:機率分布參數 學習緊接規則 (bigram)(5)\begin{align} \arg\max_p \sum_{w1w2} P(w1w2|w1,p) L(w1w2,w1|p) \end{align}
說明:w1w2:詞彙 w2 緊跟在 w1 之後, p:機率分布參數 詞彙分群 (分類)(6)\begin{align} \arg\max_p \sum_c P(c|w,p) L(c,w|p) \end{align}
說明:c:詞彙群, w:詞彙, s:句子, p:機率分布參數 使用中介語言(7)\begin{align} \arg\max_p \sum_t P(t|s,w,p) L(t,s,w|p) \end{align}
說明:t: 中介語彙, w:詞彙, s:句子, p:機率分布參數 文件分類(8)\begin{align} \arg\max_p \sum_t P(t|s,w,p) L(t,s,w|p) \end{align}
說明:t: 中介語彙, w:詞彙, s:句子, p:機率分布參數 |
page revision: 6, last edited: 07 Sep 2010 08:41
Post preview:
Close preview