機器翻譯與 EM 學習法

機器翻譯

前言

簡介

歷史

翻譯輔助

逐字翻譯

輔助介面

規則翻譯

簡介

翻譯規則

比對方法

統計翻譯

簡介

語料庫

統計學習

案例翻譯

簡介

案例比對

翻譯過程

評測方法

人工評測

自動評測

程式實作

逐字翻譯

規則翻譯

統計翻譯

案例翻譯

自動評測

網頁翻譯

相關書籍

自然語言處理

人工智慧

正規語言

編譯器實作

相關資源

語料辭典

程式工具

相關網站

相關文獻

統計訊息

最新修改

訊息

相關網站

參考文獻

最新修改

簡體版

English

閱讀本文前請先閱讀:EM 學習法簡介

機器翻譯的相關機率最佳化函數

EM 演算法

(1)
\begin{align} \arg\max_p \sum_z P(z|x,p) L(z,x|p) \end{align}
(2)
\begin{equation} L(z,x|p) = log p(x,z) \end{equation}

已知:x: 觀察值, 學習:z: 隱變數, p:機率分布參數

英翻中 (無規則)

(3)
\begin{align} \arg\max_p \sum_se,we P(sc,wc|se,we, p) L(sc,wc,se,we|p) \end{align}

已知:se:英文句子, we:英文詞彙 ; 學習:sc:中文句子, wc:中文詞彙, p:機率分布參數

學習規則 (語句文法)

(4)
\begin{align} \arg\max_p \sum_r P(r|s,w,p) L(r,s,w|p) \end{align}

說明:r: 規則, w:詞彙, s:句子, p:機率分布參數

學習緊接規則 (bigram)

(5)
\begin{align} \arg\max_p \sum_{w1w2} P(w1w2|w1,p) L(w1w2,w1|p) \end{align}

說明:w1w2:詞彙 w2 緊跟在 w1 之後, p:機率分布參數

詞彙分群 (分類)

(6)
\begin{align} \arg\max_p \sum_c P(c|w,p) L(c,w|p) \end{align}

說明:c:詞彙群, w:詞彙, s:句子, p:機率分布參數

使用中介語言

(7)
\begin{align} \arg\max_p \sum_t P(t|s,w,p) L(t,s,w|p) \end{align}

說明:t: 中介語彙, w:詞彙, s:句子, p:機率分布參數

文件分類

(8)
\begin{align} \arg\max_p \sum_t P(t|s,w,p) L(t,s,w|p) \end{align}

說明:t: 中介語彙, w:詞彙, s:句子, p:機率分布參數

Facebook

Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-NonCommercial-ShareAlike 3.0 License