翻譯社

google。結合報系資料照片
google翻譯聯合報系資料照片
google台灣董事總經理簡立峰說,google翻譯比以前好用太多了!就算有人惡作劇,刻意在「提出修改建議」欄位寫下錯的翻譯,也不會影響系統的運作翻譯

留意 (attention)功能是為了每一步都產出正確的詞,解碼器將針對編碼中文向量裡最相關的英文單詞權重分布(weighted distribution)進行解碼。

簡立峰解釋,google翻譯有學習及資料庫的功能,不竭積累經驗,毛病也是一種經驗,除非幾近所的人都在「修改建議」欄寫下一模一樣的錯誤,才會積非成是,但事實上這種情況並不可能産生。

在讀取完全句子後,解碼器(decoder)就會起頭運作,一次產生一個英語句子中的一個詞翻譯

相較於過去的片語機械進修(pbmt),神經機械翻譯(nmt)僅需要較少的系統架構設計翻譯剛最先推出神經機器翻譯時,這兩種翻譯方式的精準度不相上下。

過去,為翻譯任意兩種語言,google需要建構多個不同的翻譯系統,運算成本相當可觀。此刻也有人提出讓alphago打alphago,進修能力可以更快的說法,就像是金庸小說「西嶽論劍」裡全真派的周伯通,用本身的左手和右手對打,使出的「左右互搏」翻譯

他指出,機器學習是很重要的議題,大家在討論google翻譯的學習功能之際,也會聯想到人工電腦alphago打敗真人世界棋王。

為改善nmt翻譯品質,研究人員提出許多技術來解決,這傍邊包羅透過摹擬調校模子(externalalignment model) 處理罕見字詞、使用「注意」(attention)來對準輸入詞和輸出詞,以及將詞拆解成更小的單元以應對罕有字詞等翻譯

數年前,google採用遞歸神經網絡(recurrentneural networks)將句子視為一個單位進行翻譯,之後的片語式機械翻譯體例(pbmt),則是將句子切割成零丁的字和詞組做自力翻譯翻譯

google翻譯的發展進程快速,10年前,google推出翻譯服務,並以片語式機器翻譯(phrase-basedmachine translation)作為主要運算體例翻譯從曩昔僅支援幾種說話,到如今可支援103種語言,且每天翻譯超過1400億個單詞,google翻譯的品質有了很大的進展。

他認為,固然簡體中文、繁體中文有些不異的字詞有著分歧的意義,或相同的字已衍生出新的意義,但因簡體、繁體中文語法相同,在機器翻譯上仍採用一套系統,可視為專有名詞,透過學習建立資料庫來校訂。

其實不只簡體中文、繁體中文的語法不異,他流露,日文、韓文在機械翻譯上也可算是語法相同,用同一套系統翻譯

google神經機械翻譯(gnmt)將中詞句子翻譯成英詞句子的過程,透過編碼器 (encoder),首先,gnmt將中文句子的每一個單詞進行向量(vector)編碼,而每個向量將顯示出目前為止單詞被讀取到的所成心義。

文章出自: https://udn.com/news/story/7088/2440774有關翻譯的問題歡迎諮詢天成翻譯社

arrow
arrow