加勒比一本heyzo高清视频-免费精品无码av片在线观看-无码国产精品一区二区免费模式-去干成人网-成在人线av无码免费

物聯(lián)傳媒 旗下網站
登錄 注冊

谷歌:用算法和大數(shù)據“干掉”語言學家

作者:RFID世界網收錄
來源:驅動之家
日期:2013-09-26 15:22:17
摘要:你能想象一個致力于打破語言障礙的項目小組里竟然沒有一位語言學家嗎?但是谷歌就是這么做了,這家公司打算依靠算法和大數(shù)據最終“干掉”語言學家。

  你能想象一個致力于打破語言障礙的項目小組里竟然沒有一位語言學家嗎?但是谷歌就是這么做了,這家公司打算依靠算法和大數(shù)據最終“干掉”語言學家。

  谷歌是一家極度看重算法、充滿工程師文化的公司,但或許你還是會為此而感到驚奇——他們認為翻譯是一個數(shù)學和統(tǒng)計學方面的問題。最近,位于谷歌總部的谷歌翻譯團隊正迅速擴張,他們新招了數(shù)名德國計算機科學家,但卻沒有招收一名語言學家。

  谷歌翻譯部門主管Franz Josef Och同樣也是德國計算機科學家出身,他不但并不精通語言學,甚至并不擅長語言學習。他認為,機翻的關鍵在對數(shù)學、統(tǒng)計和編程方面的擅長。

  谷歌翻譯團隊并不會去模仿人工翻譯的方式,這就是他們沒有去開發(fā)字典、定義語法結構和規(guī)則的原因。事實上,語法規(guī)則對目前的計算機來說仍然難以掌控。谷歌更著重于以大數(shù)據和統(tǒng)計的方式入手,翻譯系統(tǒng)會不斷地調整翻譯結果的相關性并自我學習如何處理數(shù)十億的文字。通過這種方式,計算機最終能不斷優(yōu)化翻譯結果。

  以大數(shù)據方式做翻譯的一個好處是,翻譯系統(tǒng)會隨著數(shù)據的積累而不斷地改善。谷歌翻譯目前已經支持71種語言的互譯,去年用戶的使用次數(shù)已經達到2億次。此外,索引全球網頁的谷歌還能夠依靠互聯(lián)網上已經存在的翻譯內容改善自己的翻譯系統(tǒng)。

  盡管如此,依賴算法的翻譯系統(tǒng)仍然遠遠無法做到像人工翻譯那么精準。句法、語調、歧義都是自動翻譯軟件很難處理的問題。谷歌翻譯的翻譯結果仍然只能幫助人們對陌生語言進行大致上的理解,有時候得到的翻譯結果很難讓人通順地閱讀下來。

  此外,谷歌翻譯在不同的語系之間的翻譯結果質量也各不相同。例如,英語和西班牙語之間的互譯翻譯質量良好,英語和日語之間的互譯不怎么樣,英語和德語之間的互譯則非常糟糕。

  盡管如此,機翻有一個人工翻譯難以做到的優(yōu)勢——它讓更多的人接觸到了更多的信息。試想一下如果你舉著手機就可以與世界上任何語種的任何人交流,那會是多么棒的體驗。

人物訪談