logo
當前位置:首頁> 出國游 Booking.com聯手哈佛優化翻譯系統,流暢度逼近人工翻譯水平
出國游

Booking.com聯手哈佛優化翻譯系統,流暢度逼近人工翻譯水平

2020-11-30 16:41:27

[](本文編譯自Slator)重塑語言技術領域發展的三個主要趨勢在Booking.com平臺得到了體現:未來對本地語言內容、便宜且幾乎無限制的云端運算能力,以及開源的神經網絡機器翻譯框架的需求將越來越高。

Booking.com利用這三種趨勢創建了一個產品級神經網絡機器翻譯系統(NeuralMachineTransfer System,以下簡稱NMT)。Booking.com說:“這個系統正在成為一個非常有吸引力的解決方案,它是對傳統手工翻譯服務的補充?!?/p>

7月25日,負責該項目的團隊在由康奈爾大學(Cornell University)運營的開放科學網站arxiv.org發布的一項研究中宣布了NMT系統的啟動。

Booking.com的高管帕維爾·萊文,Nishikant Dhanuka,Maxim Khalilov是這項研究的共同作者。他說,這項研究的重點是NMT對兩種重要的翻譯模式(從英語到德語,從英語到法語)和(統計機器翻譯系統,兩種通用的在線引擎(統計和神經網絡)的統計機器翻譯系統)。

在研究總結中,作者寫道:“本研究展示了SMT系統和NMT系統提供的翻譯輸出自動評估和手動評估的結果,并分析了句子長度對這兩個系統輸出質量的影響?!?/p>

這項研究還贏得了斯普林格歐洲機器翻譯協會(斯普林格歐洲機器翻譯協會)今年5月在捷克首都布拉格舉行的第20屆年度EMAT峰會上頒發的最佳機器翻譯用戶研究獎。

[醫]發現

本研究以BLEU(雙語評價替代者,雙語評價替補)為翻譯質量評價的主要自動測量方法,揭示了三項主要結果:NMT技術優于SMT;英德翻譯模式,企業內NMT翻譯效果優于在線通用NMT引擎,NMT翻譯流利程度接近人工翻譯水平。

研究人員不僅引用了以往的一些研究,解釋了長句翻譯中NMT翻譯質量的大幅下降,還利用BLEU檢驗了長句在英、德、法翻譯模式下對NMT和SMT的影響程度。

長句對這兩種語言的NMT和SMT翻譯的影響主要有兩方面:“長句翻譯質量下降,但對于兩種語言的翻譯,NMT的翻譯效果仍優于SMT?!?/p>

大幅降低翻譯成本

Booking.com對機器翻譯感興趣,這幾乎出乎意料。根據公布的數據,該平臺每天預訂140萬個房間。公司總部設在阿姆斯特丹,在世界多個國家設有辦事處。

研究表明,該平臺提供 40 種語言的語言翻譯服務。 “主要用例之一是將酒店描述信息從英文翻譯成其他語言( 包括酒店、公寓、住宿加早餐酒店等)。 ”研究報告說。

通過集成在這些公司中開發的機器翻譯解決方案,Booking.com認為這可以提高翻譯效率。

研究表明,提高翻譯速度,縮短從翻譯到在線的時間,大大降低酒店介紹的相應翻譯成本,可以提高翻譯效率。

聯手哈佛,開發NMT系統性能

Booking.com的商業主管、這項研究的合著者之一Maxim Khalilov說,Booking.com花了半年時間在內部開發NMT的內部性能,但不包括用于統計機器翻譯開發和測試的時間。

根據Khalilov的說法,他們使用的開發框架是OpenMT,一種由哈佛大學提供的基于火炬的編程解決方案,它也得到了語言翻譯軟件提供商Systran的支持。

哈佛自然語言處理機構的亞歷山大·拉什(Alexander Rush)去年12月在接受OpenMT采訪時表示:“我希望不同的研究人員能夠研究如何改進翻譯,并期望業界人士對新的人工智能技術更加熟悉?!?/p>

當被問及Booking.com是否在自己的服務器上運行NMT時,Khalilov說,盡管他們在一些實驗中使用了自己的圖形處理器(圖形處理單元)Booking.com,但他們目前主要依靠亞馬遜云服務(AmazonWebServices)來操作NMT。

指出Booking.com未來的研究方向是內部NMT系統的改進,主要有兩個方向:改進未知詞和遠距離詞的處理;改進商業敏感內容的翻譯錯誤識別。

“我們已經在公司內確定了10個機器翻譯用例,根據我們的優先計劃,我們將一次又一次地關注這些用例,”Khalilov說。(NIC匯編)

日本亚洲精品无码专区_日本亚洲欧美在线视观看_日本一区二区三区免费