3月14日,微軟宣布,其研發的機器翻譯系統,在通用新聞報道測試集newstest2017的中英測試集上,達到了可與人工翻譯媲美的水平。這是首個在新聞報道的翻譯質量和準確率上可比肩人工翻譯的翻譯系統。
為了確保翻譯結果準確且達到人類的翻譯水平,微軟研究團隊邀請了雙語語言顧問,將微軟機翻結果與兩個不同的人工翻譯結果進行比較。
微軟技術院士,負責微軟語音、自然語言和機器翻譯工作的黃學東稱,這是對自然語言處理領域最具挑戰性任務的一項重大突破。“在機器翻譯方面達到與人類相同的水平是所有人的夢想,我們沒有想到這么快就能實現。”他表示,“消除語言障礙,幫助人們更好地溝通,這非常有意義,值得我們多年來為此付出的努力。”
微軟技術院士黃學東
機器翻譯是科研人員攻堅了數十年的研究領域,曾經很多人都認為機器翻譯根本不可能達到人類翻譯的水平。盡管此次突破意義非凡,但這仍不代表人類已經完全解決了機器翻譯的問題,只能說離終極目標又近了一步。
微軟機器翻譯團隊研究經理Arul Menezes解釋:當一種語言(比如中-英)擁有較多的訓練數據,且翻譯的是常見的大眾類新聞詞匯時,人工智能加持下的機器翻譯表現可以與人類媲美。
近兩年來,深度神經網絡的使用讓機器翻譯的表現取得了實質性突破。相較于以往,機器翻譯結果變得更加自然流暢。
微軟將他們的最新研究成果——對偶學習(Dual Learning)和推敲網絡(Deliberation Networks)應用在了此次取得突破的機器翻譯系統中。微軟亞洲研究院副院長、機器學習組負責人劉鐵巖介紹道,“這兩個技術的研究靈感其實都來自于我們人類的做事方式。”
其中,對偶學習使得中文句子翻譯成英文之后,系統會將相應的英文結果再翻譯回中文,并與原始的中文句子進行比對。從這個比對中,機器會學習有用的反饋信息,對翻譯模型進行修正。
推敲網絡則類似于人們寫文章時不斷推敲、修改的過程。通過多輪翻譯,不斷地檢查、完善翻譯的結果,從而使翻譯質量得到大幅提升。
微軟亞洲研究院副院長、機器學習組負責人劉鐵巖
周明帶領的自然語言計算組,多年來一直致力于攻克機器翻譯——這一自然語言處理領域最具挑戰性的研究任務。“翻譯沒有唯一的標準答案,它更像是一種藝術,因此需要更加復雜的算法和系統去應對。”周明表示。
此次newstest2017新聞報道測試集,包括約2000個句子,由專業人員從報紙樣本翻譯而來。微軟團隊每次會隨機挑選數百個句子翻譯。
為了驗證機器翻譯是否可以媲美人類翻譯,測試經歷了極為復雜的驗證過程。這是因為,沒有所謂“正確的”翻譯結果,即使是兩位專業的翻譯人員,對同一個句子也會有略微不同的翻譯,而且兩個人的翻譯都不是錯的。表達同一個句子的“正確的”方法不止一種。
周明解釋:“這也是為什么機器翻譯比單純的語音識別復雜得多,人們可能用不同的詞語來表達完全相同的意思,但未必能準確判斷哪一個更好。”
相比之下,判斷語音識別能否媲美人類則相當簡單:標準答案是唯一的。
這種沒有標準答案的任務,使得機器翻譯成為一個極有挑戰、同時極富意義的問題。劉鐵巖表示,我們不知道哪一天,機器翻譯才能在面臨任何語種、任何類型的文本時,都能在“信、達、雅”上媲美專業翻譯人員的水準。但總體而言,他對技術的進展表示樂觀,因為整個學術界在持續發明大量的新技術、新模型和新算法,
“我們可以預測的是,新技術的應用一定會讓機器翻譯的結果日臻完善。”微軟團隊還表示,此次技術突破將被應用到微軟的商用多語言翻譯系統產品中。
2025-06-26 14:36
2025-06-26 10:47
2025-06-23 09:11
2025-06-16 11:40
2025-06-16 08:15
2025-06-16 08:11
2025-06-14 20:30
2025-06-13 09:41
2025-06-10 11:04
2025-06-10 10:49