1月8日,2015年度國家科學技術(shù)獎勵大會在人民大會堂舉行,百度機器翻譯項目獲頒國家科學技術(shù)進步獎二等獎,這是該獎項首次出現(xiàn)互聯(lián)網(wǎng)巨頭(BAT)的身影。
百度翻譯取得突破性成果 獲國家科技進步獎
機器翻譯一直被公認為人工智能領(lǐng)域最難的課題之一,百度機器翻譯的突破性成果,使我國掌握了互聯(lián)網(wǎng)機器翻譯的核心技術(shù),占領(lǐng)了技術(shù)制高點。
據(jù)了解,從2010年申報成為863計劃支持項目,2014年順利通過驗收并榮獲中國電子學會科技進步一等獎,到獲得國家科技獎,百度機器翻譯項目經(jīng)歷了6年漫長的“攻關(guān)。在這個多家參與的項目中,百度承擔了核心技術(shù)的研發(fā)以及技術(shù)成果的應用和產(chǎn)業(yè)化。項目負責人、百度技術(shù)副總裁海峰從1993年初開始從事機器翻譯領(lǐng)域研究工作,最終借助百度強大的海量計算平臺和豐富的海量互聯(lián)網(wǎng)數(shù)據(jù)處理經(jīng)驗,讓機器翻譯從理論走向?qū)嵺`。
據(jù)王海峰介紹,得益于百度在自然語言處理上的領(lǐng)先技術(shù)優(yōu)勢與不懈的創(chuàng)新努力,此次由百度與中科院自動化所、計算所、浙江大學、哈爾濱工業(yè)大學、清華大學共同研發(fā)的“基于大數(shù)據(jù)的互聯(lián)網(wǎng)機器翻譯核心技術(shù)及產(chǎn)業(yè)化”項目,突破了機器翻譯領(lǐng)域內(nèi)的四大世界難題:提出基于大數(shù)據(jù)的互聯(lián)網(wǎng)機器翻譯模型,快速響應高負荷翻譯需求;基于大數(shù)據(jù)的翻譯知識獲取,克服語言數(shù)據(jù)噪聲問題;通過深度語義分析和翻譯技術(shù),減少語言語義歧義;提出樞軸語言機器翻譯技術(shù),實現(xiàn)了稀缺語種的多語言翻譯。通過理論、技術(shù)、應用上的突破,百度機器翻譯對行業(yè)發(fā)展起到積極的推進作用。
除了在學術(shù)領(lǐng)域取得豐碩的研究成果外,該項目成果已應用于國家多個重要部門以及百度翻譯PC端和移動端產(chǎn)品中。此外,百度還通過免費開放API,支持了華為、金山、OPPO、敦煌網(wǎng)等上萬家第三方翻譯應用。
小到出國旅游、科技文獻翻譯,大到國際貿(mào)易、跨語言文化交流,機器翻譯都發(fā)揮重要價值。目前,百度機器翻譯技術(shù)目前已實現(xiàn)支持27種語言,702個翻譯方向,每天響應近億次翻譯請求。
(審核編輯: 智慧羽毛)
分享