廣闊前景 機(jī)器翻譯能否超越人譯?_正朔上海日語翻譯公司編輯
廣闊前景 機(jī)器翻譯能否超越人譯?_正朔上海日語翻譯公司編輯
【環(huán)球科技報道】1947年,美國科學(xué)家韋弗(W. Weaver)博士和英國工程師布斯(A. D. Booth)博士提出了利用計算機(jī)進(jìn)行語言自動翻譯的設(shè)想,機(jī)器翻譯(Machine Translation,英文簡稱MT,中文簡稱“機(jī)譯”)從此步入歷史舞臺,并走過了一條曲折而漫長的發(fā)展道路。
從上世紀(jì)50年代到60年代前半期,機(jī)譯研究呈不斷上升趨勢,并從理論走向?qū)嶒?yàn)。美國和前蘇聯(lián)兩個超級大國出于政治、軍事、經(jīng)濟(jì)目的,均對機(jī)譯項(xiàng)目提供了大量的資金支持,而歐洲國家由于地緣政治和經(jīng)濟(jì)的需要也對機(jī)譯研究給予了相當(dāng)大的重視;此時的中國和日本也開始了這項(xiàng)研究,機(jī)譯一時出現(xiàn)熱潮。這個時期的機(jī)譯雖然剛剛處于開創(chuàng)階段,但已進(jìn)入了最初的繁榮期。
1966年,由美國科學(xué)院成立的語言自動處理咨詢委員會(ALPAC)公布了一個題為《語言與機(jī)器》的報告;該報告全面否定了機(jī)譯的可行性和實(shí)用性,并建議停止對機(jī)譯項(xiàng)目的資金支持。這一報告的發(fā)表給了正在蓬勃發(fā)展的機(jī)譯當(dāng)頭一棒,美加英法德意等國的相關(guān)研究陷入了近乎停滯的僵局。無獨(dú)有偶,當(dāng)時的中國爆發(fā)了“文革”動亂,基本上這些研究也停滯了。這個時期的機(jī)譯研究步入了蕭條期。
進(jìn)入70年代后,隨著科學(xué)技術(shù)尤其計算機(jī)技術(shù)的發(fā)展和國際交流的日趨頻繁,從技術(shù)層面和社會需求推動了機(jī)譯研究的復(fù)蘇,機(jī)譯項(xiàng)目又開始發(fā)展起來,各種實(shí)用的以及實(shí)驗(yàn)的系統(tǒng)被先后推出。而中國的機(jī)譯研究在“文革”結(jié)束后也重新振作起來,80年代中期以后,其機(jī)譯研究發(fā)展進(jìn)一步加快,并取得了長足的進(jìn)步和可喜的成績。
從80年代中期開始,基于語料和多引擎機(jī)譯方法的廣泛運(yùn)用,機(jī)譯系統(tǒng)的性能和效率有了明顯提高,各式各樣的翻譯軟件如雨后春筍般問世,并走進(jìn)了市場。例如,中國就推出了一系列機(jī)譯軟件——“譯星”、“雅信”、“通譯”、“華建”、“朗道”、“漢神”等。
到了本世紀(jì),由于互聯(lián)網(wǎng)技術(shù)的普遍應(yīng)用,機(jī)譯又迎來了一個全新的發(fā)展機(jī)遇。如今基于搜索引擎的在線翻譯已成為了一個必不可少的工具。例如,谷歌翻譯、必應(yīng)翻譯、雅虎翻譯、臉譜翻譯、有道翻譯、百度翻譯等已給人們的生活、工作和學(xué)習(xí)帶來了各種便利。其中谷歌翻譯目前已實(shí)現(xiàn)了對100種語言的支持,每日用戶超過2億。
為提高在線翻譯質(zhì)量,谷歌公司的幾名工程師提出了一種嶄新的機(jī)譯方法——將語言翻譯變成向量空間數(shù)學(xué)問題,利用數(shù)據(jù)挖掘技術(shù)建模一種語言的結(jié)構(gòu),然后與另一種語言的結(jié)構(gòu)進(jìn)行對比,從而擴(kuò)充和完善雙語平行語料庫。他們聲稱:在翻譯英語和西班牙語之間的單詞和短語時,準(zhǔn)確率可以達(dá)到幾乎90%。此外,為了進(jìn)一步提高在線翻譯質(zhì)量,谷歌建立了人工翻譯社區(qū),面向所有用戶開放。在這個社區(qū)里,語言專家和專業(yè)譯者可以對原有的譯文進(jìn)行比較、評分,同時也可以提交新的譯文。
2011年開始,伴隨著語音識別、機(jī)譯技術(shù)的快速發(fā)展和經(jīng)濟(jì)全球化的需求,即時口譯研究已成為當(dāng)今信息處理領(lǐng)域新的研究熱點(diǎn)。例如,谷歌公司新推出的翻譯手機(jī)軟件就具有即時語音翻譯功能;除了語音翻譯功能之外,該軟件還能讓使用者用手機(jī)的攝像頭即時翻譯圖像內(nèi)的文本。
前不久,微軟公司推出了具有即時口譯功能的“Skype Translator”,它可以自動翻譯不同語言的語音通話和即時通信消息,當(dāng)前支持的語言包括英語、西班牙語、意大利語和漢語普通話。除了實(shí)時語音翻譯之外,Skype Translator的即時通信消息翻譯已支持50種語言,包括法語、日語、阿拉伯語、威爾士語等。由于這款翻譯工具集成了機(jī)譯、大數(shù)據(jù)、語音識別、機(jī)器學(xué)習(xí)等先進(jìn)技術(shù),因此被廣泛看好。
最近,百度公司發(fā)布了融合統(tǒng)計和深度學(xué)習(xí)方法的在線翻譯系統(tǒng)。該系統(tǒng)能借助計算機(jī)模擬的海量神經(jīng)元,模仿人腦“理解語言,生成譯文”,同時結(jié)合百度已有的統(tǒng)計機(jī)譯技術(shù),讓機(jī)譯質(zhì)量實(shí)現(xiàn)突破。(正朔上海日語翻譯公司編輯)
機(jī)譯是涉及數(shù)學(xué)、語言學(xué)、邏輯學(xué)、人工智能和語音技術(shù)等多種學(xué)科和技術(shù)的綜合性研究課題。它消除了不同文字和語言間的隔閡,堪稱高科技造福人類之舉。美國發(fā)明家和企業(yè)家?guī)炱澩?R. Kurzweil)博士在接受著名網(wǎng)絡(luò)媒體《赫芬頓郵報》采訪時曾預(yù)言,“到2029年機(jī)譯的譯文質(zhì)量將達(dá)到人工翻譯的水準(zhǔn)。”這一預(yù)言未免過于樂觀。但遺憾的是,至今機(jī)譯的若干理論難題(如深層次語義)都沒有從根本上得到解決;某些方法和技術(shù)也沒有實(shí)質(zhì)性的改進(jìn);機(jī)譯系統(tǒng)的性能(在消歧和調(diào)序方面)還不盡如人意,尤其是譯文質(zhì)量,離理想目標(biāo)仍相差甚遠(yuǎn)。
眾所周知,人工翻譯的過程是人工譯者集理解、分析、選擇及再創(chuàng)造為一體的綜合過程,是大腦思維活動的過程。因此,機(jī)譯的譯文質(zhì)量要達(dá)到人工翻譯的水準(zhǔn),就必須解開大腦處理語言信息之謎。正如中國數(shù)學(xué)家和語言學(xué)家周海中教授所言:在人類尚未明了大腦是如何進(jìn)行語言的模糊識別和邏輯判斷的情況下,機(jī)譯要想達(dá)到“信、達(dá)、雅”的程度是不可能的。這一觀點(diǎn)精辟到位,道出了制約譯文質(zhì)量提高的瓶頸所在。
我們相信,在計算機(jī)專家、語言學(xué)家、心理學(xué)家、邏輯學(xué)家和數(shù)學(xué)家的共同努力下,尤其在“人類大腦工程”的推動下,機(jī)譯的瓶頸問題將會得到解決,語言的交流障礙將會得以跨越。展望未來,機(jī)譯技術(shù)將迎來更加光明的發(fā)展前景和更加廣闊的發(fā)展空間。
(作者為美國微軟公司高級工程師 劉世杰)
正朔上海日語翻譯公司編輯

