- 翻譯公司資訊
-
“譯者”在人工智能時(shí)代扮演的角色
發(fā)布時(shí)間:2017-08-30 09:48 點(diǎn)擊:
現代語(yǔ)音識別和自然語(yǔ)言處理研究的先驅、美國工程院院士Frederick Jelinek曾經(jīng)有句名言:“Every time I fire a linguist, the performance of the speech recognizer goes up.”(我每開(kāi)除一位語(yǔ)言學(xué)家,我的語(yǔ)言識別系統性能就會(huì )提升。)Unitrans世聯(lián)翻譯公司在您身邊,離您近的翻譯公司,心貼心的專(zhuān)業(yè)服務(wù),專(zhuān)業(yè)的全球語(yǔ)言翻譯與信息解決方案供應商,專(zhuān)業(yè)翻譯機構品牌。無(wú)論在本地,國內還是海外,我們的專(zhuān)業(yè)、星級體貼服務(wù),為您的事業(yè)加速!世聯(lián)翻譯公司在北京、上海、深圳等國際交往城市設有翻譯基地,業(yè)務(wù)覆蓋全國城市。每天有近百萬(wàn)字節的信息和貿易通過(guò)世聯(lián)走向全球!積累了大量政商用戶(hù)數據,翻譯人才庫數據,多語(yǔ)種語(yǔ)料庫大數據。世聯(lián)品牌和服務(wù)品質(zhì)已得到政務(wù)防務(wù)和國際組織、跨國公司和大中型企業(yè)等近萬(wàn)用戶(hù)的認可。 專(zhuān)業(yè)翻譯公司,北京翻譯公司,上海翻譯公司,英文翻譯,日文翻譯,韓語(yǔ)翻譯,翻譯公司排行榜,翻譯公司收費價(jià)格表,翻譯公司收費標準,翻譯公司北京,翻譯公司上海。
人們有時(shí)候會(huì )誤讀這句話(huà),認為在自然語(yǔ)言處理技術(shù)發(fā)展的進(jìn)程中,語(yǔ)言專(zhuān)家的作用微乎其微,拯救世界的任務(wù)還得落在程序員身上。
我去專(zhuān)門(mén)查過(guò)Frederick Jelinek大牛的維基百科介紹,里面有段話(huà)很有意思(注意粗體加下劃線(xiàn)的部分):
“Although its fame and iconic status are undisputed (it was for example used as the title of a 1998 speech by Julia Hirschberg), its context is unknown and its specific wording and dating are unclear. According to Daniel Jurafsky and James H. Martin, Jelinek himself recalled the quote as "Anytime a linguist leaves the group the recognition rate goes up" and dated it to December 1988 (Wayne, Pennsylvania), further noting that the quote did not appear in the published proceeding,[2][3] whereas Roger K. Moore gave the wording as "Every time we fire a phonetician/linguist, the performance of our system goes up" and dated it to an IEEE Automatic Speech Recognition and Understanding workshop held in 1985.[4] According to Steve Young, "the story goes that one day one of his linguists resigned, and Fred decided to replace him not by another linguist but by an engineer. A little while later, Fred noticed that the performance of his system improved significantly. So he encouraged another linguist to find alternative employment, and sure enough performance improved again."”
思考
自然語(yǔ)言處理專(zhuān)家嘴邊經(jīng)常提及這句話(huà),搞機器翻譯技術(shù)的專(zhuān)家也時(shí)不時(shí)拿這句話(huà)調侃一下。如今很多機器翻譯團隊里并沒(méi)有所謂的“語(yǔ)言學(xué)家”(Linguist),不需要任何語(yǔ)言學(xué)家就能搭建一套高效能的機器翻譯程序,產(chǎn)出他們眼中高質(zhì)量的機器翻譯譯文,發(fā)布令他們興奮不已的成果。
而令他們興奮不已的論文數據又會(huì )令媒體記者的雙手顫抖不已,寫(xiě)下驚天地泣鬼神,令翻譯人員聞字喪膽的熱文。
但以下新聞引發(fā)了我的思考:
新聞一:
《谷歌:用算法和大數據“干掉”語(yǔ)言學(xué)家》
時(shí)間:2013年9月25日
摘要:
谷歌是一家極度看重算法、充滿(mǎn)工程師文化的公司,但或許你還是會(huì )為此而感到驚奇——他們認為翻譯是一個(gè)數學(xué)和統計學(xué)方面的問(wèn)題。最近,位于谷歌總部的谷歌翻譯團隊正迅速擴張,他們新招了數名德國計算機科學(xué)家,但卻沒(méi)有招收一名語(yǔ)言學(xué)家。
新聞二:
《實(shí)現無(wú)監督學(xué)習?谷歌雇百名語(yǔ)言學(xué)家為訓練數據“鍍金”》
時(shí)間:2016年12月01日
摘要:
谷歌組織了一個(gè)由大量語(yǔ)言學(xué)博士組成團隊,它把這支團隊稱(chēng)為“Pygmalion”,使用這些語(yǔ)言學(xué)家人工篩選的數據來(lái)訓練神經(jīng)網(wǎng)絡(luò )。實(shí)際上,谷歌的機器通過(guò)觀(guān)察人類(lèi)的做法來(lái)學(xué)習如何從長(cháng)段落中提取相關(guān)答案,這個(gè)過(guò)程需要重復多遍,相當漫長(cháng)。這些艱苦的努力同時(shí)證明了深度學(xué)習的能力和局限性。為了訓練像這樣的人工智能系統,需要大量的、由專(zhuān)業(yè)人士篩選過(guò)的數據。這些數據不容易得到,也不便宜,而且對這種數據的需求不會(huì )很快消失。
新聞三:
《特寫(xiě) | 人工智能背后的人》
時(shí)間:2017年4月7日
摘要:
秦嬌今年剛滿(mǎn) 30 歲,幾個(gè)月前剛剛從呼叫中心跳槽到一家「數據加工」公司。雖然跨了行業(yè),她并不覺(jué)得兩份工作有什么不同,都是按照甲方的要求和己方的工作節奏,把人手安排到一個(gè)又一個(gè)項目中去。
公司剛成立不到一年,眼下業(yè)務(wù)大多是標注數據,即根據項目方要求,人工為圖片、視頻和語(yǔ)音內容打標簽、做標記。標注好的數據會(huì )被人工智能公司用來(lái)訓練算法模型,然后應用到圖像識別、語(yǔ)音識別等不同領(lǐng)域。
「數據加工」公司所在地距「大數據之城」貴陽(yáng)五十多公里,是一座只接受科技公司入駐的「數字小鎮」。
小鎮的隔壁有一間規模不小的高職學(xué)校,學(xué)校的學(xué)生構成了這家公司目前主要的員工來(lái)源。高職學(xué)校初建的目的是教育扶貧,因此學(xué)生們大多來(lái)自貧困山區,學(xué)校會(huì )提供不少補助和獎學(xué)金。在數據加工公司兼職賺來(lái)的錢(qián)不僅足夠生活,有些學(xué)生還會(huì )拿出一部分補貼家用。偶爾這份工作還能成為職業(yè)跳板,「我們的學(xué)生踏實(shí)又努力,有的去北京實(shí)習,因為熟悉標注工作、又認真,反饋回來(lái)說(shuō)比同樣實(shí)習的北京大學(xué)生強得多」。
除此之外,她們還可以承接小語(yǔ)種的語(yǔ)料收集工作。地處西南、臨近東南亞,當地的人際關(guān)系鏈和頻繁的商務(wù)交往能提供不少便利。
我不知道諸位讀者看到這三條新聞后是什么樣的感受?我的感受是這樣的:
嚴格意義上來(lái)說(shuō),“語(yǔ)言學(xué)家”、“語(yǔ)言專(zhuān)家”、“語(yǔ)言學(xué)博士”與“翻譯學(xué)家”、“翻譯家”、“翻譯專(zhuān)家”、“翻譯學(xué)博士”是兩個(gè)圈子的人。我如果說(shuō)“我身邊最牛的翻譯根本不知道語(yǔ)言學(xué)是什么”,你信嗎?我如果說(shuō)“做翻譯根本不需要語(yǔ)言學(xué)知識”,你信嗎?我如果說(shuō)“現在的翻譯專(zhuān)業(yè)學(xué)生根本不需要《語(yǔ)言學(xué)》”,你信嗎?
機器翻譯研發(fā)團隊之所以沒(méi)有大牛翻譯,并不是因為翻譯人員沒(méi)有作用,而是因為他們已經(jīng)過(guò)氣了,機器翻譯研發(fā)團隊手里拿來(lái)訓練機器翻譯程序的“語(yǔ)料/數據”是哪兒來(lái)的?還不是一堆他們并不知道名字的譯者一個(gè)字一個(gè)字翻譯出來(lái)的,但翻譯完就完了,他們并不清楚自己的譯文以后會(huì )起到什么作用,以為只是作為“作品”被陌生讀者閱讀罷了。
谷歌之所以又需要語(yǔ)言學(xué)博士來(lái)標注數據了,并不是因為他們的技術(shù)沒(méi)有作用,而是因為他們手里的數據不夠用了,需要由人來(lái)補充新的更高質(zhì)量的數據。而機器翻譯研發(fā)團隊還沒(méi)有開(kāi)始招募“語(yǔ)言學(xué)博士”、“翻譯學(xué)博士”,是因為人翻譯的速度太慢了,價(jià)格又太貴了,短時(shí)間內提供的高質(zhì)量的雙語(yǔ)數據對機器翻譯程序性能的提升并沒(méi)有太大提升,而直接從第三方公司手中買(mǎi)廉價(jià)的雙語(yǔ)數據或者自己寫(xiě)程序去抓取免費的雙語(yǔ)數據則更劃算一些。
標注數據這種工作跟富士康流水線(xiàn)上裝配手機的工作一樣,“惡心但必需”。“人工智能”時(shí)代,耗費多少“人工”,就有多么“智能”。
譯者通常認為自己產(chǎn)出的“雙語(yǔ)平行文本”沒(méi)有什么用,但通過(guò)技術(shù)可以進(jìn)一步挖掘雙語(yǔ)平行文本中的諸多信息,比如雙語(yǔ)術(shù)語(yǔ)、語(yǔ)義信息、句法信息等。那些年長(cháng)的譯者花幾十年從雙語(yǔ)文本中靠經(jīng)驗挖掘出來(lái)的“知識”可能遠不及計算機程序幾秒鐘挖掘出來(lái)的的信息。
那人工智能時(shí)代,“譯者”究竟扮演著(zhù)什么樣的角色?在我看來(lái),只要世界不停轉,譯者就有翻譯不完的文字,只要有翻譯不完的文字就有賺不完的錢(qián),所以譯者的生存問(wèn)題是不會(huì )受到影響的。
但,在今天的翻譯行業(yè)生態(tài)環(huán)境下,“譯者”也要順應適者生存、優(yōu)勝劣汰的法則,總有人因為不適應人工智能時(shí)代工作模式的變革而被淘汰,也總有人會(huì )在人工智能時(shí)代找到駕馭技術(shù)迎難而上的突破口。
人工智能時(shí)代,聰明的“譯者”要做一個(gè)“變革者”,熟悉技術(shù)、擁抱技術(shù)、使用技術(shù)。但在這個(gè)過(guò)程中,譯者其實(shí)處于非常弱勢的位置,因為最終改變譯者命運的不是譯者自己,而是為譯者提供技術(shù)服務(wù)的開(kāi)發(fā)者。因此,聰明的“譯者”還要做一個(gè)“合作者”,熟悉提供技術(shù)服務(wù)的人、使用他們提供的技術(shù)。
結語(yǔ)
人工智能時(shí)代,年輕一代譯者的價(jià)值應當在兩方面凸顯,一方面是自身的翻譯水平,另一方面是自身的技術(shù)認識。老一輩的譯者可以在翻譯水平方面引領(lǐng)年輕一代譯者的發(fā)展,但不能冥頑不化,令年輕一代錯失認識技術(shù)的良機。“技術(shù)”包羅萬(wàn)象,年輕一代譯者并不需要樣樣精通,也絕無(wú)可能,需要有人引領(lǐng)年輕一代譯者認識對其有價(jià)值的真技術(shù)。
作為年輕一代譯者,被機器翻譯專(zhuān)家開(kāi)除并不可怕,可怕的是被翻譯專(zhuān)家開(kāi)除。- 上一篇:論英語(yǔ)閱讀諸變量對閱讀的影響
- 下一篇:口譯員如何提升記憶力