王小川:當(dāng)機(jī)器真正掌握語言,這世界會變成怎樣?
中新網(wǎng)10月10日電 昨日,由《哈佛商業(yè)評論》主辦的“甦盛典?新商業(yè)TALK2018”在北京舉辦,《哈佛商業(yè)評論》主編何剛與場景實驗室創(chuàng)始人吳聲對“長期主義”進(jìn)行了全面的闡述,而搜狗CEO王小川對強(qiáng)人工智慧到來的預(yù)言則把會場氣氛引向高潮,他認(rèn)為,“語言是人工智慧皇冠上的明珠,當(dāng)語言真正被機(jī)器掌握的時候,強(qiáng)的人工智慧時代就到來了?!?/span>
在嘉賓介紹環(huán)節(jié),作為主持人的吳聲稱王小川是“人工智慧領(lǐng)域深耕者,卻也有著樸素的生物智慧。”此次演講中,王小川分享了“搜狗在人工智慧、新物種模式下做的思考和探索”。
以創(chuàng)新驅(qū)動AI技術(shù)落地,掀人工智慧時代的翻譯革新
“人工智慧已成為一種新的物種,從智慧手機(jī)到音箱、機(jī)器人、同傳、翻譯、無人駕駛、無人超市等?!痹诰W(wǎng)際網(wǎng)路領(lǐng)域工作十九年,王小川對人工智慧新模式有著自己的思考。他認(rèn)為,在人工智慧新模式中,圍繞語言的AI創(chuàng)新是兵家必爭之地:智慧音箱大戰(zhàn)如火如荼,會打電話的AI、會辯論的AI……語言“黑科技”正在不斷升級。
王小川與現(xiàn)場觀眾分享了《聖經(jīng)》中巴別塔的故事:人類希望通過建造一個通天塔來與上帝對話,上帝卻認(rèn)為建造通天塔是藐視他的權(quán)威。因此上帝讓不同民族的人開始説不同的語言,通天塔計劃因此失敗。他認(rèn)為,語言是人類在思想交流、溝通合作中最關(guān)鍵的環(huán)節(jié)。因此,搜狗的AI戰(zhàn)略從語言切入。
王小川以搜狗的輸入法和搜索為例,“搜索引擎需要通過語言獲取資訊,輸入法需要通過語言來表達(dá)資訊?!痹谒压贰白尡磉_(dá)與獲取資訊更簡單”的使命下,翻譯成為重點突破領(lǐng)域。
翻譯的歷史要從阿拉伯百年翻譯運動説起,“這場翻譯運動,將當(dāng)時被納入阿拉伯領(lǐng)土的希臘、羅馬的文獻(xiàn)翻譯為阿拉伯語。不僅讓阿拉伯的統(tǒng)治政權(quán)更加穩(wěn)定,為其民眾帶來更多的文化養(yǎng)分,也帶來了前後五百年黃金的盛世。這是跨語言文化交流的意義。”
百年來翻譯技術(shù)不斷發(fā)展,二十世紀(jì)七十年代首次出現(xiàn)基於規(guī)則的機(jī)器翻譯,四十餘年的技術(shù)迭代間,從SMT統(tǒng)計機(jī)器翻譯系統(tǒng)到2016年上線的神經(jīng)網(wǎng)路翻譯系統(tǒng),機(jī)器翻譯的效果顯著提升,王小川説,“隨著人工智慧的發(fā)展,機(jī)器翻譯將取代或者擴(kuò)展每個人的外部能力,在這個過程中,我們首先想的不是怎麼賺錢,而是有機(jī)會參與人類文明發(fā)展進(jìn)程?!?/p>
不管是出國旅遊、學(xué)習(xí),還是參加高大上的國際會議,語言不通是一個令人頭大的問題,而搜狗翻譯技術(shù)正解決了這一問題。2016年,搜狗與清華大學(xué)聯(lián)合建立了天工研究院,對AI翻譯技術(shù)進(jìn)行更多的研究與應(yīng)用;2017年,搜狗發(fā)佈全球首次商用基於深度神經(jīng)網(wǎng)路的同傳翻譯技術(shù)。目前,搜狗已經(jīng)能做到61國語言的互譯,並且在2017年國際賽事WMT中獲得第一名。
同時,搜狗從軟體到硬體都取得了落地成果,王小川介紹道,“一方面,我們在輸入法、搜索中融合進(jìn)翻譯功能,讓用戶能直接通過中文,簡單地跨國表達(dá)和獲取資訊;另一方面,翻譯APP、搜狗翻譯寶pro等産品的發(fā)佈,也補(bǔ)足了學(xué)習(xí)、會議、旅遊等場景下對翻譯的大量需求?!?以前的翻譯軟體,只能通過文本進(jìn)行翻譯,而生活中存在大量圖片、語音中需要翻譯的內(nèi)容,使翻譯過程效率低下,搜狗翻譯不斷革新,目前已具備文本翻譯、語音翻譯、對話翻譯、拍照翻譯、文檔翻譯等多種形式。
AI拓路者:搜狗AI走向虛擬個人助理
翻譯技術(shù)不斷創(chuàng)新的背後,是搜狗以語言為核心的自然交互和知識計算的AI理念。王小川解釋道,“圍繞語言為核心,使得人機(jī)交互更加自然,讓機(jī)器更加聰明,能夠?qū)W(wǎng)上的知識進(jìn)行計算,我們稱為‘自然交互’和‘知識計算’?!?/p>
“在人機(jī)交流過程中,更難的是理解語言承載的知識和概念,這就是知識計算?!?知識計算板塊,搜狗從翻譯、問答、對話三個方面發(fā)力,推出搜狗翻譯APP、搜狗翻譯寶pro、搜狗立知等軟硬體,王小川説,“我們希望讓搜索升級為問答,輸入法走向?qū)υ?,通過翻譯連接華語世界與全世界?!?/p>
自然交互板塊,搜狗在語音、圖像方面已取得階段性成果。不僅擁有中國最大的語音輸入引擎——搜狗輸入法,中文的語音識別率已經(jīng)做到了98%,日均語音輸入調(diào)入次數(shù)峰值達(dá)到4億次,還擁有多項“黑科技”成果。大會現(xiàn)場,王小川“唱起了”龐麥郎的《我的滑板鞋》,當(dāng)然不是現(xiàn)場真唱,而是向觀眾展示了由自己的語言數(shù)據(jù)與歌曲相結(jié)合生成的王小川版《我的滑板鞋》。該技術(shù)來自搜狗語音合成,“通過蒐集少量聲音素材,就可以生成具有這位説話人特色的合成音色?!?/p>
這還不夠,緊接著,一條以“甦盛典?新商業(yè)TALK2018”為內(nèi)容的新聞視頻讓觀眾感到震驚,竟然這麼快就出新聞了?原來這是搜狗的另一項黑科技——“虛擬主播”技術(shù),僅需向虛擬主播輸入文字,即可生成主持人播報新聞的音視頻內(nèi)容,與真人播報無異。
在自然交互和知識計算的融合下,王小川表示,“未來,搜狗的目標(biāo)是實現(xiàn)虛擬個人助理,實現(xiàn)人機(jī)交互,提供更優(yōu)質(zhì)的服務(wù)?!?/p>