探索“智能語(yǔ)音”未來(lái)的香港“王博士”

新華社廣州4月27日電(記者陳寂)當(dāng)香港科技大學(xué)博士王昕決定離校赴深圳創(chuàng)業(yè)之時(shí),她已投身語(yǔ)音識(shí)別研究10年之久。那是在4年前,30歲出頭的王昕曾權(quán)衡再三。

 

身處香港科技大學(xué)計(jì)算機(jī)科學(xué)及工程學(xué)系,浸淫國(guó)際前沿的科研環(huán)境與開(kāi)闊的學(xué)術(shù)視野中,王昕本可選擇留校,享受優(yōu)渥待遇,但做事喜歡做到極致的她卻覺(jué)得,自己研究的東西沒(méi)能很好地實(shí)現(xiàn)產(chǎn)業(yè)化運(yùn)用。

 

“語(yǔ)音識(shí)別技術(shù)落地變成消費(fèi)類(lèi)產(chǎn)品的前提是要和產(chǎn)商結(jié)合,而深圳這點(diǎn)很厲害,技術(shù)從實(shí)驗(yàn)室到產(chǎn)品的過(guò)程很快。”她說(shuō)。

 

于是,王昕做了一個(gè)自稱(chēng)“很欠揍”的選擇,在2012年與幾個(gè)創(chuàng)業(yè)伙伴北上深圳,在深港產(chǎn)學(xué)研基地成立了“深圳語(yǔ)音搜索及應(yīng)用工程實(shí)驗(yàn)室”,希望憑借車(chē)載語(yǔ)音識(shí)別產(chǎn)品邁進(jìn)內(nèi)地車(chē)聯(lián)網(wǎng)市場(chǎng)。

 

“我感覺(jué),開(kāi)車(chē)時(shí)的語(yǔ)音識(shí)別不是錦上添花的應(yīng)用,它必將成為一種必需品。”王昕說(shuō)。深港產(chǎn)學(xué)研基地給了王昕一個(gè)免費(fèi)的理想創(chuàng)業(yè)場(chǎng)地,在這個(gè)由深圳市政府、香港科技大學(xué)和北京大學(xué)共同創(chuàng)建的基地里,很多人都叫她“王博士”。

 

因?yàn)檫@一研發(fā)方向契合深圳市的產(chǎn)業(yè)發(fā)展方向,“王博士”的實(shí)驗(yàn)室還獲得政府?dāng)?shù)百萬(wàn)元人民幣的資助。

 

“機(jī)遇大,但挑戰(zhàn)也是分分鐘的事情。”王昕創(chuàng)業(yè)之初,零經(jīng)驗(yàn)運(yùn)作一個(gè)企業(yè),招兵買(mǎi)馬,做計(jì)劃書(shū),與政府、市場(chǎng)打交道……面臨許多未知,吃過(guò)許多閉門(mén)羹。數(shù)年間,創(chuàng)業(yè)團(tuán)隊(duì)陸續(xù)有人離開(kāi),“不像在港科大,帶團(tuán)隊(duì)都有學(xué)校支撐?,F(xiàn)在每一年都要想著怎么找錢(qián),養(yǎng)活這么多人。”

 

在各種新型智能化設(shè)備日益廣泛地走進(jìn)人們的工作和生活的今天,作為人機(jī)交互最自然的方式,語(yǔ)音識(shí)別成為了當(dāng)今最便捷的人機(jī)交互使用方式。

 

“以前很多人不習(xí)慣對(duì)機(jī)器說(shuō)話,而微信語(yǔ)音和siri服務(wù)改變了這點(diǎn),現(xiàn)在手機(jī)上所有的語(yǔ)音功能,車(chē)上都能用了,并已發(fā)展到了隨心所欲的程度。”王昕解釋說(shuō),車(chē)載語(yǔ)音識(shí)別最大的挑戰(zhàn)在于控制噪音環(huán)境下的識(shí)別率,而這正是她公司的技術(shù)優(yōu)勢(shì)所在。

 

現(xiàn)在,王昕的企業(yè)已擁有逾100名員工,年盈利數(shù)百萬(wàn)元人民幣,產(chǎn)品覆蓋車(chē)載語(yǔ)音識(shí)別、政府部門(mén)人工客服等多個(gè)領(lǐng)域。與此同時(shí),王昕的企業(yè)還借助大數(shù)據(jù)服務(wù),搭建面向證券領(lǐng)域的高端商情服務(wù)系統(tǒng),覆蓋近900家擬上市企業(yè),實(shí)現(xiàn)對(duì)擬上市企業(yè)從初審到上市這一敏感時(shí)期全天24小時(shí)、多種信息來(lái)源的輿情監(jiān)控。

 

“當(dāng)一個(gè)社會(huì)熱點(diǎn)事件發(fā)生之后,互聯(lián)網(wǎng)相關(guān)的新聞會(huì)涌出很多,人看到的只是一個(gè)一個(gè)片段,但機(jī)器會(huì)搜索和呈現(xiàn)完整的一個(gè)時(shí)間軸和發(fā)散途徑。”王昕以天津港爆炸事故為例解釋說(shuō),機(jī)器會(huì)在事故發(fā)生后立即挖掘數(shù)據(jù)庫(kù),會(huì)發(fā)現(xiàn)停放有汽車(chē)的企業(yè)是哪些、背后涉及哪些保險(xiǎn)公司、居民樓又是哪些房地產(chǎn)商的……機(jī)器會(huì)分析連接起所有的線索,形成完整的知識(shí)圖譜。

 

“人下一秒會(huì)說(shuō)什么,人工智能是通過(guò)對(duì)之前說(shuō)的很多話的大數(shù)據(jù)積累來(lái)預(yù)測(cè)的。股票也是一樣,人工智能也可以根據(jù)大數(shù)據(jù)來(lái)預(yù)測(cè)。”王昕說(shuō),她的實(shí)驗(yàn)室將會(huì)把大數(shù)據(jù)的挖掘與證券行業(yè)和金融行業(yè)做結(jié)合。

 

國(guó)家“十三五”規(guī)劃里提到“人工智能”,也讓王昕對(duì)未來(lái)充滿期望。“我們的發(fā)展還是和國(guó)家大局契合的。”她告訴記者,語(yǔ)音識(shí)別不僅要能“聽(tīng)清說(shuō)了什么”,還得“理解說(shuō)了什么”,這方面提出的挑戰(zhàn),今后將從后臺(tái)數(shù)據(jù)上發(fā)力應(yīng)對(duì)。

 

在她看來(lái),有了“深度學(xué)習(xí)”能力的人工智能,將來(lái)在語(yǔ)音識(shí)別上不僅能回答“今天天氣多少度”,還要能回答“今天天冷么”這樣的問(wèn)題。