中國企業(yè)在全球機(jī)器閱讀理解水平測試折桂

據(jù)微軟官方公布消息,最新的全球機(jī)器閱讀理解標(biāo)準(zhǔn)水平測試(MSMARCO)中,中國企業(yè)“猿輔導(dǎo)”名列第一,其數(shù)據(jù)模型在閱讀理解能力上超過了人類的平均水平。

 

圖片默認(rèn)標(biāo)題_fororder_猿輔導(dǎo)

 

“猿輔導(dǎo)”標(biāo)志

 

MSMARCO是全球人工智能領(lǐng)域行業(yè)中,公認(rèn)的機(jī)器閱讀理解標(biāo)準(zhǔn)水平測試,也是該領(lǐng)域的頂級賽事。賽事舉辦目標(biāo)是創(chuàng)造出能夠像人類一樣思考的機(jī)器,吸引世界頂尖科技公司的人工智能研究團(tuán)隊(duì)參與。微軟公司從搜索引擎中抽取10萬個(gè)問題,然后由人類和參賽團(tuán)隊(duì)數(shù)據(jù)模型進(jìn)行答題。

 

參賽的“猿輔導(dǎo)”是國內(nèi)一家在線教育創(chuàng)業(yè)公司。此次該企業(yè)研究團(tuán)隊(duì)的MARS數(shù)據(jù)模型,答題在兩項(xiàng)官方評測指標(biāo)上分別得分49.72、48.02,位列參賽團(tuán)隊(duì)榜首,且超越人類47、46的基準(zhǔn)水平。百度NLP團(tuán)隊(duì)、微軟AI研究團(tuán)隊(duì)分列二、三名。

 

“猿輔導(dǎo)”研究團(tuán)隊(duì)武漢分部負(fù)責(zé)人柳景明表示,猿輔導(dǎo)此次提交的MARS模型,采用層疊式的注意力機(jī)制在多候選文檔,采樣出多個(gè)候選答案區(qū)域,并在此基礎(chǔ)上使用交叉投票模型,優(yōu)化最終的答案,實(shí)現(xiàn)機(jī)器找出的答案比普通人找的更準(zhǔn)確。

 

微軟全球機(jī)器閱讀理解標(biāo)準(zhǔn)水平測試項(xiàng)目負(fù)責(zé)人表示,人工智能得分超過人類,將意味著人工智能在探索和學(xué)習(xí)人類知識時(shí),將能夠更快、更有效地獲取信息,“如果能讓機(jī)器像人類一樣閱讀和理解文檔,將為所有可能的情形開啟大門。”