加勒比一本heyzo高清视频-免费精品无码av片在线观看-无码国产精品一区二区免费模式-去干成人网-成在人线av无码免费

物聯(lián)傳媒 旗下網(wǎng)站
登錄 注冊

讓機器「看懂」語言,更加自然的與人交流

作者:機器之心
來源:百度百家
日期:2015-12-02 10:44:34
摘要:我們自稱智人(Homo sapiens),因為自身獨特的智能對我們來說非常重要。數(shù)千年來,我們一直試圖理解人類如何思考,如何利用僅有的少量物質(zhì)就能感知、理解、預測和操縱一個遠大于自身且比自身復雜得多的世界。另一方面,我們也希望將這些智能賦予更多的物體,比如說——機器。

讓機器「看懂」語言,更加自然的與人交流

  我們自稱智人(Homo sapiens),因為自身獨特的智能對我們來說非常重要。數(shù)千年來,我們一直試圖理解人類如何思考,如何利用僅有的少量物質(zhì)就能感知、理解、預測和操縱一個遠大于自身且比自身復雜得多的世界。另一方面,我們也希望將這些智能賦予更多的物體,比如說——機器。

  自人工智能在1956年達特茅斯會議上首次提出,讓機器完成更多的智力工作成為科學家努力的方向。其中一個重要的目標就是希望機器能夠與人類進行更加自然高效的交流,希望機器讀懂人類深奧的語言,同時以一種我們習慣的方式進行交互,而解決這個問題的兩個技術就是自然語言處理和語音合成。

  眾多科技巨頭正在這方面進行布局,2013年谷歌以超過3000萬美元收購了新聞閱讀應用開發(fā)商Wavii。Wavii擅長自然語言處理技術,可以通過掃描互聯(lián)網(wǎng)發(fā)現(xiàn)新聞,并給出一句話摘要;微軟將自然語言處理技術應用在了智能助手小冰、Cortana上,取得了不錯的效果,通過機器翻譯使Skype具備了實時翻譯功能;自然語言處理技術是Facebook智能助手M背后的核心技術之一,其產(chǎn)品負責人稱「我們對M做的事情可以讓我們更好地理解自然語言處理?!箛鴥?nèi)公司科大訊飛在去年年底發(fā)布了自然語言處理云平臺,很早推出語音合成產(chǎn)品,在中文領域的自然語言處理和語音合成方面有著深厚積累。

  近期,百度新聞客戶端也上線了語音播報新聞摘要的新功能,用戶在瀏覽新聞時可通過下滑屏幕進入到語音閱讀模式,借助于自然語言處理技術和語音合成技術為用戶朗讀新聞,百度新聞成為第一款將自然語言處理和語音合成結(jié)合在一起的新聞客戶端。

  自然語言處理:機器如何看懂人話?

  現(xiàn)代語言學與人工智能在大約相同的時間誕生,并且一起長大, 交叉于一個稱為自然語言處理的混合領域。自然語言處理主要關注如何讓機器理解人類的語言,主要包括信息檢索、信息抽取、文本摘要等,信息檢索用來在網(wǎng)絡上尋找和排名相關的段落,信息提取用來識別具體對象和搜索的實際答案,文本摘要將它以一種簡潔的方式呈現(xiàn)給用戶。而解決這些問題的一個共同要素是采用語言模型來預測語言表達的概率分布。

  一個自然語言處理系統(tǒng)并不了解人類處理文本的方式,但是它卻可以用非常復雜與成熟的手段巧妙處理文本,例如自動識別一份文檔中所有被提及的人與地點;識別文檔的核心議題;或者在一堆僅人類可讀的合同中,將各種條款與條件提取出來并制作成表格。

  以百度新聞的語音播報為例,借助于自然語言處理技術生成新聞的摘要,在信息嚴重過載的今天,無異幫助用戶提高了信息獲取的效率。

  百度新聞此次使用單文檔摘要模塊,能夠給定的文檔中提煉出最重要的信息,從而作為摘要用于描述文檔的主要內(nèi)容。本模塊基于機器學習的方法抽取關鍵句子,同時采用子句壓縮技術,對句子進行簡寫。用戶可以根據(jù)任務的需要選擇此模塊包含的三個模型:長摘要模型,微摘要模型,短摘要模型。

  1)長摘要,是常見的抽取式摘要,此模型直接從正文中選擇出若干句子組成摘要。

  2)短摘要,在長摘要的基礎上增加了句子壓縮的功能。句子壓縮能夠?qū)渥舆M行簡化保留句子的核心部分。

  3)微摘要,既使用的句子壓縮功能,同時增加了列表類摘要的提取和連貫性策略。

  對于下面的網(wǎng)頁,根據(jù)其標題(藍框部分)和正文(紅框部分),百度新聞能夠生成下列摘要:

讓機器看懂語言,更加自然的與人交流

  長摘要:克里米亞塞瓦斯托波爾軍事機場被俄羅斯軍隊控制。塞瓦斯托波爾是前蘇聯(lián)黑海艦隊所在地。在克里米亞塞瓦托斯波爾軍事機場周邊地區(qū),俄羅斯士兵已經(jīng)在待命。這些俄羅斯士兵戴著頭盔,穿著護甲,另外還有人員運輸車準備隨時提供支援。一群不明身份的武裝分子占領了克里米亞機場。據(jù)稱,他們的目的是為了阻止烏克蘭過渡政府總統(tǒng)所乘飛機在機場降落。據(jù)法新社最新報道,克里米亞機場現(xiàn)已恢復運營,飛機起降沒有延誤。武裝人員在短暫控制后撤離。

  短摘要:克里米亞塞瓦斯托波爾軍事機場被俄羅斯軍隊控制。塞瓦斯托波爾是前蘇聯(lián)黑海艦隊所在地。在克里米亞塞瓦托斯波爾軍事機場周邊地區(qū),俄羅斯士兵已經(jīng)在待命。這些俄羅斯士兵戴著頭盔,穿著護甲,另外還有人員運輸車準備隨時提供支援。

  微摘要:他們的目的是為了阻止烏克蘭過渡政府總統(tǒng)所乘飛機在機場降落。

  自然語言處理技術解決了機器理解人類語言這個階段的問題,并生成了三種形式的摘要,從而幫助用戶大大節(jié)約了獲取信息的時間。而接下來的這個階段便是將該摘要以一種更容易讓人類接受的形式讀出來,從而使用戶可以在最短時間內(nèi)獲取到最有價值的信息。

  語音合成:如何讓機器與人的交流更加自然?

  近代語音合成技術則是起源于貝爾實驗室,涉及聲學、語言學、數(shù)字信號處理、計算機科學等多個學科技術,解決的主要問題是如何將文字信息轉(zhuǎn)化為可聽的聲音信息。

  語音播報新聞如何更具情感表現(xiàn)力,更接近真人朗讀的聽覺體驗,從而使用戶在通過語音獲取信息時更加自然?百度新聞使用的語音合成技術這樣實現(xiàn):

  首先,創(chuàng)新語料生產(chǎn)方式,提升數(shù)據(jù)規(guī)模。傳統(tǒng)錄音語料庫的積累,往往以句子為單位,嚴格控制發(fā)聲人錄音的聲調(diào)、節(jié)奏,導致文章的語義情感無法融入其中。而情感語音語料庫的積累,以段落或者篇章為單位,允許發(fā)音人基于對文本的理解加入個人自然有感情的語音表達,使得語音中蘊含豐富的語義和情感。

  其次,創(chuàng)新數(shù)據(jù)處理方式,提高數(shù)據(jù)處理效率。傳統(tǒng)語料數(shù)據(jù)處理方式為手工精標,需要耗費大量人力。百度利用機器學習技術實現(xiàn)了數(shù)據(jù)的自動化處理,能夠?qū)Υ罅堪楦械恼Z料庫快速進行標注,大大提高了語音合成數(shù)據(jù)處理的效率。

  最后,創(chuàng)新韻律和聲學建模技術,提高情感表現(xiàn)能力。百度采用了多層次雙向LSTM韻律建模技術,實現(xiàn)從文本到韻律情感信息的直接端到端的高精度建模,同時利用多層雙向LSTM-RNN模型對語義及長時信息的卓越聲學建模能力,將豐富的語義相關信息加入到上下文中,構(gòu)建文本與語音之間的深層次對應關系,生成富有表現(xiàn)力的模型,使合成的語音具有豐富的情感。

  總之,自然語言處理解決的是「如何讓機器讀懂人類語言」的問題,語音合成解決的是「如何讓機器像人類一樣開口說話」的問題,這兩者結(jié)合的結(jié)果就是機器與人之間形成一種最自然的交互方式。而這帶來的直接結(jié)果就是我們在獲取信息方面效率的極大提高。

  人工智能相關技術近幾年進展飛快,但許多人并未在太多產(chǎn)品中體驗到技術帶來的機器智能和效率的提高,而將自然語言處理和語音合成應用在新聞領域是一次獨特的嘗試。由于語言和信息對人類與生俱來的重要性,這兩項技術的結(jié)合還會有不可估量的想象空間。

  語言:機器與人最自然的交互方式

  因為具有語言的能力,人類區(qū)別于其他物種。10萬年前,人類知道了如何說話,7000年前,學會了如何書寫。就像Magic Leap未來學家、科幻作家Neal Stephenson在《雪崩》中將語言比喻成人類大腦最底層的結(jié)構(gòu),而《人類簡史》中也提到,人類是因為文化的出現(xiàn),使自己不再與其他物種一起擁擠在基因進化的道路上,而是走上了文化進步的快車道。而文化起源的本質(zhì)和承載方式就是語言。語言是我們最自然的交互方式、知識儲備和表達媒介。

  互聯(lián)網(wǎng)上超過萬億條的信息網(wǎng)頁,幾乎所有這些頁面都是用自然語言描述。更加重要的是,這些信息還在持續(xù)增加——人類因為自身的語言能力在源源不斷的創(chuàng)造著通過自然語言進行表示的信息,信息數(shù)量增加的可能造成的一個結(jié)果就是我們獲取某些核心信息的成本提高,而解決這個問題的方法就是機器的自然語言處理,使之能夠讀懂我們的信息,并幫我們進行信息篩選和知識總結(jié),然后再借助于語音合成技術,將這些總結(jié)過的、有價值的信息以一種人類更能接受的方式傳遞出來,從而進一步增強了我們獲取外部信息的效率。

  《信息簡史》一書中探尋了信息的本質(zhì),介紹了我們獲取和傳遞信息的歷史,從非洲部落的鼓點,到文本的發(fā)明,再到信息論建立帶動的信息技術革命。部分科學家甚至認為,構(gòu)成世界的基礎不是物質(zhì),不是能量,而是信息。正如物理學家約翰?惠勒所說的「萬物源自比特」。也正因如此,如今當信息如洪流般淹沒了我們,使我們深陷信息焦慮、信息過載、信息疲勞的困擾中時,我們才會如此無助。

  人工智能技術的發(fā)展讓這個問題的解決稱為可能,圖像識別、語音識別可以讓機器為我們?nèi)ジ兄獠渴澜?,將處理后的有價值的信息傳遞給我們。自然語言處理和語音合成則是去挑戰(zhàn)人類最重要的技能——語言,希望創(chuàng)造一種機器與人最自然的交互方式。

人物訪談