188篮球比分直播直播吧:華為投資深思考,多模態語義理解的時代來了?

澳客网比分直播 www.046538.live 時氪分享 · 2019-10-09 11:36

語義理解一直被認為是“人工智能皇冠上的明珠”。

36eenfgvk3vi2h30!1200.jpg

近日,36氪獲悉,深思考人工智能機器人科技(北京)有限公司(以下簡稱“深思考”)獲得華為旗下全資子公司哈勃科技投資有限公司(以下簡稱“哈勃投資”)的數千萬人民幣的戰略投資。

從深思考官網可以了解到,其最突出的技術是“多模態深度語義理解引擎(iDeepwise.ai)與人機交互技術”。官網顯示,該引擎技術可同時理解文本、視覺圖像等多模態非結構化數據背后的深度語義,其中,對長文本的機器閱讀理解技術、自由跨域的多輪人機對話技術、對多種模態信息的語義理解技術是其非常突出的優勢。

讓人好奇的核心是兩個問題,第一,深思考的核心技術,即多模態深度語義理解與人機交互技術究竟是什么,又面向著怎樣的落地場景?第二,華為,或者說華為的子公司為什么要投資深思考,這其中存在著怎樣的商業考量與生態布局?

從接下來的文章中,我們或許可以一窺一二。

多模態和多模態語義理解

在8月結束的“2019機器閱讀理解競賽”中,在兩項核心技術指標中,深思考均位列第一,從全球2000多支隊伍中脫穎而出,取得冠軍。當時36氪,曾對深思考人工智能CEO兼AI算法科學家楊志明博士進行過采訪。

“人類說話的時候,往往是口語化的、不連續的、支離破碎的,甚至語序顛倒的。語音識別只停留在語音指令,不能理解用戶語言及背后的邏輯,實際無法解決用戶在很多場景中的剛需?!毖鈧久骶倮?,人類在看電影時,不僅看畫面、聽聲音,也會看字幕,甚至還會根據電影主題進行聯想。

每一種信息的來源或者形式,就可以稱為一種模態,例如,人的視覺、觸覺、聽覺、嗅覺、味覺,信息媒介包括語音、圖片、視頻、文字等,而傳感器則有紅外線、雷達、電磁等。

多模態的人工智能就是通過不同的信息維度和信息來源,幫助人工智能以更像人類的方式進行思考和學習。

隨著算法、算力、云及芯片等技術的不斷成熟,人工智能,尤其是強人工智能在過去幾年快速發展。據WIPOP2019年人工智能趨勢報告顯示,50%的AI專利在過去5年內發表,這意味著從2014年-2018年這五年內,AI產業進入了快速發展的階段。

當然,相比單一模態的人工智能技術,多模態的人工智能技術無論對算法,還是算力的要求,都復雜不少,甚至可能可以說是指數級的復雜程度,而最終呈現的效果,也會更接近人類思考的效果。

以智能家居場景為例,語音識別技術實現的效果,是聽到語音指令,并執行指令,一旦有復雜的語音表述,就會進入,“我沒有聽懂您說的是什么?”,或是“您的意思是這樣嗎?”等操作指令的進一步確認和細化。

真正能夠幫助機器解決“聽懂”和“看懂”的問題是語義理解,而其中的機器閱讀理解一直被認為是語義理解和自然語言處理(NLP)的標志性臨界點。

據2018年年底騰訊研究院統計,在中國人工智能企業中,融資占比排名前三的領域分別是計算機視覺與圖像,自然語言處理,以及自動駕駛/輔助駕駛,而排在第二名的自然語言處理,融資122億元,占比19%。

深思考的“多模態深度語義理解引擎(iDeepwise.ai)與人機交互技術”,簡單來說,就是實現從簡單的機器感知到深度的語義理解,而這一點,會使人機交互變得更加智能,也是機器真正邁向智能的關鍵。

這可能是深思考能夠吸引到華為子公司投資的原因之一。

但顯然,這不是唯一的原因。

華為以及華為的生態

如今,人們已經很難用一句話來簡單概括華為,其產業鏈包括通信設備、半導體、消費電子、云計算、安防等,公司營收也從2008年的183億美金增長到2018年的1052億美金。

不僅手機銷量超越蘋果,華為在5G、芯片和智能硬件端的表現也十分搶眼,尤其是5G產業上的發力,比如最新旗艦手機Mate30系列手機,其搭載的麒麟990芯片,也是行業中第一枚正式商用的5G SoC芯片。

再比如面向全場景的分布式操作系統鴻蒙OS,據之前發布會介紹,鴻蒙OS已在手機、平板上率先進行了使用,并將會應用在智能手表、智慧屏、車載設備、智能音箱等智能終端上。

但光有OS、芯片和5G技術,并不能完全實現萬物互聯的場景。這些技術像是未來華為AIoT戰略的基礎,但在基礎之上,需要更多有效的技術來增加基礎的抓手,落地更多的場景,觸達更多的用戶,并實現無感的體驗。

多模態的語義理解技術及類腦人工智能技術,則能夠起到關鍵性的作用。

目前,深思考基于AI多模態深度語義理解技術與人機對話產品主要落地于智能車聯網數字座艙、汽車智慧營銷、手機智能移動終端、智能家居、智慧醫療健康等應用場景。

以移動端的場景為例,在智能手機終端場景下,深思考基于多模態深度語義理解與人機對話引擎(iDeepWise.ai),提供出行、健康咨詢、智慧辦公、休閑娛樂等場景的智能人機對話交互iDeepWise.ai.mobile 的AI Saas 服務。尤其在出行領域,為2億智能終端用戶提供一站式AI智能出行生活服務,包括通過人機對話自動完成預訂機票火車票、自動完成酒店預訂等服務。

通過哈勃,華為今年已經投資了第三代半導體材料領域的山東天岳先進材料科技有限公司、集成電路設計公司杰華特微電子(杭州)有限公司,以及本文提到的深思考。不難看出,過去數月哈勃投資的三家公司,分別為華為提供了,人工智能所需的產品原材料、芯片設計生產和最適合的人工智能技術,可以說是通過投資實現了理想的戰略布局。

相信這三家公司,未來在華為的大生態之下,也會有更多的交流和合作。

華為子公司對于深思考的投資,似乎也標志著,人工智能進入全面商業化的階段,不再只在實驗室進行測試和訓練,而是不斷在真實場景中去落地,去實驗,去更接近成功。

人工智能走出實驗室

對于巨頭公司,尤其是ICT領域的巨頭公司而言,其擁有的海量數據,就是儲量豐富的金礦,但如果無法挖掘和發揮數據的價值,數據的存在則毫無意義。巨頭們擁有用戶、產品和場景,卻缺少人工智能這樣的“煉金術”,來提煉金礦中的財富,從而最終在同類型公司之中勝出。

對于人工智能公司而言,找到一個好的生態合作伙伴,或是一個擁有真實業務需求的投資方,能夠快速實現技術的落地,并最終實現商業化,尤其是還有云和芯片的相關產業鏈。

仍然以智能家居場景為例,智能音響、智能電視、智能冰箱、智能空調等產品,最終需要被語音理解所賦能,提升理解能力,才能真正做到人工智能。

結合多模態的語義理解技術,這些智能家居和智能硬件,不再是簡單的人類語音命令執行者,而是變成了隱形人工智能管家的觸點,他們會更了解人類的需求和習慣,并提供更加個性化和人性化的服務。

以智能車聯網為例,5G和人工智能的發展,讓自動駕駛和車聯網都被給予厚望。

傳統智能車載系統,通常通過駕駛室的智能語音交互屏幕實現人機互動,而在智能車聯網場景下,汽車跟道路基礎設施之間、汽車跟汽車之間、汽車跟互聯網之間都能夠做信息的連接和交互。車輛本身也通過視覺對車外的環境做感知與理解,再加上溫度傳感器、語音信息輸入傳感器等。

對于用戶而言,語言是最有效的交互方式,但對于車輛而言,要接受和理解語言,并且在極短時間內做出反應,是有巨大的挑戰。而除了語言的模態外,智能車聯網還有手勢的模態和圖像的模態等信息。

數字化場景下,深思考提供的技術能為上述多模態信息進行綜合理解,為人車交互提供智能大腦,同時,還可以在座艙環境下,實現人、車和家庭的連接。加上RPA自動軟件機器人,不光可以實現人車對話,車輛還可以自動幫助駕駛員完成任務,比如預定會議室、與其他智能設備的聯動、執行等。

“更重要的是解決及提升物聯網和AIoT設備多模態語義理解的能力?!毖鈧久韃┦吭詿飼?6氪的采訪中曾提到, 未來的場景之中,更多的情況是,終端設備首先具備各項傳感器,能夠多維度的收集信息和數據,同時端側AI芯片的植入,又能讓這類設備具有如圖像識別、語音識別、語義理解等人工智能能力,而云端則是更強大的算力和服務支持。一方面,如果所有終端的處理,都由云完成,性能和響應可能會成為瓶頸,另一方面終端設備必須具備AI理解的能力,才能讓機器更好的理解人類意圖。下一個時代必定是AIot的時代,也是人工智能多模態語義理解的時代。

云、芯片和人工智能技術,深思考的技術和華為生態,相得益彰。

(文章來源:36氪 作者:時氪分享)

熱門活動

技術掌舵人齊聚Gdevops北京站,解讀數據庫、智慧運維、Fintech轉型精要

  • 上海市云計算產業促進中心、dbaplus社群
  • 北京
  • 2020-05-29

中國保險業數字化與人工智能發展大會2020

  • 上海瞻仕商務咨詢有限公司
  • 上海
  • 2020-04-23
{ganrao} 福彩东方6十1带坐标走势图 分分彩后一打大小诀窍 11选5复式 河北11选五遗漏前三组 东方汇赢配资 新疆11选5走势图001 大发快三投注平台 手机游戏急速赛车 山东快3开奖结果查询 江西11选5任选5基本走势图 手机股票网上开户 广东南粤好彩1开奖结果 参与期货配资合法吗 辽宁体彩11选5开奖查询 辽宁十一选五基本走势图 今晚东方6十1开奖号码