今年我國興起人工智能浪潮,很多人工智能公司都創下巨額的融資記錄,例如曠視、商湯、依圖、中科視拓等是公司。然而很多人不知道的是,這幾家公司都與微軟亞洲研究院有著深厚的淵源。中科視拓的董事長兼CTO山世光、曠視科技首席科學家孫劍是前微軟亞洲研究院院長沈向洋的團隊成員、博士生;依圖科技的創始人兼CEO朱瓏是前微軟亞洲研究院副院長張宏江的學生;商湯科技創始人湯曉鷗曾是微軟亞洲研究院視覺計算組資深研究員。電子制作模塊
機器也有情商?微軟對話式人工智能
可以看到,很多從微軟亞洲研究院走出去的人才都涌向人臉識別領域,而現在微軟研究院似乎并沒有沿著這個方向走,他們最為人熟知的是對話式人工智能。在微軟看來,計算機在對話能力和情感理解能力方面仍然遠遠落后于人類,因此在2014年開始就研發微軟小冰,是一款基于情感計算框架、以情商為主要方向的對話式人工智能。那么,目前微軟的對話式人工智能到底進展到哪一步了呢?微軟中國區首席技術顧問管震近日在一個人工智能論壇上做出精彩分享,表示機器開始學習人的情緒,來滿足各種需求。微軟小冰在全球范圍內,與數億人類進行了旨在建立情感連接的對話,總計對話量已超過300億輪。
此外,基于人工智能的深度學習和大量數據,微軟小冰還能勝任主持人,甚至是創作文學作品。目前小冰已經創作出200首詩,部分作品發表在詩集《陽光失了玻璃窗》中。這也是人類史上第一部完全由人工智能創作的詩集。
微軟在對話式人工智能這方向深入研究,已經走了很遠的距離。但是對于創業型的機器人公司而言,千萬不要一上來就想研發另一個微軟小冰。管震表示,小冰是面向消費者的對話式人工智能,微軟花費了大量的人力財力,并與很多企業合作,灌輸了大量的數據之后才有了目前的成績。創業型機器人公司應該將有限的人力財力投入到特定情景的服務型機器人當中,訓練對應情景的知識地圖。例如在醫院負責掛號導流的服務型機器人,其服務對象是病人,只需具備理解病人的病癥并導流到指定科室的能力,查詢天氣、娛樂、生活百科式的問答是不必要的。
服務型對話機器人可以快速響應用戶,提供24小時服務;標準化的話術減少了前臺的服務培訓時間。那么如何從零開啟創建一個對話機器人呢?管震表示,對話機器人大致分為用戶交互入口、用戶意圖理解、調用響應服務三個步驟。
其中用戶意圖理解涉及到到自然語言的理解,例如在復雜的上下文語境下,要連貫起來理解用戶表達的意思。據說微軟小冰最多能聯系23句上下文的意思,但是水平還需大大提高。微軟可提供Congnitive Services(LUIS)技術幫助開發者實現自然語言的理解。
管震指出,微軟只是提供一個標準的對話式機器人框架,開發者需要訓練特定情景的知識地圖。盡管微軟語言識別的錯誤率已經非常低了,2016年微軟宣布英語的語音識別轉錄詞錯率僅 5.9%,達到了專業速錄員水平超越了人類。但是在特定的情景下,如面向3-6歲兒童的陪伴型機器人,兒童的表述能力不強,語音識別錯誤率必然會升高。因此,開發者不能照搬微軟的標準化平臺,而是要訓練兒童對話場景下的知識地圖和認知能力。
驍龍845移動平臺,主導終端側人工智能
智能語音的應用也越來越多,過往移動設備的AI由于大數據的需要較多依賴云端,例如微軟的對話式人工智能更多的是基于云端的大數據、大運算能力。但目前有一個趨勢是云端的運算能力開始往端上遷移,以進一步提升效率,同時可靠性和用戶隱私數據也得到更高保障。
高通是踐行終端側人工智能的先行者之一,近日推出最新的驍龍845移動平臺,終端側智能是高通反復強調的認知。高通在與華為的麒麟970芯片不同,驍龍845并沒有內置單獨的NPU(神經單元),而是綜合部署,將AI處理功能分散在845平臺的異構架構中。高通也在這方面強調,通過模塊內之間的調用,可以達到更有針對性的AI操作。
高通產品市場總監Dennis Liu在“人工智能解決方案”的主題演講中表示,終端側的人工智能得以發展取決于三個關鍵的技術。一是高效硬件(處理器的運算能力);二是算法改進(在終端運算的資源有限的前提下,想要保證精度必須使算法更簡潔);三個軟件工具(嵌入式設備接口很多,如何在復雜的編程環境下快速部署算法,軟件工具是關鍵)。
Dennis Liu透露,OPPO R11、VIVO 20、小米6、一加5等手機都用到了高通的人工智能功能。 驍龍神經處理引擎通過軟件來加速終端側執行的深度學習網絡,支持智能手機實現流暢的解鎖和面部識別體驗,并支持在照片上增添人像模式或實現實時背景虛化。
據了解,驍龍神經處理引擎(SNPE)SDK除了已支持Google TensorFlow和Facebook Caffe / Caffe2框架之外,現在還支持Tensorflow Lite和新的ONNX,幫助開發者輕松使用他們所選擇的框架,包括Caffe2、CNTK和MxNet。驍龍845還支持Google Android NN API。
除了高通最擅長的智能手機領域,驍龍845在VR/AR等產品也頗有建樹。驍龍845是首款支持室內空間定位(room-scale)六自由度(6DoF)和即時定位與地圖構建(SLAM)的移動平臺。簡單來說,在使用驍龍845處理器玩虛擬顯示產品時通過攝像頭可以檢測到周邊的環境,包括對手實時跟蹤,并識別前方障礙物提醒用戶,提升VR沉浸式用戶體驗。
你了解你的膚質嗎?基于圖像的膚質檢測技術
皮膚是人的第二張臉,越來越多的人對自己的膚質情況密切關注。但目前的人工識別技術大多應用在安防、手機解鎖、支付上面,主要任務是將人臉識別出來,沒有將人臉上的膚質進行進一步的分析。和而泰的數據與人工智能實驗室就在研究基于圖像的膚質檢測技術,是人臉識別技術相對是垂直的研究方向。和而泰副總裁王宏表示,目前可以提供豐富、精細的檢測維度,包括臉型、眉型、膚色、黑頭/毛孔、皺紋等等。
和而泰已經在京東眾籌上發布了一款智能膚質檢測儀,不過王宏表示,目前智能硬件的市場接受度比較低,因此主要通過手機攝像頭這個超級傳感器去開拓市場。
通過手機拍攝的人臉圖片,手機APP可快速精準的檢測出眼周、臉部、手部等區域的皮膚水分、油分等肌膚參數,并且針對數據進行智能分析,提供針對每個人膚質不一樣的定制化改善方案,包括護膚建議、飲食建議、保養建議等。
膚質檢測減技術的檢測流程包括圖像采集-圖像預處理-圖像模型(傳統模型、深度模型)-識別結果。王宏表示,膚質檢測技術目前還處于研究階段,并分享了兩個技術難點。
一是在圖像采集階段,如何得到一張高質量的圖片,亮度和距離都要合適。為了保證圖像的亮度,以及人臉可識別區域的面積,需要在圖像采集時在前端做亮度和距離的檢測,判斷拍照姿勢、角度、距離正不正確,指導用戶拍照得到高質量的照片。此外在圖像預處理階段也要調節圖像的亮度,從而捕捉到臉部更多的細節。
二是數據標注階段,分為定義數據類別、數據標注、數據檢測三個步驟。對于非專業人員可以輕易辨識的數據,采取抽樣交叉標注的方式;對于毛孔、黑頭等皮膚問題的數據,需要與專業人員(醫生)合作,花費大量的時間去標注數據。此外,人臉膚質情況屬于個人隱私,如何得到大量的膚質數據也是個難題。
其實,在深圳地鐵站的面膜智能售賣機上,已經有免費膚質檢測的功能。機器會檢測并顯示出用戶的膚質情況,并建議用戶買哪一款面膜。這種商業模式其實相當不錯,但問題在于膚質檢測的結果并不準確,多次檢測的結果甚至大相徑庭。當檢測結果不精準沒有權威性的時候,自然不會有太多消費者買單。希望能更多像和而泰這樣的企業研究膚質檢測技術,協同傳感器、AI芯片、算法公司、方案商、終端企業等產業鏈上下游共同推進該技術的發展。