谷歌(Google)資深院士Jeff-Dean在近日于美國舊金山舉行的SIGMOD 2016大會發表專題演說時所言,我們現在最需要從機器學習中取得的是“理解力(understanding)”。
“我們現在有充足的運算資源,以及足夠大規模的、有趣的數據集;”Dean對SIGMOD大會的聽眾們表示:“我們可以儲存大量的有趣資料,但我們真正需要的是理解那些數據。”
在專題演說中,Dean概述了機器學習(machine learning,ML)與神經網絡的歷史,還有利用以影音呈現的原始數據編程模型之不同方法;他也詳細介紹Google初具規模的ML研究成果,該公司最近將在歐洲設置一個機器學習研究中心。Google繼去年發表TensorFlow算法后,又宣布自己開發了命名為張量處理單元(TPU)的人工智能加速器芯片。
Dean表示:“隨著時間推移,我們看到越來越多利用ML技術來解決各種問題的成功案例,這導致了Google內部數百個開發團隊對相關技術的使用出現真正大幅度成長。”
Google對深度學習技術的使用趨勢(來源:SIGMOD/Jeff Dean)
Dean舉例指出,Google的語音識別開發團隊,透過利用神經網絡將字詞錯誤率降低了30%;該團隊以神經網絡取代了語音識別流水線(pipeline)的聲學模型──也就是利用原始音波來判別聲音與字詞──并達成了二十年來最大幅度的改善成果。
利用機器學習與神經網絡技術解決的基礎性問題,也能在其他領域看到,例如醫療與衛星影像;在這些案例中,可能是需要在地圖上識別某棟房子以勘查太陽能光電板的安裝,或是進行糖尿病患黃斑部病變的篩選。用于語音識別的相同模型,可以輕易被利用來解決其他問題。
“那些模型有很多類似的地方;”Dean指出,Google翻譯應用程序現在可以利用畫素識別(pixel identification),實時將符號翻譯成不同語言。
機器學習的未來發展
不過在機器學習以及神經網絡的理解能力發展方面,還有一些待克服的障礙;包括模型必須要能在無人監督的狀況下學習、處理多任務任務并轉換學習,還有根據現實世界情況采取行動(也被稱為強化學習)。
Dean表示,研究人員已經開始關注機器學習的隱私保護技術,并將該模型架構添加到mdash廣告程序中;在這部分的機器學習中,人類的互動扮演在權衡時扮演重要角色,是很大的進步:“確保你提供的資料實際遵循你想要的隱私權政策很重要,或者你可以強加更高層級的政策到模型之上。”
從系統的角度來看,Dean表示下一個挑戰是如何:“利用高層級的機器語言算法描述,以及將那些不同的描述映像到廣泛的不同硬件上;”他也期望能將機器學習整合到更多傳統的數據處理方案中。
摩爾定律(Moore’s Law)的尾端為機器學習提供了有趣的發展方向,Dean預期會有越來越多進行機器學習運算的異質或特制硬件;Google的TensorFlow ASIC是一個例子,而最近則是嘗試利用以TensorFlow啟動的機器人進行大規模數據收集。
“我認為這一次神經網絡已經準備就緒;在90年代,我認為它們雖然帶來很多激勵,但就是缺乏運算資源。而現在,我想該類技術已經展現它們能解決相關有趣問題的能力;”Dean結論指出:“如果你還沒考慮如何為數據庫提供深度神經網絡,現在應該要開始了。”