如同扎克伯格在Facebook頁面上說的,Jarvis是他個人的挑戰,從設計的過程中他可以知道更多AI技術現況;他并指出,該系統采用了數種AI技術:“包括自然語言處理、語音識別、臉部識別,以及強化學習(reinforcement learning);以Python、PHP與Objective C 等語言撰寫。”
在讀到他如何打造Jarvis時,有五件事情打動了我
第一,他再次展現自己是個精明能干的軟件工程師。我確信有很多科技產業的執行長也都擁有工程教育背景,他們在周末也會在地下室的工作臺上當“修補工”;在兩年前我寫過當時Marvell的執行長Sehat Sutardja,他說他在閑暇時間開發一種新的互連技術MoChi,而Jarvis開發案讓我發現扎克伯格跟Sutardja一樣,是個大老板級的修補工。
第二,扎克伯格的Facebook貼文中最有趣的地方,是他的AI開發案暴露了一些基礎性的問題,不過與AI不相關,是跟“聯網家庭”有關。對扎克伯格來說,AI反而是比較簡單的部分,比他預期更復雜的是:“簡單地與我家所有不同的系統鏈接與通信。”
所以說,甚至是在展開AI系統的開發之前,扎克伯格不得不先花好幾小時寫程序,以鏈接那些“語言不通”、并非采用相同通信協議的家用電器。例如扎克伯格說:
“我們的照明、恒溫器還有門,是用Crestron系統;播放Spotify串流音樂是用Sonos系統;有一臺三星(Samsung)電視、一臺我女兒Max用的Nest攝影機,還有當然我的工作是與Facebook的系統鏈接。”
他還提到:“我不得不把其中的一些API做逆向工程,甚至只為了達到我能從計算機發出指令打開燈,或是播放某一首歌的目的。”而對我們這些不會寫程序的人來說,除非只買支持三星SmartThings、或是蘋果(Apple) HomeKit的各種家電,沒有別的辦法可以實現所謂的“聯網家庭”──但當然,那是不會發生的!
扎克伯格還發現一個比各種“智能家電”不具備互操作性更大的問題:“大多數的家電甚至還不能連結互聯網。”
我被他對烤面包機的討論逗笑了:“有可能采用聯網電力開關來控制某些不聯網的家電,讓你可以在遠程打開電源,但通常這是不夠的;例如很難找到一臺烤面包機,是在你把電源關閉時就讓吐司片下降,所以當電源打開時就能自動開始烤。”有解決方案嗎?最后扎克伯格找了一臺有60年歷史的烤面包機(模擬式的),并用一個聯網開關來操縱它。
第三,一旦扎克伯格可以著手進行AI系統開發,他實際上提供了不少實用的AI相關發現以及至理名言,包括:
•對任何一種AI應用來說,了解其來龍去脈非常重要;
•扎克伯格用Facebook Messenger打造了一個Messenger機器人用來跟Jarvis溝通,如此就能用手機發訊息給Jarvis,那些訊息會立即在Jarvis服務器回放并被處理;
•文字vs.語音──扎克伯格發現自己跟Jarvis之間的溝通是文字多于語音;
•扎克伯格設置了一個兩階段步驟,Jarvis能識別門外訪客的人臉(首先是執行臉部偵測,看是不是有人進入視野,接著是找到人臉并執行臉部辨識、看訪客是誰);
•文字在與AI的溝通上,比大多數人所想象的、扮演更重要的角色,但語音也很實用,因為非常快速;扎克伯格寫道:“你不需要把手機拿起來、打開應用程序然后開始打字,你只要講話就好了。”但是為了實現對Jarvis的語音控制:“我得先打造一個Jarvis專屬應用程序,能一直聆聽我說的話;”Messenger機器人能在很多事情上表現優異,但使用語音有太多磨擦。
第四,我發現扎克伯格最后的結論真是無價,因為他非常直率地指出了AI技術目前的狀況:“我今年花了100個小時來打造Jarvis,現在我有一個相當棒的系統,聽得懂我的話而且能做很多事情;但就算我再花1,000個小時,我大概還是沒辦法打造一套能自己學習全新技能的系統──除非我能在目前的AI技術上達到某種基礎性的突破。”
第五,在看到Jarvis目前在扎克伯格家做的工作,我忍不住想:“就醬?”
簡單來說,那些他透過聯網設備并教Jarvis做的事情,看來都是花了大量勞力來省力,而且就算沒有Jarvis也不是難事。我的意思是說,花了上百小時撰寫客制化程序來啟動音頻系統、應門、打開烤面包機還有監視嬰兒房,真的有比較快、比較有效率嗎?其實扎克伯格是不是只要花幾秒鐘就可以把他不聯網的尊臀從椅子上移開,然后手動把所有那些事情都做得很好?