如何思考機器學習與人工智慧應用?

TengYuan Chang
6 min readAug 11, 2018

--

最近這波人工智慧議題的盛行,大概已經持續了四到五年,坊間開始出現許多討論相關議題的書本,幾乎每一本的封面都會畫上一個機器人。我們都聽過透過深度學習或是類神經網路可以更快速的處理大量的資料,也因此在聲音辨識或是圖像辨識上有了大幅度的突破,在某些領域甚至已經可以做得比人類更好(比如說風行一時的 AlphaGo)。機器學習可以讓我們從大量的資料中得到一些較為隱晦的規則與模式,從前可能只有人類做得到,電腦做不到,或是人類不知道如何告訴電腦,讓電腦可以幫忙做到,現在都慢慢的有類似的應用出現,例如金融的風險精算和信用分數預測。

但我們在思考機器學習的應用的時候,還是缺乏一個比較有架構的方式,讓我們思考他會對整體經濟帶來什麼影響,他有可能帶來怎樣的創新,以及解決怎樣的問題。Benedict Evans 在這篇文章這個演講中提出了一些頗具啟發性的想法。

他認為討論機器學習時,有三個重要的切入點:

  • 關聯式資料庫(Relational databases)
  • 賦權的技術層(Enabling technology layers)
  • 自動化(Automation)

關聯式資料庫和賦權的技術層

關聯式資料庫在 1970 年代被提出後,大幅改變了電子化資料被創造、修改、刪除和查詢的方式,現已成為所有企業軟體的底層架構之一。過去如果大潤發的員工如果要找出「所有在內湖分店買過熊寶貝柔軟精的顧客」,這可是需要一個工程師幫你把資料整理出來,而不是像現在只要幾個按鈕就可以找到這樣的資料。關聯式資料庫的問世,創造了新的使用情境與許多公司:他創造了 Oracle,也帶來了 SAP,SAP 與其他相關的公司帶來了全球供應鏈,也因此有了沃爾瑪、蘋果和星巴克等全球企業,到了 1990 年代,幾乎所有的企業軟體都使用了關聯式資料庫。關聯性資料庫這樣的技術成為所有東西的賦予層(Enabling layer),客戶關係管理系統 (CRM) 就是奠基在關聯性資料庫這個技術上,但我們不會看著 Salesforce 然後說:這間公司不可能成功,因為做 CRM 系統他們肯定做不過 Oracle。

因此,討論機器學習時,比較實際的角度會是 - 他將成為一個新的賦予層,電腦可以幫助我們做的事情,會有跳躍式的進步(就像關聯式資料庫帶來的影響那樣),他會變成不同公司中的不同產品中的一部分,最終,所有產品之中都會有機器學習的技術,但我們也不會特別去在意他。

自動化

當討論機器學習或人工智慧時,一般人最大的誤解,就是泛機器人化,認為馬上就會有泛用型的人工智慧,或是 Google 或 Microsoft 等大公司已經累積了大量的資料,他們馬上就要通過圖靈測試,實現*真正的*人工智慧。但當我們看最近一百年科技的演進, 機器最大的價值之一是自動化。我們沒有發明出一個像鋼鐵人中的 Jarvis 一樣的智慧管家,但我們發明了洗衣機和洗碗機,他們雖不「智慧」,但毋庸置疑的是機器人,解決了不同領域的問題。相同的,機器學習讓我們有機會自動化過去只有人類可以做到的事情,但這些工作需要不同的資料,需要不同的整合,需要不同的進入市場的方式。

因此,思考機器學習時,其中一個挑戰在於在光譜的兩端找到平衡,一邊是我們不過是用數學與演算法找出規則,但一邊,我們又要找到合適的應用,解決市場上有價值的問題。這就像在 1980 年代剛發明 SQL 時,我們怎麼在 table join 和 Salesforce 這樣的應用之間找到平衡?我們可以說 SQL 讓你可以問任何想問的問題,迅速幫你從資料庫中找到答案,但同時對不熟悉資料庫的人,要問什麼問題,又不是那麼的容易想像。就像現在,我們可以說聲音辨識和影像辨識已有長足的進步,但是,儘管一間公司將過去的影像資料都整理好了,他要拿來做什麼應用?對他的商業有什麼價值?又不是那麼的明顯 (這中間的痛我最清楚…)。

那,什麼是機器學習的洗衣機呢?怎樣思考對企業有用的機器學習問題?Benedict Evans 提供了三個方向:

  1. 將目前的問題解決的更好。將機器學習做為優化既有能力的工具,例如 Instacart 運用機器學習最佳化司機的送貨路線,將效率提高了 50%
  2. 問新的問題,從既有的資料中找到新的洞見。例如,檢察官可以直接從成堆的資料中,讓電腦快速找到具有憤怒,焦慮,或是可疑的資料。
  3. 分析新的資料類型。過去電腦無法分析音訊,圖片,或是影像,但現在,這已經越來越有可能。

其中,第二和第三點的結合,讓機器學習就像是,賦予企業無限個一般兒童可供差遣。例如,因為現在機器可以辨識影像等資料,這就像是讓我們可以很便宜的做出在生產線上無限個檢視瑕疵品的初階孩童。就在四到五年前,機器可沒有這麼聰明,但現在,機器已可分辨出照片中的人是男是女,或是這照片「酷」或「不酷」。機器目前仍無法取代各領域的專家,但我們可以將許多初階的工作自動化,我們可以叫他「去聽成千上萬分鐘的電話錄音然後幫我找出生氣的片段」,或是「讀所有的 email 然後幫我找出焦慮的那幾封」,或是「看一下那成千上萬張照片,幫我找出幾張比較酷的,或是看起來有怪怪的人的照片」。

某種程度來說,這就是一直以來自動化的貢獻。Excel 沒有製造出機器人會計師,Photoshop 或 Indesign 等設計軟體沒有製造出機器人平面設計師,蒸汽機也沒有製造出機器馬,我們一直以來,只是在自動化不同應用的工作,但讓他們達到空前的規模化。

但將機器學習比喻成無數個一般孩童也非完美的譬喻,某些應用上,他更像是個狹隘領域的頂尖高手,這又以 AlphaGo 為代表。給他一套規則,讓他自我對弈,在上千百萬個棋局後,他找到了專家也看不到的洞見。所以如果可以找到某個夠狹隘的領域,給機器一套規則,和無數的資料,他或許有機會找到一些儘管該領域的專家也看不到的新洞見。

今天我們還不是那麼清楚機器學習能為我們做什麼,這就像是在 1980 年代大家也不清楚關聯式資料庫好像很酷,但他能為我們做什麼?今天許多公司大概已經可以想像機器學習或許可幫助分析或最佳化一些問題,或是做影像與聲音的辨識,往下想深一層,他們或許也可以想出像接線中心的語音情緒分析。但,是否還有其他的應用等待我們去發掘,我們還可以找出哪些我們今天還不知道我們不知道的問題?在可預見的未來,我們會將機器學習嵌入各式各樣的產品中,然後又再次的習以為常。

--

--

No responses yet