全球大數據風潮已然掀起。而一向跟矽谷科技產業潮流很快的台灣,是否已準備好?
IBM台灣軟體事業處協理林芸蒂說,雖然國內包括電信業、金融業、零售超商、消費性品牌大廠等,都已經表示濃厚興趣,但仍處於問得多、行動少的階段。根據IDG調查顯示,有興趣在未來一年針對大數據做事業規劃的美國企業,大約僅23%。林芸蒂表示,實際付諸行動的台灣業者比例,和北美差不多。
趨勢科技台灣暨香港區總經理洪偉淦認為,台灣多年來在全球網路、e化準備度名列前茅。各類中大型企業、政府機關,數位資料建置投入不低,像是坐在金礦上,卻沒有積極運用大數據分析,實在很可惜。延遲的原因有可能是大數據的內容非常多元,分析工具也百花齊放,讓企業不知如何切入較好。
依產業特性 需要有不同分析法
專研資料分析的交大交通運輸所博士生劉佳欣指出,大數據首要特性就是龐大,例如2013年,美國平均一間企業的資料量就有100TB。它的來源,主因智慧型手機等科技工具應用廣泛,源源不絕地產生數據。而無論大或小量數據的分析,皆建基在資料科學。在實務上,需要依據企業資料規模,使用的分析方法各產業不盡相同,並無好壞之分。然而,有些企業會去乞求一個萬能工具,殊不知問對問題找對人,才重要。
根據IBM等業界實務經驗,台灣企業面對大數據這個龐然大物,從頭開始到展開資料科學分析,收到成效的過程,通常可區分為三個階段:資料建置、資料管理彙整、到真正善用資料做決策分析。目前,國內一些中小企業仍處於第一階段,資料建置不足;更多的是中大型企業、公部門,已有不錯建置資料基礎,但還沒進入拿來做決策參考的階段。只有少數企業,已經摸索出跨越三個階段障礙的解決方案。
關卡1〉建置足夠的資料量
財團法人中衛中心技術總監葉神丑,兩年前開始執行食品雲計畫。但當要求國內食品業者上傳產品資料時發現,食品產業上下游的廠商很多是中小企業,只有12%會做數位資料建置與存檔,不少做資料的習慣甚至停留在紙本。在這樣的狀況下,很少有現成資料可分析,他只好從做表開始,逐步輔導業者。
其實,要做好大數據,第一階段就是把資料建置好。新北市衛生局副局長林金富做食品雲輔導新北市學童午餐的盒餐業者,每天即時上傳菜單時,曾遭遇許多業者抱怨,訴說自己只是個做小生意的,又不是跨國企業,不知道這些用電腦輸入的菜單、照片,對自己有什麼好處?
但是當業者發現,家長看到清楚的午餐資訊,不會一天到晚打電話來質疑,態度才慢慢改變。林金富說,現在他們知道,食品雲因為透明,可以創造信賴感,新訂單也可能透過網路曝光後進來。林芸蒂認為,國內一些消費性品牌公司、連鎖零售集團等大型企業,建置與管理資料的基礎已有,但是卻還不太知道如何撈出有用的線索。
關卡2〉問對問題 撈出有用線索
主要原因是,許多企業以為去買一套萬能分析軟體就能見效,等到做不出來後才發現,已經偏離正確方向一大圈。也因此,往往在還沒看到成效時,就沮喪放棄。由Code for tomorrow和精誠集團Etu組成的資料科學計畫團隊,講師之一的謝宗震指出,資料分析流程有三個最簡單的步驟:問對的問題、找尋可行資料、再來驗證。
例如一個便利茶飲集團,如果想知道營收下滑的原因,初步也許是檢查櫃台POS系統裡的業績數據就夠了。然而,若集團老闆直覺是店裡熟客變少,讓營收下滑,那麼光檢查POS系統裡的數據是不夠的,還要去找能看到消費者行為的資料,例如去建置一個手機App的熟客會員卡,來和POS系統連動。
這中間成本會差很多,最好及早弄清楚,這兩個問題哪一個是比較需要知道的?最好的方式就是讓資料科學分析團隊和老闆持續互動交流,由科學家負責科技,老闆負責產業知識的判讀。洪偉淦認為,未來每間企業都要有專屬的資料科學家跟在核心團隊旁,從基礎分析慢慢磨練。
關卡3〉打造獨有的分析模式
資料科學玩到成熟,就不會只是存資料和管理資料,必須善用大數據,調配出企業獨門配方。然而這需要企業內部先革命。
洪偉淦舉例說明,趨勢科技約10年前就看好大數據風潮,五年前成立內部專屬的資料分析部門,目前已有約200位同仁。這個團隊,當初由程式人才,學統計學又略懂資工的人組成。一開始還是在做趨勢的主業,資安維護,但是懂統計的人,需要在旁邊了解程式人每天怎麼工作?怎麼蒐集與建置資料?慢慢看出一些資料潛藏的金礦。
例如,每個人每天瀏覽網頁的優先順序,通常充分地反應出個人的偏好。有人愛看鄉民論戰,就先去看批踢踢;有人想查今天新聞,就先去各個新聞網站。所以,當趨勢科技團隊某天發現,很多點進瀏覽的網友,在同一時間都出現了一模一樣的順序,就引起適當質疑:應該這些都不是真正的人,是機器人。再進一步研究,確認的確是惡意程式。後來,就把判別新方式,轉化成大數據分析服務之一。
好在,雲端大廠已經意識到大數據風潮,如亞馬遜AWS、IBM等業者提供的新工具大量出現。洪偉淦估計,現在企業若想積極擁抱趨勢,從資料建置到調配出屬於企業自己的大數據專門分析模式,最快一年半到三年,就能逐步見效。
他更呼籲,透過政府開放的open data中,也有可能為年輕人提供許多創業的機會,創造出國際級的大數據服務。他舉例,像是電子發票,背後潛藏的是全台灣人的消費行為內容;只要透過工具過濾個資,立即可當做瞭解社群、消費趨勢的關鍵新武器。
看來,台灣從每天快速增長的大數據中,尋找商機,是刻不容緩的。就看各界如何攜手,用資料顛覆自己,再創高峰。
老闆有多焦慮,大數據就有多熱
當亞馬遜靠大數據發展出無人能敵的電子商務,迫使美國零售業龍頭沃爾瑪跟進改進資料分析,大數據帶來的熱潮,已燒出許多企業主的IT焦慮症。已投入大數據應用嘗試的信義房屋資訊長蔡祈岩,曾任職外商銀行匯豐的資金管理部門,並擔任過某製造業廠長。他觀察,不論國內或國外的企業高層,心中都深怕不知哪一天,公司會被一個善用大數據的新秀打垮。可是,當他們認真想學習時,一看到背後那麼多複雜的IT知識,不少人又會打退堂鼓。
IBM台灣軟體事業處協理林芸蒂觀察,台灣企業高層算是很用功、很積極的一群,過去不少企業曾投資資料庫管理,建置POS後台系統等,但也有許多企業不知如何解讀效益,資料最後擺一邊,非常可惜。
IT人員要拿效益評估說服主管
其實,要解決老闆們的IT焦慮,第一步是資訊人員別猛塞專業知識,要善用說故事的能力。蔡祈岩說,像他介紹雲端,會用「雲上有沒有神仙?」的問題生動開場,引起興趣。其次,企業高層認為過去的投資沒有用,其實是沒有建立評估的機制。蔡祈岩建議,資訊人員每次提出需求之前,要給公司一個花錢有用的理由:當預估效益大於成本,表示能賺錢,就可以做,否則就不應該做。
他以2010年曾建議信義房屋做行動看房App經驗舉例,他認為所有老闆聽到這個建議時,必定會問:這會比公司已經有的官網更好嗎?能帶來多少業績?
當時,他用信義房屋官方網站以往的流量,帶來成交業績的歷史數據,加入當時台灣使用iPhone的社群計算,得出iOS App帶看房,預估將帶來多少業績。當高層發現,iPhone在台使用人數不少、且都是精英,用iOS App可比官網更精準地抓住這群人,預估成交業績高於建置App成本好幾倍,馬上同意投資。
畢竟,企業要獲利才能生存,焦慮的老闆們要的是證據。資訊人員應該出有力證據,讓老闆放下心中大石,大膽投資大數據。