奇異公司(GE)擁有120 年歷史,旗下各個製造事業部,目前正逐漸成為資產
與營運最佳化服務的供應商。隨著感應器從渦輪機、機車、噴射引擎和醫療
影像設備匯入資料流,奇異可為這些機器決定最有效率及成效的服務間隔(service
interval)。如今它賣技術給其他工業公司,用來管理巨量資料和分析;並依據巨量資
料的概念,創造了新的技術服務。
優比速(UPS)從1980 年代就開始追蹤包裹的移動和處理,它的巨量資料來源,
是裝在4.6 萬輛公司卡車上的車載資訊通訊(telematics)感應器,一波波傳入的資
料不僅顯示日常績效,也作為行車路線重大重新設計的參考。這個重新設計路線的
計畫稱為ORION,2011年ORION 為司機減少了8500 萬哩的行車路程,從而節省
了超過840 萬加侖油料。
這兩個實例的共同點,是公司管理階層決心用分析學來競爭,這不僅有傳統
上的意義(改善內部經營決策),也藉此創造更有價值的產品和服務。
如今,如果你的公司製造東西、運送東西、消耗東西,或是與客戶合作,你
會有愈來愈多有關這些活動的資料。你有能力分析這些資料集,為客戶與市場
帶來好處;你也有能力把分析學和最佳化(optimization),納入第一線營運人
員的每個商業決策中。這正是分析學3.0 的精髓。
所謂分析學3.0,是我們認為現已度過運用分析學的兩個時代:「分析學1.0—巨量資料之前(BBD,before big data) 和「分析學2.0—巨量資料之後」(ABD, After big data)。現在,我們察覺到另一種轉變,那是影響廣泛的根本改變,因此可以稱為「分析學3.0」。簡單來說,那是一種新的決心,要把強大的資料收集與分析方法,不只應用在公司的營運上,也用在產品與服務上,也就是把資料智慧納入顧客購買的產品與服務中。
利用分析學3.0 的10 個要件
這種策略焦點的轉變,意味著分析學在企業內有了新角色。企業必須看出許多相關的挑戰,並且以新的能力、位置和優先要務來因應。
要件1:多種類型的資料,通常是合併的
組織將需要整合公司內外的大量與少量資料,並以結構化和非結構化的格式,在預測式和規範式模型中產生見解:能告訴第一線工作人員,如何把他們的工作做到最好。例如,美國施奈德物流公司(SchneiderNational)把來自新感應器的資料,增加到物流最佳化演算法中,以便監控燃料水準、貨櫃位置和容量、司機行為等關鍵指標,穩定提高行車路線網的效率、降低燃料成本,並減少發生事故的風險。
要件2:一組新的資料管理選項
在1.0 時代,企業以資料倉儲為基礎進行分析。在2.0 時代, 他們聚焦在Hadoop 群集(cluster) 和NoSQL 資料庫。今日的技術答案是「以上都包括」:資料倉儲、資料庫和巨量資料裝置、結合傳統資料查詢做法與Hadoop 的環境(有時被稱為Hadoop 2.0)、垂直與圖形資料庫等。資訊技術架構師必須對資料管理做出選擇,這些選擇的數目與複雜度都大增,結果,幾乎每個組織都有混合的資料環境。
要件3:更快的科技和分析方法
從2.0 時期開始,巨量資料科技比前幾代的資料管理與分析技術快得多。為配合這些技術,企業運用新的「敏捷」(agile)分析法與「機器學習」技術,以更快的速度產生見解。3.0 時代面臨的挑戰,是調整營運、產品開發和決策的流程,以利用新科技與方法帶來的好處。
要件4:嵌入式分析學
分析學3.0 的各種模型,往往被嵌入營運和決策流程,大幅提高流程的速度與影響。例如,寶僑公司(P&G)正透過超過50 個「業務範圍」(businesssphere)決策室,以及5 萬多個在員工電腦上的「決策艙」(decision cockpit),來整合日常管理決策的分析。
要件5:資料的發現
若要以資料為基礎而開發產品和服務,企業需要一個有力的發現平台,進行資料探索,以及開發必要的技能和流程。對許多組織來說,資料倉儲已成為生產資料(production data)的儲存庫,發現資料平台提供的環境,讓企業不必做太多準備,就可以決定資料集應有哪些必要功能。
要件6:跨學科的資料團隊
在網路公司和巨量資料新創公司,資料科學家往往能包辦一切工作,或至少獨立性很強;然而,在較大、較傳統的公司,他們必須與其他許多不同類型的人員合作,以確保巨量資料獲得相稱的巨量分析。如今公司雇用擅長擷取並組織資訊的資料駭客(data hacker),與擅長建立模型的分析師合作。
這兩組人員都必須和資訊科技部門合作,後者提供巨量資料和分析的基礎架構,提出一些平台讓這兩組人員在其中探索資料,並將探索性分析轉化為生產能力。這些人員合組的團隊,負責完成分析所需的一切工作,成員的角色常會重疊。
要件7:設置分析長
分析學如此重要,需要高階主管的監督。企業已開始設置分析長(chief analytics ocer)的職務,以監督分析能力的建立與運用,例如美國國際集團(AIG)、歐巴馬競選連任活動、富國銀行(Wells Fargo)、美國銀行(Bank of America)等。
要件8:規範性分析
分析不外3種類型:描述性,報告過去的事;預測性,使用過去資料的模型來預測未來;規範性,運用模型來說明最佳行為與行動。雖然分析學3.0包括這3種類型,但特別強調最後一種。規範性模型需要大規模的測試和最佳化,它們提供高度的營運效益,但同時也需要高品質的規畫和執行。
要件9:產業規模的分析學
對那些主要把分析學用在內部決策流程的企業來說,分析學3.0提供機會,擴大這些流程的規模以達到產業水準的實力。例如,IBM以前在年度「需求創造」(demand generation)流程中,使用150個模型,這個流程評估哪些客戶值得銷售人員投入更多時間與精力。如今IBM的新系統,可以在沒有任何人為介入下,建立95%的模型,另外3%只需一位分析師做極小的調整,而且,這些新模型處理非常明確的產品、客戶區隔和地區。
要件10:決策與管理的新方式
若要讓分析學推動公司資料經濟的發展,你必須採用新方法來做決策和管理。許多新方法會讓你在採取行動前,確定性較高。但矛盾的是,由於巨量資料極易取得而促成的一些改變,不會產生很大的確定性。
巨量資料持續流動,因此,各項指標長期必然會有高有低。這種被稱為「數位煙霧訊號」(digital smoke signal)的資料,可作為早期預警系統,顯示有問題剛剛出現。但它們只是顯示出有狀況出現,無法證實真的有問題。因此經理人必須建立指導方針,以判斷何時應依據早期預警訊號做決策與行動。
規範性分析的使用,往往需要改變管理第一線工作人員的方式,企業將以前所未見的方式,「看到」許多人員的活動;相對的,員工一定會對這樣的監控很敏感。在分析學3.0的世界中,有時我們必須把目光移開。
在資料經濟中創造價值
分析學3.0是否代表以分析學來競爭的終極形式?也許不是。但我們應該可以肯定地說,在分析學3.0出現的時間點,參與資料經濟已成為主流。
對於歷史悠久的公司及新創公司,都需要新的能力,但無法使用分析學支援業務的舊模型,來培養這些新能力。巨量資料模型是向前邁進的一大步,但它提供的優勢持續不了多久。希望在新資料經濟中繁榮發展的企業,必須再次從根本上重新思考,資料分析如何能為自己及客戶創造價值。分析學3.0是改變的方向,也是用分析學來競爭的新模式。