大數據分析是工業4.0與服務4.0的重心

        商業競爭在大數據時代來臨後,未來競爭更加激烈,特別是服務業也將進入「服務4.0」時代。

        「服務4.0」這個概念乃是由「工業4.0」類比而來。工業4.0強調「智慧化」生產,讓企業透過「感知器(物聯網)」,收集「大數據」(Big Data),並進行分析,進而改善生產流程,發展新產品與新服務。

        至於服務4.0,根據台灣科技大學資管系盧希鵬教授的說法,服務4.0強調「個人化(非客製化)」。而他認為,個人化是參與出來的。他以智慧型手機為例,剛買的手機是「標準化」的,但使用了一段時間後,就變成「個人化」。時間一久,你絕對不會想把手機借人家,因為裡面有太多自己的資訊。所以,服務4.0強調,透過掌握個人化的資料,來提供個人化的服務,而這些資料的彙集就是「大數據」。所以,大數據分析是工業4.0與服務4.0的重心。

        然而,對企業經營者來說,以上的概念,有什麼管理意涵?

文章標籤

TMR 發表在 痞客邦 留言(0) 人氣()

盡信資料,不如無資料

        《孟子》第十四卷盡心篇下中有一句話︰「盡信書,則不如無書」。大意是說,「完全相信《尚書》中所記載的事,還不如沒有《尚書》這本書」。這句話源自於孟子認為《尚書》裡所寫的部分內容過於誇張,史官下筆時可能有所偏差。類比到行銷資料科學,我們也可說,「盡信資料(Data),則不如無資料(Data)」。

        2013年12月,哈佛商業評論(HBR)刊登一篇由湯瑪斯.雷曼(Thomas C. Redman)所寫的文章《盡信資料不如…(Data's Credibility Problem)》(中文版由侯秀琴翻譯),就在探討這個存在已久的議題。

        在這篇文章裡指出,醫學中心的實驗資料錯誤,可能會害死病人;工廠裡的產品規格資料不清楚,可能會大幅增加成本;公司的財務報告資料不正確,可能會誤導投資大眾。以上的例子,均點出資料正確的重要性。

        資訊界有句流傳逾半世紀的名言,叫做「垃圾進、垃圾出(Garbage in, garbage out)」,如圖1所示。這句話背後的問題至今依舊存在,亦即企業內部可能充斥著許多的錯誤資料,而對於這些錯誤資料,許多人常誤認為是資訊系統的問題。事實上,資料錯誤的成因,常常來自於資料的「輸入」,其與人、流程、制度有關;而非資料的「處理」,它反而與資訊系統有關。也由於資料的不可靠,管理者很難建立起以「資料導向」(Data Driven)來做決策,因而倒退回強調經驗的直覺決策方式。

文章標籤

TMR 發表在 痞客邦 留言(0) 人氣()

不是大數據分析專家,一樣能做出資料導向決策

        2013年8月的哈佛商業評論(HBR)上,刊載一篇由湯馬斯.戴文波特(Thomas H. Davenport)所撰寫的《跟上計量專家》(Keep Up with Your Quants)文章。文中開宗明義地指出,要做出以資料為導向的有效決策,主管們不必是精通大數據分析專家,但主管必須找到能被公司所用的專家,並且知道該如何運用他們的專業。

        戴文波特建議主管們,先想像自己是「資料分析」的客戶,而提供「資料分析」這項產品的人是「資料科學家」。「資料科學家」擅長收集資料與分析資料,並發展預測模型,並提出分析報告,但是他們通常不懂產業,也沒有相關的知識。而主管們擁有產業知識、經驗、與直覺。透過「資料科學家」提供的資料分析結果,主管們能結合自己的專業,判斷分析的結果與建議是否恰當。

        為了能夠與「資料科學家」溝通,並讀懂他們的分析報告。戴文波特提出以下五點建議。

1. 學習簡單的分析技術

文章標籤

TMR 發表在 痞客邦 留言(0) 人氣()

有效運用「小資料」比導入「大數據」更重要

        大數據風起雲湧,讓許多公司也開始大手筆投資「大數據」,像是增聘人員、買設備、買軟體,但效果可能不如預期。這樣的結果,來自於大多數的公司還是依賴以經驗直覺做決策,未善用內部已有的資訊。同時,也未養成「資料導向」(Data Driven)的決策文化。

        為了解決這個問題,企業應先體認到,很多決策無關乎「大數據」,反而與「小資料」有關,而且對於大多數的企業來說,其實並未擁有真正的「大數據」資料。企業應授權基層員工,善用內部已有的資料來進行決策。

        珍.羅斯(Jeanne W. Ross)、辛西雅.比思(Cynthia M. Beath)和安.闊格拉斯(Anne Quaadgras)在2013年12月的哈佛商業評論(HBR)上,發表了一篇文章《誰需要巨量資料?》,文中以日本7-Eleven為例,提到執行長鈴木敏文(Toshifumi Suzuki)認為,存貨週轉率是7-Eleven獲利的關鍵。因此,他將下訂單這個重要的決策,交由店裡的20萬名店員來執行,而這些人多數竟然還是工讀生。鈴木敏文認為,這些現場的員工才是真正了解消費者的人。7-Eleven將每日銷售報表與天氣預測的資料,提供給這些第一線的員工,讓他(她)們做好進貨的決定,例如預報下午可能會下雷陣雨,店員就可以在下雨前,就先把雨衣、雨傘擺出來,以提高顧客買走的機會。而這樣的做法,也是7-Eleven獲利良好的原因之一,如圖1所示。

7-Eleven進貨決策範例.png

文章標籤

TMR 發表在 痞客邦 留言(0) 人氣()

大數據的五大管理挑戰

        在麻省理工學院執教的安德魯.麥克菲(Andrew McAfee)與艾立克.布林約爾松(Erik Brynjolfsson),於2012年10月份的《哈佛商業評論》裡,發表了一篇文章〈大數據︰管理的資訊革命〉(Big Data: The Management Revolution)。在該篇文章中,麥克菲與布林約爾松指出大數據世代下的五大管理挑戰。

挑戰1:領導

        事實上,到目前為止,大部分的管理者在做決策時,還是依賴經驗與直覺。然而在大數據世代下,企業要能結合資料分析結果,做出理性的決策。亦即從「最高層決策的個人意見導向決策(Highest paid person's opinion) Driven Decision-Marking,簡稱HiPPO,)轉向「資料導向決策,DDD(Data Driven Decision-Making)」(如圖1所示)。由於HiPPO的縮寫,有河馬英文的意思,因此常被戲謔為「河馬決策導向」。

從HDD轉向DDD .png

文章標籤

TMR 發表在 痞客邦 留言(0) 人氣()

資料的四大來源:企業資料、雲端資料、開放資料、物聯資料

        資料來源百百款,種類繁複,有些由人們所產生,有些則由機器所產生;有些資料存放在企業內部,極其珍貴,有些資料則屬於外部來源,讓資料科學家可以信手拈來。

        資料是資料科學家的「衣食父母」,沒有它們,資料科學家只能原地踏步,但有了資料,資料科學家也需要有慧眼和工具,才能將寶石自礦山中挖掘、篩選和過濾出來。

        以下簡單就中原大學資工所賀嘉生教授,所提出的四大資料來源進行說明。

  1. 企業資料:

        企業內部資料的來源,主要來自於資料庫(Data Base)或是資料倉儲(Data warehouse)。存放在資料庫裡的資料,源自於企業內各種資訊系統,包括:銷售系統、人力資源管理系統、進銷存系統、顧客關係管理系統(CRM)、企業資源規劃系統(ERP)、供應鏈管理系統(SCM)和企業網站。企業資料通常最難取得,因為這些資料攸關著企業的營業機密。

文章標籤

TMR 發表在 痞客邦 留言(0) 人氣()

從大數據(Big Data)到全數據(Whole Data)

        被譽為資訊界的傳奇人物、也曾獲得資訊科學領域中最高榮譽圖靈獎(Turing Award)的美國資訊工程學家吉姆·格雷(Jim Gray),在其生前曾提出「科學典範」(Science Paradigm)的概念,他認為科學研究的演進,有以下四種典範[1],如圖1所示:

       1.第一典範「科學實驗」:以記錄方式,呈現實驗結果,描述自然現象。

       2.第二典範「理論推演」:發展理論,建立模型,歸納驗證。

       3.第三典範「模擬仿真」:透過電腦,對複雜現象進行模擬。

文章標籤

TMR 發表在 痞客邦 留言(0) 人氣()

大數據有多大?

        你的手機裡有Instagram、Facebook、Line的App嗎 ? 如果你每天都有上傳照片、心情感想到這些社群網站去的習慣。基本上,你也是大數據創造者的一員。根據統計,人們每天上傳到這些網站或雲端的文件數量高達十億份、照片則有一億張,而其它的影音和金融、電信資料更不在話下了。

        美國資訊專家提姆‧喬西( Tim Joyce)於2014年,寫了一篇分析資訊儲存成本的文章,內文中提到,造成資訊大量爆發的原因,其實是資訊儲存成本的大幅降低,因為消費者的行為產生出來之後,如果無處儲存,產生出來的資料也無以分析。舉例來說,現在1TB的硬碟製造成本不到100美元,而在1984年,IBM一台大型主機的四台儲存設備串連運作,每個容量只有2.52GB,也大約只有10G左右的容量,而要讓這些儲存設備能夠運作,造價可是高達5.5千萬美元。30多年前處理資訊的成本,與現在處理大數據,根本是天差地遠。

        讓我們簡單回顧一下電腦基本容量的概念。一個Byte(位元組),指的是資料常用的基本單位,可以表示一個數字或英文字母。而一個中文字全形字,則由2個Byte所組成。所以數字123 等於 3個Byte,其中每個數字佔1Byte。至於像是「大數據」則等於6個Byte ,1個中文字占2個Byte。

        常見的電腦容量單位如圖1所示。

文章標籤

TMR 發表在 痞客邦 留言(0) 人氣()

行銷資料科學(MDS)與大數據(Big Data)

        大數據剛出現時,一度被稱為巨量資料或者海量資料,因此也讓許多人誤認為,在研究行銷資料科學時,背後的資料量要非常龐大,最好是又多、又大的「大數據」(Big Data)等級。正因如此,許多人覺得,行銷資料科學與大數據之間有著必然的關係。事實上,行銷資料科學與大數據並沒有絕對的關係。其實,縱使是小資料,也能透過分析並獲取有用資訊,進而做出相關的行銷決策。

        不過,對於擁有大數據且能對加以分析的企業來說,更有機會擁有「分析優勢」(Analytics-advantage)。因此,對於推行行銷資料科學的企業而言,了解大數據,有其必要性。以下簡單對大數據的基本概念進行說明。

        根據維基百科的定義,大數據意指「傳統資料處理應用軟體,不足以處理其大或複雜的資料集的稱謂」。在這個定義裡,指的是「資料量龐大到資料庫系統無法在合理時間內,進行儲存、運算、處理,分析成能解讀的資訊時,就稱為大數據」。

        至於大數據的來源則包羅萬象,包括:互聯網文本和文件、社會網絡數據、網路日誌、POS系統數據、RFID紀錄、或是人臉辨識、眼球追蹤、GPS、客服電話錄音、傳感器數據、以及天文學、大氣科學、醫療記錄,甚至是基因組學…等。

文章標籤

TMR 發表在 痞客邦 留言(0) 人氣()

大數據(Big Data)的發展

        在美國加州大學戴維斯分校任教的馬丁‧希爾伯特(Martin Hilbert)教授,回顧約180篇關於大數據分析的期刊論文,並於2016年發表了一篇文章[1]Big Data for Development: A Review of Promises and Challenges》,其中談到大數據分析的前景與挑戰。

https://www.youtube.com/watch?v=XRVIh1h47sA

(馬丁‧希爾伯特(Martin Hilbert)教授演講大數據的發展)

        他歸結出今日大數據的產生,可由下列三項資訊的發展來說明。

文章標籤

TMR 發表在 痞客邦 留言(0) 人氣()

1 23