close

行銷資料科學(MDS)與大數據(Big Data)

        大數據剛出現時,一度被稱為巨量資料或者海量資料,因此也讓許多人誤認為,在研究行銷資料科學時,背後的資料量要非常龐大,最好是又多、又大的「大數據」(Big Data)等級。正因如此,許多人覺得,行銷資料科學與大數據之間有著必然的關係。事實上,行銷資料科學與大數據並沒有絕對的關係。其實,縱使是小資料,也能透過分析並獲取有用資訊,進而做出相關的行銷決策。

        不過,對於擁有大數據且能對加以分析的企業來說,更有機會擁有「分析優勢」(Analytics-advantage)。因此,對於推行行銷資料科學的企業而言,了解大數據,有其必要性。以下簡單對大數據的基本概念進行說明。

        根據維基百科的定義,大數據意指「傳統資料處理應用軟體,不足以處理其大或複雜的資料集的稱謂」。在這個定義裡,指的是「資料量龐大到資料庫系統無法在合理時間內,進行儲存、運算、處理,分析成能解讀的資訊時,就稱為大數據」。

        至於大數據的來源則包羅萬象,包括:互聯網文本和文件、社會網絡數據、網路日誌、POS系統數據、RFID紀錄、或是人臉辨識、眼球追蹤、GPS、客服電話錄音、傳感器數據、以及天文學、大氣科學、醫療記錄,甚至是基因組學…等。

        大數據的特質可用4V來解釋,如圖1所示:

大數據的4V特質.png

圖1 大數據的4V特質

繪圖者:周晏汝

1.資料量大(volume: amount of data)

        從位元組的次方單位來看,有所謂的KB(103)、MB(106)、GB(109)、TB(1012)、PB(1015)、EB(1018)、ZB(1021)、YB(1024)…等。目前所謂的大數據,資料量大概介於PB(1015),而根據統計,一家大型的電信公司,每天大概會產出數個PB左右的資料量。

2.速度快(velocity: speed of data in and out)

        許多大數據資料是即時產生的,例如:消費者在移動過程中,所產生的「位置」資料。許多時候大數據分析的結果,也必須能即時化為行動,例如:即時根據消費者的位置給予相對應的服務,像是不久前很流行的AR「寶可夢」抓寶遊戲。

        另外,東京海上日動火災保險公司(Tokio Marine & Nichido Fire)推出「一次型保險」(One Time Insurance)的商品,讓消費者在抵達高爾夫球場時,即時收到簡訊,提醒消費者是否要保「一次性的一進洞險」。

3.性質多元(variety: range of data types and sources)

        大數據的資料型態非常多元,包括結構化資料(structured data)、半結構資料(semi-structured data)和電子郵件、網頁、社群媒體、圖片、視訊和聲音等非結構資料(unstructured data)等,資料的多元性會讓儲存、挖掘和分析的難度大幅提高。

4.資料正確性(veracity: uncertainty of data)

        「垃圾進,垃圾出」(Garbage in, garbage out,GIGO)是資訊科技領域常聽到的一句話,意指將錯誤、無意義的資料輸入電腦後,不管分析工具再強大,輸出的還是錯誤、無意義的結果。

        以上4V,即是常見的大數據特質,但對於學習行銷資料科學的我們來說,擁有大數據是一件可喜的事情,但縱使只有小資料,也能透過行銷資料科學的分析,獲取有用的資訊,進而做出相關的行銷決策。

羅凱揚(台科大兼任助理教授)、蘇宇暉(台科大管研所博士生)

arrow
arrow

    TMR 發表在 痞客邦 留言(0) 人氣()