【果言科技】 什麼是 Big Data 大數據?

流行講「Big Data」大數據,在每個商業巨頭口中都談的一個話題,大家又理解他們在講什麼嗎?是否有龐大的資料庫就可以被稱為 Big Data? 什麼是 Big Data ?又曾經在那些方面被運用過?

這次 TechApple.com 就跟大家解構 Big Data 。

什麼是 Big Data

大數據是什麼?具備 5 個 「V」!

先跟大家說說「大數據」 Big Data 是什麼,這是從集合、管理到分析一龐大數據的形式,對於多大的數據才可以稱為「Big Data」並沒有一個客觀數字,維基百科的定義是 :所涉及的資料量規模巨大到無法透過人工或者計算機,在合理的時間內達到擷取、管理、處理、並整理成為人類所能解讀的形式的資訊,所指可以從數 TB 至數 PB 不等的數字,透過每一個 Data Set 的關系找出關聯性與規律,就是 Big Data 的目的。

早在 2001 年已經有 Meta Group (現今的 Gartner) 的分析員 Doug Laney 提出 3V ,分別是 Volume (資料量)、 Velocity (資料輸入的速度)與 Variety (資料的多樣性),及後大多數企業都以 3V 或 3Vs 去界定 Big Data ,及後有人提出 Veracity (真實性)和 Value (價值)亦相當重要,Big Data 資料巨集要具備以上的條件。

大數據亦可以引伸至 Machine Learning 、Digital footprint 等題目,但這不是我們今次要討論的目標。

ibm-big-data

大數據為人們帶來了什麼?

Big Data 為人所熟悉的案例很多,有報導指 Obama 於 2012 年選擇成功有賴於 Big Data,亦有人提出可以用 Big Data 防止寨卡病耘、伊波拉病毒擴散,於商業而言 Big Data 亦被視作預測消費者趨勢,處理物流情報的一種方法。

當中一個比較有名的例子就是 Netflix 收集用家數據,再請來 David Fincher 作導演、Kevin Spacey 作主角的作品 House of Card ,這是具備針對性的一個策略,促成策略的正正是 Netflix 用戶的使用數據,及其後分析出來的結果。

現時 Facebook 、Google 、Microsoft 、Amazon 都收集大量用戶資料,從中可以看到用戶去過的地點、生活/消費習慣、喜歡的內容從而統計、分析出一些結論,而大數據是從海量數據中導出一個可靠的結論。然而對於「多大的數據」才是有效這個問題,各家眾說紛紜,即使 Facebook 與 Google 亦有預測錯誤的情況,實在難為「大數據」的實用性下定論。

「大數據」代表「必勝法」、「預知未來」?

Big Data 理論上是「必勝法」?也有人提出相反理論,外國研究員 Simon Wardley 就曾寫過一篇名為 Why Big Data Won’t Improve Business Strategy 的文章,類似的有 Big Data Is Useless Without a Big Strategy(America Banker) 或是 Big data is useless (and even dangerous) without this key ingredient (csc.com) ,有趣的是要證實 Big Data 的成效,通常從成效本身逆推。

不明白?例如一個 Big Data 推演正確時,它就是有效,反之它就是無效的一個 Big Data 演算,然而人們在事實降臨之前,仍未有一種完美的 Big Data 推演方案,說到底這是數據分析和演算方式的一種,在現實世界有太多變數,所以它亦未必能「必勝」。

引用來源:IBMWikipedia

TechApple.com 全力為大家送上高質素文章!TechApple.com 需要你支持,請即 Like 我們的 Facebook Page!

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *

限制時效已用盡。請重新載入驗證碼。