#54
未閱讀文章
由 夏洛克 »
{推薦序2}
人類始終在追求對未來的精準預測
吳迪
丹麥物理學家尼爾斯.波耳(Niels Bohr)曾說:「預測很難,尤其對於未來」。在我教授統計學的過程當中,常常跟同學討論到學習統計學的目的為何?統計學的精髓在於如何「以管窺天」,利用樣本的資料來做分析,萃取出有用的資訊,做出「精準的預測」,而《精準預測》這本書正是告訴我們如何利用簡單的數學運算達成目的。實際上,預測對我們的生活而言不可或缺。例如:樂透號碼的選擇、決定投資股票的標的,或職業生涯規畫等,都是我們對未來的一種預測。由此可見,人類真正目的其實在於得到「精準預測」的結果。
拜科技發達之賜,我們現在。龐大的數據固然提供我們強大的資料作為預測依據,然而數據不會說話,是資料分析師、統計學家,以及各種統計軟體在為它說話,也就是大家常提到的資料採礦(Data Mining, DM)。學者佛羅利(William Frawley)等人認為,資料採礦是從資料庫中挖掘出不明確、前所未知以及潛在有用的資訊過程。並從資料中提取出隱含過去未知且有價值的潛在訊息。因此透過資料採礦技術,從巨量資料庫中挖掘出「黃金」(即有用的資訊與知識)做出預測,支援企業決策分析,提升企業的競爭優勢。但以數據為導向的預測會成功也會失誤。本書作者認為預測最難的部分在於:從巨量資料中分辨雜訊和真正的信號。在書中作者提到,人們通常只選擇聽見對自己有利的數據,錯把雜訊當成信號,因而做出錯誤的判斷,這就是為什麼有些預測會失敗,而有些預測卻能與結果非常相近的主要原因。如果我們能學會分辨雜訊,準確判斷出數據中的訊號,我們仍有機會能成功預測,如同作者在二○○八年美國總統大選,成功預測五十州當中四十九州的總統勝選者,及三十五席參議員的勝選者。
在了解問題與造成錯誤的原因之後,知道如何解決該問題的方法,才是「精準預測」之關鍵所在。若只是分析問題成因卻未提出解決之道,也將使其淪為空談。本書最大的特色在於,作者將內容分成兩部分:前面七章在判斷預測的問題,後面六章在探討與運用貝氏定理的解決之道。讀者可以據此訓練自己分辨雜訊和真正訊號的能力,從巨量雜訊中看出重要的訊號,不論讀者涉略何種領域(自然科學、社會科學、學術研究、企業或是行政部門等),相信透過這本書都能使預測的能力更為「精準」,從巨量資料中取出「黃金」。
(本文作者為統計學補教名師)