數字,將會再次席捲我們的未來?

網路上看一場座談會,與會者提到寫故事,比起西方人,東方人似乎較多描述過去,較少編織未來。這說法很刺激我的腦子,的確,我從未這樣想過,他們說得很對。

未來總讓我聯想到虛擬或科幻,以及高科技之類的字眼,因為我是看好萊塢電影長大的,也跟我自己發育不良的想像力有關。刺激之後,我嘗試跳開這幾個字眼,重新想像未來,太困難啦,腦子還是一些飛來飛去的東西,或黑黑的太空。可能我想錯方向了?

「未來是什麼模樣?」這問題太大。「未來可能有什麼?」這問題我的腦子還應付得來。我想到統計學,未來有統計專家,統計專家有未來,怎麼說?統計學這門學問已經問世兩三百年,還能玩出什麼把戲?是沒什麼新招,黔驢技窮,不過這一兩年來,連我這樣的終端資訊接收者都看見一些不同於以往的變化,統計專家依然唱著我還是原來的我,重點是能讓他們開演唱會的人,會成一番氣候。

這思路得從連續劇開始說起。

英國 BBC 知名的政治劇叫作 House of Cards(紙牌屋),前兩年給美國一家名叫 Netflix 的公司做了一個美版。我追了兩季,看了很興奮,興奮到沒得看只能等待。

等待總是百無聊賴,我上網查小說中文版,輾轉找到翻譯過程的甘苦談,要說靠北翻譯我也不反對。

原著作者 Michael Dobbs 這個人的文字有意思,一個句子裡的每個詞都很簡單,每個詞組成一個句子,意思變得很複雜,很難翻成中文。看到這裡,我第一個念頭是我愛你這三個字,分開看,一塊看,不就是如此?

他們繼續說,譯了原版,看了美版,基本上結構沒變,多了影射美國政壇真實事件,以及戲劇化美國政治人物。後者說得比較含糊,正好我追了這齣劇,我猜想那是指在人物身上增加一種「裁縫感」,是特別為了觀眾而剪裁的。背後有大有原因。

Netflix 起初是搞出租的,線上付費隨選視訊,NASDAQ 敲鐘。前兩年股價翻了三倍,什麼原因恐怕沒人相信,股票飆漲的原因往往不是大家能接受的原因。Netflix 製作紙牌屋時,使用大數據 (Big Data),巨量資料分析,透過他們的客戶紀錄,租了哪種影片,有好感的演員,導演,什麼情節讓客戶快轉、暫停或回放。所有紀錄反覆抽樣,得到的分配結果作為編劇重要依據,也可以說是重要商業趨勢分析。這就是為什麼我說人設與情節有裁縫感,會看政治題材的觀眾,肯定有感受到一股科技魔力。

統計分析數據有什麼稀奇,棒球界早就有啦,其他領域更是,不以為然的聲音很多。的確,如果只看數據,抽樣與分配,許多經驗人士不用大數據也能歸納出主流口味,想什麼,要什麼。我也是這麼認為,想到這裡就沒再繼續想,直到看了乏善可陳的美國隊長2,又被刺激到了。

世界是很有意思的。

正邪對立時,反派大都擁有資源與科技,正派擁有的普遍不如反派,唯有一顆正義之心是反派所沒有的。美國隊長2的九頭蛇軍團,有位德國科學家傾心研究大數據,他認為追蹤過去可以預測未來,

人的行為,吃喝拉撒,乃至於他們未來有什麼行為,做什麼選擇,研究越徹底,預測越準確。我在想,統計學的常態分配,中央極限法則的鐘型圖,呈現極端者少,中間者眾。人的行為也是如此,說白了就是習慣,過去習慣肯定牽動未來行為。

大數據分析上所需要的資源,現代科技可以支撐了。統計學的本質是準確性的估計,古典是用小樣本估計大母體,現在玩的是大數據化,用過去估計未來,商業趨勢,疾病管制,還有我想到很恐怖的東西,不是預測未來,而是預測未來越來越準,這就像是有的人聽聞 100% 不如 99.99% 更可信。

也許有一天大數據破壞人與人之間的動態不平衡,我認為只是也許,因為大數據確實是本葵花寶典,誰也不知道寶典會不會落入狂人之手。

備忘一下,乾坤三部分:系列之一動態不平衡(反射),系列之二大數據,系列之三我現在也說不上來,可能是莫名其妙的善良吧。
(2014-04-22 寫 2024-01-25 修)

黃雨木,profile,2024

發表留言