科技改變生活 · 科技引領未來
一天深夜,一個社畜,完成了一天的工作,躑躅在深圳的街頭。就在距他100米的一個豪華酒店,人民富豪馬總正在里面觥籌交錯。就在這一刻,以這個社畜為圓心畫一個100米的圓,在這個圓內所有人的平均財富,一定是一個非常高的數字。那么,這一刻這個社畜的
一天深夜,一個社畜,完成了一天的工作,躑躅在深圳的街頭。就在距他100米的一個豪華酒店,人民富豪馬總正在里面觥籌交錯。就在這一刻,以這個社畜為圓心畫一個100米的圓,在這個圓內所有人的平均財富,一定是一個非常高的數字。那么,這一刻這個社畜的幸福感和獲得感是否會有提升呢?
這個段子告訴我們兩件事。一是,我們不能以個例來評價整個社會,比如這個社畜很疲憊,很沮喪,覺得沒有前途,不代表所有人都是如此,至少馬總不是,這時候我們需要統計數據;二是,統計數據也不一定靠譜,比如這個社畜的平均財富是如此之高,然而他的個人境遇并未因此有任何改變。
統計是門大學問。一方面,我們能夠通過統計數據看清社會的真實面目,另一方面,統計也能欺騙我們,我們往往會被刻意修飾過的統計數據所誤導。
美國作家達瑞爾·哈夫著《怎能利用統計撒謊》(初版于1954年),向我們揭示統計數據中的各種欺騙手法。書名直譯過來應該是《如何利用統計撒謊》(How to Lie with Statistics)。
這本書篇幅不長,也沒有什么高深的專業理論。作者以幽默的語言,豐富的例證,向我們揭示了統計中的那些花招。全書共10個小節,下面我們跟隨作者的思路,一起看看60多年前統計是怎么欺騙我們的。
1、有偏差的樣本
當統計者向我們展示一些統計數據時,我們首先要問的是,統計樣本是什么樣的狀況?有沒有代表性?
本書舉了一個很簡單的例子。《時代雜志》文章稱,1924級的耶魯大學畢業生一般年收入25111美元,這在1950年代是極高的收入了。
問題來了。25年前的畢業生,有多少人還能找到呢?那些人生失意者會回答這個問卷嗎?25年過去了,當年的畢業生,還會那么努力地回答問卷嗎?并且一定會如實填寫嗎?如果答卷,有些人由于虛榮心或者過于樂觀,會夸大自己的收入;還有一些人,由于稅務等原因,會刻意縮小自己的收入。這兩種情況分別占多大比例?
如果想獲得統計數據,因為調查成本的原因,或調查時限的原因,不可能調查所有人。這就需要抽樣調查。統計數字的質量依賴于樣本,也只能代表所調查樣本的情況。
毫無疑問,上面的數據來自這樣一些樣本,即當年全體畢業生中那些知道其住址,又肯提供答案的人,這些人可能是社會上的頭面人物。這個數字,如果是真實的,也只能代表1924級中那些知道地址而又愿意站起來報告他們掙多少錢的人。即便如此,也要假定這些人說的都是實話。
有雜志社想知道讀者都喜歡什么雜志,于是進行逐戶調查,結果顯示讀者喜歡《哈帕斯》而不是《真實的故事》,這與雜志社的發行量不符。問題在哪里呢?逐戶調查未必能了解到真實情況,因為讀者未必如實回答。更好的方法是到住戶家中收購舊雜志。當然,這也只能知道讀者有過什么,而不是他們現在喜歡什么。
河水不會高于源頭,抽樣調查的結果不會比樣本更好。抽樣調查過程可以完全符合已獲證明的數學原理,貌似很科學,然而只要精心選擇樣本,調查者總能得到自己想要的結果。
2、選擇得當的平均數
當我們獲知本地的人均年收入是X萬元時,假定我們相信統計者沒有作假的動機,數據真實可靠,那么這個年均收入對我們有多大參考意義?這個“平均”是哪種平均,算術平均,中位數,還是眾數?
一位地產商為了籠絡顧客,告訴他本地住戶年均收入1.5萬美元,是一個較好的社區。一年后,同一個人,現在是納稅委員會成員,向當局申請降低稅率,聲稱本地住戶年均收入僅3500美元。這兩個數字差別也太大了。哪個是準確的呢?可能都是。因為這兩個數字都是統計匯總的平均數。
我們經常會用到三種平均數:均值、中位數和眾數。
年收入1.5萬美元,可能是所有住戶的年收入(算術)平均值,即所有收入累加并除以住戶數。年收入3500美元,可能是所有住戶年收入的中位數,即一半的住戶在這個數字之上,另一半在這個數字之下;還可能是眾數,即最多的住戶是這個水平。
就是說,不加限定的平均數可能是沒有任何意義的。
某些數據會符合正態分布,在這種情況下,均值、中位數和眾數三者差別不大。然而,就小區住戶收入而言,可能并不如此。如果有某幾家住戶擁有高額財產,只是偶爾度假才在此居住,則可急劇拉高均值,然而并不會拉高中位數和眾數。
所以,當你獲知某公司年均收入多少,或某地、某國年均收入多少,首先要問,這個年均收入是哪個平均值,是均值,中位數,還是眾數?統計部門擁有詳盡的數據,他們有能力得到某項數據的各種平均值。如果他們發布了一項指標,而不說明是均值、中位數還是眾數,這值得你深思。
回應本文開頭的段子,如果計算以這個社畜為圓心的100米范圍內人群的收入水平,中位數或眾數更能反映真實情況。
3、沒有透露的小數字
偶爾,我們讀到一份報告,告知我們一點很有意思的信息。然而,報告中常常會有一些小數字,告知我們一些更有意思的信息:樣本數非常少,試驗只做了很少幾次,……,這往往是我們會忽略的。
某公司廣告稱使用他們的牙膏可使蛀牙減少23%。是不是覺得很不錯?然而,仔細閱讀廣告的小字說明,參加實驗的用戶只有12人。某牙粉廣告宣稱在治療齲齒方面相當成功。然而這個實驗只進行了6次,并且是先入為主的。醫藥界很多新藥都是如此炮制出來的,即只進行了較少的實驗。
怎樣識破這些花招呢?你并不需要成為統計專家。
有一個簡單易懂的顯著性檢驗法,這不過是一種說明實驗數據能夠在多大程度上代表真實情況,而不是某種偶然出現假象的方法,這就是查一查那些沒有透露的小數字。
表示這種顯著程度的最簡單的方法,就是概率。
對大多數用途來說,任何顯著水平達到5%就夠好了。而對某些用途來說,對顯著水平的要求是1%。
還有一種不公開的小數字,就是說明事物的范圍,或者與給出的平均數之間的離差的數據。
未透露的小數字的欺騙性在于它的失蹤經常無人察覺。
在《時代周刊》,1948年的一個電力公司的廣告上說:“現在美國四分之三以上的農場可以獲得電力……”。似乎很好。然而,這個“可以獲得”可以隨意接解釋,它并不意味著四分之三的農場已經獲得電力。這可能意味著電線經過他們的村莊,或者電線距他們不到10英里或100英里而已。
4、無事空忙
我們對數據進行比較時,如果兩個數據相差很小,因為數據測量本身就存在誤差,那么在統計意義上,這兩個數據實際上并沒有實質區別,完全不能說較低的數據就代表著較差的表現。這是我們需要警惕的。
比如,有兩個孩子,智商測試表明,彼得智商是98分,琳達是 101分。能不能說明琳達比彼得更機靈呢?
常用的智商測試的誤差率是3%。所以彼得的智商應該表述為98±3;琳達則是101±3。也就是,彼得的智商在95-101之間,琳達在98-104之間。從這里可以看出,彼得的智商是有可能高于琳達的。
對待這種情況的唯一辦法是看它所表示的范圍。將差別不大的數字比較是毫無意義的。
《讀者文摘》組織人對多種品牌的香煙進行分析,并公布了結果。人們發現危害成分排名,“老金”牌香煙排在最后。“老金”香煙的名聲因之大噪,“老金”公司也趁機大做廣告,但是刪掉了排行中危害成分含量的差距微乎其微的內容。雖然后來“老金”廠商被命令停止宣傳,但是他們已經從早期的宣傳中撈到了足夠的好處。
5、驚人的曲線
一圖勝千言。有些情況下,數字、表格太枯燥,而文字說明又難以解釋清楚時,這時,圖是最適合的表現形式。然而,我們往往會被精心設計的圖表嚴重誤導。
有多種方法讓一個很平凡的數據產生強大的視覺沖擊力。
比如,一個折線圖中,將縱坐標的起點取為某個較大的數值,而不是從0開始;將縱坐標的間隔取較小的數值,都能讓實際變化較小的數據顯示為比較陡峭的曲線。例如:
這個圖中的數據,銷售額從1月20.03百萬元到12月的20.1百萬元,僅上升了0.35%,然而精心設定縱坐標的起點和間隔,卻能顯示為一條陡峭的折線。
這并不是作者編造的。1951年《新聞周刊》就是這么干的,它顯示的圖形剪掉了下面的80個刻度,以顯示“股票市場創21年來新高”。1952年哥倫比亞煤氣公司在《時代周刊》的廣告,從數據可以得知10年來生活費上漲60%,煤氣費下跌約4%;然而通過精心選定的縱坐標起點,給人的視覺觀感是生活費上漲了3倍,而煤氣費降低了1/3。
有很多公司和每天使用這樣的花招誤導讀者。
6、平面圖
形象圖經常用來對兩個指標進行對比。形象圖的前身是條形圖或柱狀圖。條形圖也可以通過精心選擇縱坐標的起點以誤導讀者。
而形象圖就更容易做到這一點了。例如,比較兩個人的工資,一個人周薪30美元,另一個人是60美元。用兩個錢袋的形象圖表示兩者的對比,其中一個錢袋的高度是另一個高度的2倍。然而這完全是誤導性的。因為右邊錢袋的高度是左邊的2倍,寬度也是2倍,視覺觀感上右邊錢袋的面積是第一個的4倍;這還不算完,讀者會將這兩個錢袋想象為立體圖,這樣右邊錢袋的體積就是左邊錢袋的8倍。
《新聞周刊》就干過這樣的事。他們繪制了一張圖,用來吹噓從30年代到40年代美國鋼鐵生產能力的進步。為了表示生產能力從30年代的1000萬噸上升到40年代的1425萬噸,繪制了一個高爐形象圖,生產能力增加了42.5%,然而從圖上看來,生產能力似乎提高了好幾倍。
這些問題也許可以認為是制圖員的失誤,然而就像超市柜員在找回零錢時的偶爾失誤一樣,如果每一次失誤都有利于柜員,那么這個問題就值得深思。
7、牽強附會的數字
我們看到的報告,有時候會列舉一些數字,如果不細究,這些數字會給我們以震撼,令我們很自然相信某種結論。然而這些常常是精心挑選的、牽強附會的數字,目的就是誤導我們。
藥廠為了證明某種感冒藥的神效,發布一個試驗報告,宣稱僅僅1/2英兩的藥物,就在11秒鐘內殺死了試管中的31108個細菌。挑選一個有名的,或名字令人印象深刻的實驗室,拍一個穿白大褂的醫生模特的照片,印在報告邊上。但是千萬不要告訴公眾,這種藥物在咽喉中可能無效,也不要講殺死的細菌是哪一類。報告里面列舉的細菌,也許與引起感冒的某種東西,并無直接聯系,誰知道呢。
有很多這樣的花招。比如,吹噓某種榨汁機能多榨出26%的果汁。然而比什么多榨26%?舊式的手搖榨汁機。這種榨汁機也許是市場上最差的。去年在飛行事故中喪生的人員遠比1910年多,是不是現代飛機更不安全呢?根本不是,現在乘飛機的人是以前的千萬倍。最近因鐵路事故死亡的人達4721人,是不是鐵路更不安全呢?不是。
很多數字和事件之間并無關聯關系,把這兩者列在一起,完全是牽強附會,就是為了誤導。
《哈帕斯》雜志的讀者為A&P商店辯解說,該店純利潤只占銷售額的1.1%,誰會因這么低的利潤率而受到譴責呢?實際上這里的騙人之處是混淆了投資收益和銷售收益。例如,每天上午以0.99美元買入,下午以1.0美元賣出,賺的錢只是銷售額的1%,然而卻是一年投資額的365%。
1940年以前美國南方每年都有成千上萬的瘧疾病例,而現在卻很少報告。原因是現在證明是瘧疾的才會被記錄下來,而以前南方很多地方口語中的感冒和傷風也被認為是瘧疾。
美國和西班牙戰爭中海軍的死亡率是9‰,而同一時期紐約市民死亡率是16‰。是不是戰爭更安全呢?海軍士兵是健康的年輕人,而紐約市民包括從嬰兒到老年人的廣大范圍。
8、死灰復燃的偽因果論
兩個數字,似乎是有關聯的,宣傳者也極力將這個兩個數字聯系起來,讓人覺得似乎這兩者之間存在某種因果關系,然而事實并非如此。這種一種常見的花招,即將統計關聯宣傳為因果關聯。
有人想弄清楚學生抽煙與成績的關系。結果確實抽煙的學生成績差些。于是要想成績好就得戒煙。進一步的邏輯是抽煙使大腦麻木。然而實際情況可能相反,可能因為低分,沒有去借酒消愁,而是吞云吐霧。
B事件是在A之后發生的,因此,A是B的原因。這不一定是事實。甚至還有一種可能,這兩件事都是第三種因素的產物。
要避免上這種偽因果論的當,必須嚴格檢查任何說明相互關系的材料。關于不同數字的相關性,實際上由好幾種:
一種是偶然的相關。也許有一次,搜集的數字證明了相關性;但是再來一次,可能又證明不了相關性。人們往往會拋棄不想要的結果,并大量報道想要的結果。
還有一種普遍的協變關系,就是相關性確實存在,但是哪一個是原因,哪一個是結果,卻不可能弄清。這里,因和果可以不時互換位置。
還有一種比較棘手的情況,兩個變量中一種對另外一種具有明顯的影響,然而它們之間確實存在著真實的相關。許多不光彩的勾當就利用了這一點。比如抽煙與成績之間的關系,還有很多醫學統計數字也是如此,相互關系被證明是真實的,但是因果性質僅僅是臆想。
9、怎樣變統計戲法
利用統計資料可以向人們傳遞錯誤信息,可以說是利用統計進行操縱。
歪曲統計數據和為了某種目的而操縱統計數據的事,并不總是專業統計人員干的。統計人員手里的實事求是的數據一到商人、公共關系專家、新聞記者和廣告商手上,就會扭曲、夸大,過分簡單化,或在篩選過程中變形。
1949年美國普通家庭年收入是多少呢?美國普查局說是3100美元;拉塞爾·塞奇基金會說是5004美元。普查局的數據一般是中位數,塞奇基金會的數據可能是均值,即便如此,也不至于差距這么大。這是為什么呢?這是一個戲法。基金會將全美國的個人總收入除以全美人口數,然后乘以4(假定一家4口),就得到了5004美元。這種算法是完全錯誤的,四口之家的富裕程度決不是兩口之家的2倍。
廣告稱現在購買圣誕禮物可以節省100%的錢,這不過是基數混亂,實際上是減價50%。
《標準石油公司史》說:“西南部的減價幅度……在14%至220%之間。”這是在倒貼嗎?
上面說的這些花招似乎太陳舊、太露骨了,然而一直有人這么用。比如,每次發生罷工,就有人宣稱罷工每天造成幾百萬美元的損失。這是將罷工時間乘以該時間的產出額。
有人宣稱,對出版公司來說,由于各個環節成本上升,如車間成本提高了10-12%,原材料上漲了6-9%……,各項相加,總計成本上漲了33%,對小的出版商則是40%。然而即便每個環節都上漲了10%,總成本最多上漲了10%。這種各個環節百分比累加的邏輯純粹是無稽之談。
一個路邊兔肉三明治小販解釋他的三明治為何如此便宜,他說,我不得不摻些馬肉,我是對半摻的,一只兔子摻一匹馬。這個小販深得數字戲法真諦。
還有百分比和百分點的混淆。投資利潤率從第一年的3%提高到第二年的6%,可以說是提高了3個百分點,似乎很小,然而這個數字還可以描繪為利潤增加了100%。
盡管統計學是以數學為基礎,但它既是科學,也是藝術。在規定的適當范圍內變點戲法,甚至歪曲,都是可能的。
10、如何識別統計數字的真實性和有用性
面對統計數據,我們并不能用化學分析或金屬純度檢驗那樣的方法進行檢驗,然而,可以用下面的5個問題試探一下。
(1)誰這么說的?
實驗室為了支持某種理論,為了榮譽或金錢而證實某種東西,報紙為了聳人聽聞的消息,工廠或廠房為了控制性命攸關的工資水平,這些都可能產生偏見。
這些偏見之下,可能會瞪著眼瞎說,也可能說一些含糊之詞;可能會選擇有利的數據,回避不利的數據;也可能改變計算的標準。
(2)他是怎么知道的?
要密切注意選擇的樣本:是由于選擇不當,還是由于只選擇迎合自己的樣本,這個樣本是否大到足以作出任何可靠的結論。
關于相關系數,也要問一下,是否大到足以說明問題,是否從足夠多的實例得出,是否有一定的顯著性。
(3)缺了什么東西?
要密切注意未加說明的平均數,任何情況下,均值和中位數有很大的差別。
(4)有人偷換概念了嗎?
檢驗統計數字時,要注意在原始數字和結論之間某個環節上可能發生的變動,將一種東西報導成另外一種,這樣的事太多了。
(5)這有意義嗎?
每當聽到以沒有得到證實的假設為基礎的長篇大論時,可以想一想,這有意義嗎?這個問題可以使統計數字恢復它的本來面目。
許多統計資料一下就看出是假的,僅僅是由于數字的魔法鎮住了常識,它才得以蒙混過關。
雖然這本書初版距今已經67年,這并不意味著這本書所介紹的統計花招已經過時,我們在媒體上依然能看到各種各樣的欺騙性的統計數據。當然,時代在前進,新的花招也層出不窮。比如,如果某個統計數據很難看,怎么辦?調整其中某項指標的權重即可。如果調整權重仍然難看呢?也很容易,將這幾項指標直接踢出去。
有關部門或企業為什么要進行這種統計欺騙呢?當然是為了某些目的,這還用得著說嗎?
英國前首相迪斯雷利說過,謊話有三種,謊言,彌天大謊和統計。我們要了解社會,當然離不開統計數據,然而我們要睜大眼睛,仔細分辨這些數據背后的真相,凡事要多問幾個為什么。
王陽一