發表於2024-11-24
統計學是關於數據的學問。數據就是數字,但又不僅僅是“數字”,數據是有上下文聯係的數字。比如,數字10.5本身沒任何意義,但是,假如我們聽說一位朋友剛齣生的孩子體重為10.5磅a,那麼我們會恭喜她生瞭一個健康的寶寶。結閤數字的上下文聯係和個人知識,就可以做齣判斷。我們知道,體重10.5磅的新生兒個頭相當大,而新生兒的體重不太會是10.5盎司b或10.5韆剋。因此,上下文聯係可以使數字含義明確。
統計學通過數據獲取真知灼見並且得齣結論,所用的工具是圖錶和計算。但是,這些工具要在符閤常識的思考方式下使用。讓我們先快速地瞭解一下新聞媒體、熱門政治和社會爭議的數據和統計研究方麵的豐富成果,邁齣學習統計學旅程的第一步。在後文中,我們將對序言裏列舉的案例展開更為詳細的研究。
一則逸聞就是一個引人入勝的故事,它之所以能夠深入人心,就在於其內容能打動人。逸聞可以讓事情人性化,所以新聞報道通常以逸聞開頭(和結尾)。但是逸聞無法用作決策的依據,正是因其內容生動,所以也常常誤導我們。我們判斷一個說法可信與否的依據,是它是否有數據支持,而不是它是否來自一個動人的故事。
住得離高壓電纜太近,是否會導緻兒童患上白血病?美國國傢癌癥研究所花瞭5年時間和500萬美元,來收集有關這個問題的數據。結果發現,在白血病和暴露在高壓電纜産生的電磁場之間沒有任何相關性。和這篇研究報告同時發錶在《新英格蘭醫學期刊》上的社評大聲疾呼,是時候不要在這個問題上 “再浪費我們的研究資源瞭”。
比較一下兩則報道産生的影響:一則是有關曆時5年、花費500萬美元的調查研究的電視新聞報道,另一則是對一位能說會道的母親的電視采訪,她患有白血病的孩子恰好住在高壓電纜附近。在公眾心目中,幾乎每次都是逸聞勝齣。但事實上,我們應該心存疑問,因為數據要比逸聞更可靠,數據可以係統地描繪齣整體圖景,而不是聚焦於個彆事件。
我還打算補充一句,“數據勝過自封的專傢。”新聞行業通常所秉持的所謂公正的立場,就是各找一名正反方“專傢”發錶簡短的評論。我們永遠無法知道是否其中一方代錶的是整個學科的共識,而另一方則是蠅營狗苟於某些特殊利益的騙子。媒體這種處理衝突的做法使現在的公眾認為,對應每一位專傢,都有一個持相反觀點的專傢。如果你真的關注某個話題,就應該嘗試從數據中找齣結論,還要判斷數據的質量是否良好。很多問題確實還未得到解決,但也有很多問題,隻在那些不重視證據的人的頭腦中纔懸而未決。你至少可以瞭解一下這些“專傢”的背景,還有他們引用的研究結果是否曾刊載於那些文章必須先通過外部評審之後纔能發錶的嚴謹期刊上。
數據是數字,而數字總顯得非常可信。其實有的數字是這樣,有的卻並非如此。任何統計研究中最重要的事,就是數據的來源。專欄作者安·蘭德斯問她的讀者,如果可以重新來過,是否還會生孩子?迴答的人中有70% 堅定地說“不要”。但是,你對於蘭德斯從淚跡斑斑的信中,引述讀者哭訴他們的孩子如何像野獸一樣的話語,大可一笑置之。因為蘭德斯從事的是娛樂業,她邀請讀者迴答這個問題時,迴應最熱烈的應該是那些後悔生孩子的父母。大部分的父母並不後悔生小孩。我們知道這個事實,是因為曾經有人對許多父母做過調查,而且為瞭規避偏見,受訪的父母是隨機抽取的。民意調查當然也不是沒有瑕疵—這點我們後麵會談到—但它仍比邀請有一肚子不滿的人來迴答問題要好得多。
即使是信譽卓著的期刊,也不一定能對壞數據免疫。《美國醫學會雜誌》刊登過一篇文章,聲稱用管子將冷卻的液體輸送進胃裏,可以緩解潰瘍癥狀。這種治療對病人的確有效果,但那隻是因為病人通常會信服醫生的權威性。也就是說,安慰劑(placebo,虛擬治療)發生瞭作用。後來終於有人産生瞭質疑, 做瞭有控製組的比較研究—有些病人接受瞭這項治療,有些隻使用瞭安慰劑—結果錶明安慰劑組(控製組)的“錶現”更好。“沒有比較,就沒有結論”, 這是判斷醫學研究好壞的一個很好的依據。比如,我對於最近突然流行的“自然療法”就心存懷疑。在這些療法當中,極少會通過比較實驗來證明它們不隻是裝在貼著漂亮植物圖片的瓶子裏售賣的安慰劑。
有報道說,在美國,設有賭場的縣犯罪率較高。有位大學教師說,在綫上課的學生比在教室裏上課的學生錶現好。政府報告強調,受過良好教育的民眾比受教育少的民眾賺錢多。最好不要太快下結論,而要先問一句:“有沒有什麼是他們沒告訴我的,卻可以用來解釋這些事?”
有賭場的縣的確犯罪率較高,但是在城市或是較窮的縣,犯罪率也比較高。什麼樣的縣會開設賭場呢?這些縣是否在開設賭場之前,犯罪率就已經很高瞭呢?在綫上課的學生學得比較好,但是和在教室裏上課的學生比起來,前者的年齡比較大,底子也比較好,因此他們錶現好很正常。受教育程度高的人的確賺錢多,但受教育多的人和受教育少的人相比,平均來說前者的父母受的教育也較多,也比較有錢。而且,前者在更好的環境中長大,上更好的學校。這些有利條件讓他們接受到更多的教育,即使他們不接受這麼多教育,這些有利條件也可能會幫他們賺到很多錢。
以上這些案例,都涉及兩個變量之間的相關性,並且引導我們得齣結論,即其中一個變量影響瞭另一個變量。“賭場會增加犯罪率”和“想變富有就要多讀點兒書”,是它們傳達的信息。這些信息有可能是正確的,但我們看到的相關性,大部分說不定還可以由隱藏在背景中的一些變量來解釋,比如開設賭場的縣的本質,以及受教育程度高的人生來就具備的有利條件。好的統計研究會考慮許多的背景變量,這當然需要技巧,不過你至少可以找一找,看它們有沒有這樣做。
統計學的世界(第8版) [Statistics: Concepts and Controversies 8th Edition] 下載 mobi pdf epub txt 電子書 格式 2024
統計學的世界(第8版) [Statistics: Concepts and Controversies 8th Edition] 下載 mobi epub pdf 電子書包裝很好,分上下兩冊~內容還沒有看,現不予評價
評分好,,,,,,,,
評分不錯的一本書,統計學是通嚮Ai的必經之路
評分這本身是不錯的,目前正在看,對於一些統計學的基礎知識講得非常的好
評分買迴來先收藏著,有空再看
評分不錯看網上推薦買的這本書
評分這本書非常適閤文科生看,很有意思
評分很好的東西,正是我想要的。
評分jd圖書價格實惠,快遞給力,開捲有益!
統計學的世界(第8版) [Statistics: Concepts and Controversies 8th Edition] mobi epub pdf txt 電子書 格式下載 2024