經濟學人圖表編輯現身說法:錯誤的圖表,我們已經畫了不少

2019-04-14 02:53:55

本文轉載自經濟學人資料新聞記者的部落格。圖表編輯親自現身說法,分析了經濟學人一些可以改善的圖表例子。非常好的帖子,不要錯過。文章由Google翻譯,並略作修改。



經濟學人,我們認真對待資料視覺化。每週我們都會在印刷品,網站和應用程式中釋出大約40個圖表。對於每一個,我們都盡力準確地以最能支援故事的方式視覺化數字。但有時候我們還是弄錯了。如果我們從錯誤中吸取教訓,我們將來可以做得更好 - 其他人也可以從中吸取教訓。


深入瞭解我們的檔案後,我找到了幾個有益的例子。我將針對資料視覺化的犯罪分為三類:(1)誤導,(2)混淆和(3)未能說明問題的圖表。對於每一個,我建議一個需要相似空間的改進版本 - 在繪製要以印刷方式釋出的圖表時,這是一個重要的考慮因素。

(簡短的免責宣告:大多數“原始”圖表是在我們的圖表重新設計之前釋出的。改進的圖表是為了符合我們的新規格而繪製的。資料是相同的。)



誤導性的圖表

讓我們從資料視覺化中最嚴重的犯罪開始:以誤導的方式呈現資料。我們從不故意這樣做!但它確實時不時發生。讓我們看一下我們檔案中的三個例子。

錯誤:截斷比例

有點左場


此圖表顯示了政治左翼頁面上帖子的Facebook喜歡的平均數量。這張圖表的重點是顯示Corbyn先生的職位與其他職位之間的差異。


原始圖表不僅低估了Corbyn先生喜歡的數量,還誇大了其他帖子的數量。在重新設計的版本中,我們完整地展示了Corbyn先生的酒吧。所有其他欄仍然可見。(此部落格的Avid粉絲會看到另一個這種不良做法的例子。)


另一個奇怪的是顏色的選擇。為了模仿工黨的配色方案,我們使用了三種橙色/紅**調來區分Jeremy Corbyn,其他國會議員和政黨/團體。我們不解釋這個。雖然顏色背後的邏輯對許多讀者來說可能是顯而易見的,但對於那些不太熟悉英國政治的人來說,這可能沒什麼意義。


錯誤:通過櫻桃採摘秤來強迫關係

難得的完美關聯?並不是的。


上面的圖表附有一個關於狗重量下降的故事。乍一看,似乎狗的體重和頸部大小完全相關。但這是真的嗎?只是在某種程度上。


在原始圖表中,兩個比例減少了三個單位(左邊是21到18;右邊是45到42)。按百分比計算,左邊的比例下降了14%而右邊則下降了7%。在重新設計的圖表中,我保留了雙倍尺度,但調整了它們的範圍以反映可比較的比例變化。


考慮到這個圖表的快樂主題,這個錯誤可能看起來相對較小。畢竟,圖表的資訊在兩個版本中都是相同的。但外賣很重要:如果兩個系列過於緊密相關,那麼仔細觀察一下這個尺度可能是一個好主意。


錯誤:選擇錯誤的視覺化方法

對脫歐的看法幾乎和談判一樣不穩定


我們在每日新聞應用Espresso中釋出了此投票圖表。它顯示了對歐盟公投結果的態度,以折線圖繪製。從資料來看,似乎受訪者對公投結果的看法相當不穩定 - 從一週到下一週增加和減少幾個百分點。


我們不是使用平滑曲線繪製單個民意調查來顯示趨勢,而是連線每個民意調查的實際值。發生這種情況主要是因為我們的內部圖表工具沒有繪製平滑的線條。直到最近,我們對使用更復雜的視覺化的統計軟體(如R)感到不太熟悉。今天,我們所有人都可以繪製一個類似上面重新設計的投票圖表。


此圖表中需要注意的另一件事是規模被打破的方式。原始圖表將資料擴充套件到應有的範圍。在重新設計的版本中,我在比例開始和最小資料點之間留下了更多空間。弗朗西斯·加農(Francis Gagnon)為此制定了一個很好的公式:目標是在一個不從零開始的折線圖下留出至少20%的情節區域。



令人困惑的圖表

不像誤導性圖表那樣具有犯罪性,難以閱讀的圖表表明視覺化工作做得很糟糕。

錯誤:把“思維伸展”放得太遠了

… 什麼?


“經濟學人”雜誌上,我們被鼓勵製作“引人入勝”的新聞報道。但是,有時候,我們認為這太過分了。上圖顯示了美國的商品貿易逆差和製造業就業人數。


該圖表非常難以閱讀。它有兩個主要問題。首先,一個數據系列(貿易逆差)的價值完全是負數,而其他資料(製造業就業)都是正數。將這些差異結合在一個圖表中而不平坦化任一資料系列是具有挑戰性的。對此的明顯“解決方案”導致第二個問題:兩個資料系列不共享共同基線。貿易赤字的基線位於圖表的頂部(通過圖表主體的一半繪製的紅線突出顯示)。正確比例的基線位於底部。


重新設計的圖表顯示沒有必要組合這兩個資料系列。貿易逆差與製造業就業之間的關係仍然很明顯,只需要很少的額外空間。


錯誤:混淆使用顏色

50藍色陰影


該圖表將政府在養老金福利方面的支出與選定國家的65歲以上人口比例進行了比較,特別關注巴西。為了使圖表保持較小,視覺化工具僅標記了一系列國家/地區,並以電藍色突出顯示。經合組織的平均值以淡藍色突出顯示。


視覺化者(我!)忽略了這樣一個事實,即顏色的變化通常意味著一種明顯的變化。乍一看,這個圖表似乎也是如此 - 所有電藍色似乎屬於與深藍色不同的組合。不是這種情況。他們唯一的共同點就是選擇了標籤。


在重新設計的版本中,所有國家/地區的圓圈顏色保持不變。我已經改變那些沒有標記的不透明度,使其他人脫穎而出。排版完成剩下的工作:巴西是重點國家,用粗體字寫成,經合組織用斜體字表示。



隱藏他們觀點的圖表

最後一類的錯誤不太明顯。像這樣的圖表不會產生誤導,也不會讓人感到困惑。他們只是沒有證明他們存在的合理性 - 通常是因為他們的形象不正確,或者因為我們試圖在太小的空間裡塞滿太多。


錯誤:包含太多細節

“顏色越多越好!” - 沒有好的資料視覺化器


真是個彩虹!我們在德國預算盈餘的專欄中公佈了這張圖表。它顯示了10個歐元區國家的預算餘額和經常賬戶餘額。有這麼多顏色 - 其中一些很難區分甚至看不到,因為價值太小 - 圖表的資訊是不可能的。它幾乎誘惑你上釉並繼續前進。而且,更重要的是,由於我們沒有繪製所有歐元區國家,因此堆疊資料沒有任何意義。


我重溫了這個故事,看看有沒有辦法簡化這個圖表。該專欄提到德國,希臘,荷蘭,西班牙和歐元區總數。在重新設計的圖表版本中,我決定只強調這些。為了解決僅堆疊一些國家的問題,我添加了另一個類別(“其他”),其中包括所有其他歐元區國家。(重新設計的圖表中的經常賬戶餘額總額低於原始圖表。這是因為歐盟統計局的資料修訂。)


錯誤:大量資料,空間不足

我放棄。


受到頁面上有限空間的限制,我們經常試圖將所有資料強制插入到太小的插槽中。雖然這可以節省頁面上的寶貴空間,但它會產生影響 - 如圖表所示,從2017年3月開始。故事是關於科學出版如何由男性主導。所有資料點都同樣有趣且與故事相關。但是,通過提供如此多的資料 - 四個研究領域類別以及發明人的份額 - 這些資訊很難被接受。


經過深思熟慮之後,我決定不重新設計這個圖表。如果我要保留所有資料,那麼圖表就會變得太大而不能用簡潔的故事。在這種情況下,削減一些東西會更好。或者,我們可以展示某種平均衡量標準,例如所有領域的女性出版物的平均份額。(如果您對如何在狹小空間內想象這一點有任何想法,請告訴我!我很想聽聽您的想法。)



資料視覺化的最佳實踐正在快速發展:今天可以接受的事情可能會在明天不受歡迎。新的和更好的技術一直在湧現。您是否犯過可以輕鬆修復的圖表犯罪?讓我們知道!


Sarah Leo是The Economist的視覺資料記者

感謝 Alex Selby-Boothroyd。





熱點新聞