如果一张图片价值一千个单词,那么数据可视化至少价值一百万。
数据分析师和科学家交流其发现的最有影响力的方法之一是通过越来越流行的数据可视化媒体。整个网站,播客和Twitter提要致力于共享这些丰富的,身临其境的数据驱动的体验。信息图表不是:数据可视化处理复杂的数据池,以可视方式显示数据的模式,趋势和相关性。
为了激发您自己处理数据的灵感,请查看这15个让您惊叹的数据可视化效果。综上所述,本综述概述了数据分析从流行文化到公共物品的用途范围。正如从事数据分析工作11年的高级网络技术经理Erik Berger所说:“找到数据的公共资源比以往任何时候都多。从投票模式到天气数据,一切都可以解释。随着社交媒体的兴起,您甚至可以做一些事情,例如将Twitter和股票市场的情绪进行比较以做出预测。甚至专业运动队也正在聘请数据分析师来帮助他们获胜。”
最好的数据可视化是讲故事的工具,可以激发讨论并引起行动号召。考虑一下被扔掉的手套。看看您是否可以做得更好。
1. 每个绕地球轨道运行的卫星

这张交互式图表是使用相关科学家联盟的数据库构建的,显示了您在阅读本文时围绕地球运行的1,300颗活动卫星的轨迹。每个卫星都由一个圆形图标表示,并按国家/地区进行颜色编码,并根据发射质量确定大小。滚动浏览可视化文件,以单独和汇总的方式探索每颗卫星的路径。您还将学习哪种卫星可以提供宽带Internet,GPS和Sirius XM。
2. 辛普森悖论

通过 VUDlab 截屏
加利福尼亚大学伯克利分校的可视化城市数据Idealab(VUDlab)将这种视觉外观汇总在一起,从而证明了该数据在1973年的诉讼中反驳了该要求,该诉讼指控该学校具有性别歧视。尽管研究生院接受了44%的男性申请者,但仅接受了35%的女性申请者,但研究人员后来发现,如果对数据进行适当汇总,实际上存在偏小但统计学上显着的偏爱女性的偏见。这就是所谓的辛普森悖论。数据可视化中的交互式图形使您可以组合和分离数据的不同部分,以查看1973年到底发生了什么。
3. 查尔斯·米纳德(Charles Minard)对拿破仑1812年3月的形象化

图片来自 Edward Tufte
这张经典的石版画可以追溯到1869年,展示了拿破仑1812年俄罗斯*队军**中的士兵人数,他们的动作以及沿途遇到的温度。它被称为 “有史以来最好的统计图”之一。这项工作很重要地提醒我们,数据可视化的基础在于对数据的许多维度的细微差别的理解。如果不牢牢掌握数据集和敏锐的沟通技巧,D3.js和HTML之类的工具就不好了。
4. 汉斯·罗斯林(Hans Rosling)的200个国家,200年,4分钟

通过 YouTube / BBC 截屏
全球健康数据专家汉斯·罗斯林(Hans Rosling)著名的统计纪录片《统计的喜悦》(The Joy of Stats)于2010年在英国广播公司(BBC)播出,但它仍在转头。尤其是其中一个细分领域令人叹为观止。在“ 200个国家,200年,4分钟”中,Rosling使用增强现实技术在短短四分钟内使用120,000个数字在200年中探索了200个国家的公共卫生数据。他的工作绘制了1810年以来每个国家的预期寿命与收入的对比,指出西方国家与非西方国家之间的差距正在缩小。在此处查看完整的视频剪辑。
5. 租赁与购买

通过NYTimes 截屏
纽约时报图形部门编辑兼D3.js的发明者Mike Bostock 构建了一个复杂的交互式数据计算器,该计算器为潜在的购房者提供了成本/收益分析。博斯托克与他的同事Shan Charter和谢建华(Arche Tse)一起,涉足从房价和抵押*款贷**利息税减免到物业税率和通货膨胀的所有方面,以帮助您确定是租房还是买房。
6. 音乐时间表

通过Google 截屏
Google的音乐时间表显示了从2010年至今的各种音乐流派,其变化情况是根据有多少Google Play音乐用户的音乐库中有艺术家或专辑,以及其他数据(例如专辑发行日期)来确定的。图上的每个条纹代表一种类型,从雷鬼或布鲁斯到民间和灵魂。每个条纹的厚度与该类型的特定年份中发行的音乐的流行程度相关。所有条纹都是可单击的,因此您可以更深入地研究任何流派以探索子流派。
7. 2014年国情咨文,按分钟在Twitter上进行

通过 GitHub / Twitter 截屏
Twitter的数据源提供了一个丰富而强大的资源池,数据分析人员和科学家可以从中收集资源来分析对当前事件的实时反应。举一个例子,Twitter的数据团队组建了一个令人印象深刻的交互式数据中心,该数据中心描述了全球Twitter用户对奥巴马总统2014年国情咨文的每一段的反应。您可以按主题主题标签(例如,#budget,#defense或#education)和状态对数据进行切片和切块。相当强大。
8. 纽约市街头树木

通过 Cloudred 截屏
使用来自NYC Open Data的数据,这种交互式可视化显示了纽约五个行政区种植的街道树木的种类和数量。物种用区号进行颜色编码和交叉引用。该项目发现了一些令人惊讶的发现,例如皇后区的树木几乎是布鲁克林的两倍(布鲁克林附近的树木生长)。
9. 千禧一代的多样性

通过CNNMoney 截屏
CNNMoney的交互式图表使用美国人口普查数据建立了显示婴儿潮一代与千禧一代相比的规模和多样性。它把枯燥的数字变成了一个有趣的故事,说明了1913年至今的各个年龄段的种族构成。将鼠标移到图表上可以浏览每年的统计数据。
10. 金发姑娘系外行星

通过国家地理截屏
你相信地球外的生活吗?在查看了《国家地理》数据可视化之后,您可能会发现该数据可视化,从而计算出太阳系中及以外的哪些行星具有恰如其分的条件(因此有Goldilocks参考资料)来维持生命。利用波多黎各大学行星可居住性实验室的数据,交互式图表绘制了行星质量,大气压力和温度,以确定哪些系外行星可能是某个生物的家园,或者曾经在某一点归宿。
11. 华盛顿奇才队的流星
通过 华盛顿邮报截屏
这种详细的数据可视化演示了DC篮球队在2013赛季期间的投篮成功。通过使用NBA发布的统计信息,可视化功能可让您检查15位球员中每位球员的数据。与联盟中的其他人相比,看看每个人在球场上各种位置的各种投篮方式下的成功程度。
12. 美国的移民方式

通过 NYTimes 截屏
您是否仍生活在出生地?在纽约时报的数据团队从1900年制定了美国人的移动模式存在,结果是迷人的玩弄。您可以看到每个州的人出生的地方,以及人们从其他州迁居到哪个州。从美国人口普查中提取的功能区按区域进行颜色编码,并清晰显示随时间推移的迁移模式。
13.自拍照之城

通过Selfie City 截屏
在牛津字典今年2013字是‘自拍照’,并有很好的理由:在英语单词的使用增加了17,000%,2012年至2013年独自一人。现在,术语和概念已成为现代话语中不可或缺的一部分,从数据的角度研究现象是很有趣的。自拍照城市,是对来自全球五个主要城市的3200个自拍照的详细多组件可视化探索,可让您仔细查看自拍照的人口统计和趋势。该项目背后的团队使用Instagram和Mechanical Turk收集并过滤了数据。探索自拍自拍(例如纽约和柏林)之间以及世界各地的男女之间的差异。
14. 美国工作日

通过NPR 截屏
是否想看看您的平均工作日与其他人的工作日相比如何增加?NPR利用“ 美国时间使用调查”数据来确定在任何给定时间工作的各行各业的工人比例。图表将传统的9 AM-5 PM标准覆盖在图形上作为参考点,可帮助您得出有趣的结论。
15. 全球碳排放

通过卫报截屏
该数据可视化基于世界资源研究所的气候分析指标工具和政府间气候变化专门委员会的数据,显示了过去150年来全国CO2排放量的变化方式以及未来的前景。在不同的情况下按国家/地区探索排放。
知识就是力量,但是为了使您对数据的了解真正强大,您必须能够以连贯,令人信服的方式展示您的发现。这就是数据可视化发挥作用的地方。可用的数据比以往任何时候都多,您将有很多机会来探索如何有效地传达数据背后的想法。