随着DT时代的到来,传统的统计图表很难直观地显示复杂的数据。近年来,数据可视化作为一个新的研究领域越来越受欢迎。成功的可视化,如果做得漂亮,表面上简单,但内涵丰富,使观察者一眼就能洞察事实,产生新的理解。可视化和视觉效果是等价的,是指所有结构化的信息表达,包括图形、图表、示意图、地图、故事情节和非正式的结构化插图。
基本的可视化方法,如条形图、折线图、饼图、雷达图等,可以通过各种软件轻松生成。这些方法对于常见的可视化问题来说是很好的、强有力的解决方案。但这些方法的最佳使用方式仅限于某些特定的数据类型,它们的标准性和普适性意味着基本无法达到新颖性。如果将地理空之间的数据、社会网络关系、多维数据可视化,需要显示特定的图表类型,直观地传达数据所期望的信息。
让我们看看几个经典的可视化,观察它们如何充分利用它们的源数据结构。
01
“美国大选”的数据可视化
美国大选期间,美国媒体做了大量相关数据报道。让我们回顾一下他们是如何可视化美国大选的数据的。
下图显示了各大洲“选举人票”的比例。作者设计了两种表达方式,一种是以“选举人票”的分布为底图,另一种是直接以美国地图为底图。除了在此图上方对比双方的总选举人票之外,在各大洲上移动鼠标可以显示各大洲的“选举人票”数量以及对希拉里和特朗普的支持率。
关于第三方选民的影响
特朗普的粉丝大多来自公立学校,希拉里的粉丝大多是精英。
希拉里的粉丝大多“书卷气”,用的都是和书有关的词汇,很多都是认证的教授或者医生;特朗普粉丝更喜欢流行文化。他们可能是流行歌手的粉丝,更关注球类运动。
02
社会关系可视化
社会网络分析是一种基于传统图论和网络理论的社会网络数据分析方法。随着人类进入移动互联网时代,社交网络数据已经成为重要的数据资源。SNA的本质是利用样本之间的关系来分析整个样本的社群现象,分析样本点在社群形成中的作用以及社群之间的关系。
近年来,手机网络游戏越来越重视游戏用户的社交设计。这款游戏的玩法设计强调了很强的社会性:用户可以在游戏中组建家庭,家庭成员有不同的工作级别,用户也可以在游戏中给朋友提供道具。我们从数据库中收集了一些用户的家庭数据和朋友的交流数据。其中节点数据集包括标识、标签、组和级别信息;链接数据集包括源、目标和权重信息。
从网络图中可以看出,不同家庭的成员基本上联系紧密,通过一些关键成员与其他家庭成员联系在一起。例如,我们发现右下角的社区成员通过用户1和用户12与大型网络图中的其他社区成员联系。
我们还可以使用Gephi软件快速绘制社交网络地图,并对其进行美化。
03
地理信息可视化
在第一个例子中,我们看到了地理信息可视化的魅力。接下来,我们简单了解如何使用Remap包快速绘制交互式地图数据可视化。目前托管在https://github.com/lchiffon/REmap.的Github
百度迁移图是近年来非常流行的地理信息可视化,可以通过连接动态查看人口流动情况。在这里,我们将绘制一个动态飞行地图的地理信息可视化地图,并检查动态效果。
也可以使用Remap快速实现未来天气预报。
您还可以在地图上直观地显示在不同地方举行的一些会议活动。下图是2015年在各个城市举办的中国R语言大会的视觉展示。
城市热图也是近年来非常流行的地理信息可视化方式,通过颜色的深度来表示不同区域的实际数值。
通过上面的小例子,相信大家都惊叹过上面的可视化效果,给人一种爽朗的感觉。以上可视化没有应用非常先进的技术。如果你也掌握了下面的可视化知识,也可以画出上面图表的效果。接下来我会介绍几种常用的交互数据可视化方法:D3、echart、R。
D3
D3是最流行的可视化库之一,被许多其他表单插件使用。它允许将任意数据绑定到DOM,然后将数据驱动的转换应用到Document。你可以用它来创建带有数组的基本HTML表,或者用它过度的流畅和交互来创建带有相似数据的惊人的SVG条形图。
比如D3可以很容易的画出交互的桑基图。三基图,即三基能量分布图,也叫三基能量平衡图。这是一种特定类型的流程图。图表中扩展分支的宽度对应于数据流的大小,通常用于对能源、材料成分、财务等数据进行可视化分析。三七图最明显的特点是始端和末端的分支宽度之和相等,即所有主分支宽度之和应等于所有分支宽度之和,以保持能量平衡。
您可以通过D3直观地探索阳光墙分区。通过分析从分布点获取的用户行为路径数据,可以最简单直接的方式对每个用户的事件路径的点击流数据进行统计,并用数据可视化的方法直观的呈现出来。D3.js是目前最流行的数据可视化库之一,我们可以用Sunburst Partition来描述用户组的事件路径点击状态。从图中心开始,一层一层往外推,代表用户从开始使用产品到离开的整个行为统计;Sunburst事件路径图可以快速定位用户的主流使用路径。通过提取特定人群或特定模块之间的路径数据,并用Sunburst事件路径图进行分析,可以定位更深层次的问题。在路径分析中灵活运用Sunburst路径统计是我们的法宝。
电子艺界
ECharts,缩写自Enterprise Charts,是一个纯Java的图表库,可以在PC和移动设备上流畅运行,兼容当前大多数浏览器。).底层依托轻量级Canvas类库ZRender,提供直观、生动、互动、高度个性化的拖放重算、数据查看、范围漫游等创新功能,极大提升用户体验,赋予用户挖掘和整合数据的能力。
ECharts 3还增加了更多的图表类型,以更好地满足不同数据的处理需求,更多的匹配方案使您的数据呈现更加个性化和完善。
例如,地图信息可视化:
用ECharts画桑吉地图。
r
r语言是一种开源的数据分析解决方案,几乎可以独立完成数据处理、数据可视化、数据建模和模型评估,并可以与其他工具完美配合进行数据交互。R语言具有顶级的绘图功能,不仅可以用lattcie包和ggplot2包可视化复杂数据,还可以用rCharts包、recharts包和plotly包实现数据交互可视化,甚至可以用强大闪亮的包实现R和web的集成部署,构建web APPlication,帮助不懂CSS和HTML的用户快速用R构建自己的数据分析app..
比如我们可以画出动态互动的泡泡图,通过播放下面的时间线动态查看不同年份的泡泡情况。
还可以使用networkD3包调用D3.js库绘制社交网络图和三七图。
我们已经知道几种常用的数据可视化技术。接下来,让我们学习创建有效可视化的步骤。我们通常遵循以下关键步骤:
你有什么数据?数据有哪些分类?关于数据你想了解什么?应该使用哪种可视化方式?能够进行可视化的工具有哪些?透过可视化你看见了什么,有什么意义?最后,复杂的高维数据不能用单一的静态图表直观地显示,因此需要使用可视化手段使数据移动,更好地发现数据的价值。例如,如果有不同的数据组,当我们想要查看组之间的数据和总计时,我们可以以交互探索的形式显示它们。
也可以结合自己的数据分析和可视化技术搭建数据可视化平台,实现智能BI的可视化功能。比如我们不需要有开发能力,使用R工具的闪亮包就可以快速搭建数据可视化原型。下面的例子是一个将闪亮包和可视化技术相结合实现的可视化平台。
案例中Python数据的可视化
1.《数据可视化之美 数据可视化之美:经典案例与实践解析》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《数据可视化之美 数据可视化之美:经典案例与实践解析》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/caijing/1803498.html