数据可视化让你更懂数据

来源:中琛源 浏览次数: 更新时间:2020-01-13 11:11:36

  对数据这个词,相信大家一定不会陌生。现在拥有数据对我们来说,已经变得稀松平常。而如果拥有“大量数据”,似乎就可以让它变得有价值,是这样吗?


  其实不然,对于单有数据其实意义不大,但如果对数据进行分析、挖掘、洞察,把数据变成信息或者知识,甚至用它来解决问题,那么这个时候数据就有了价值。而如果想把数据处理后结果更好的传达给受众,那么这个时候数据的可视化就显得尤为重要了。


  所谓数据的可视化,简单理解就是把数据变成更容易看懂和记忆的样子。在早期,数据可视化一直被用于专业领域,比如咨询、金融等。作为专业工具,局限性比较多,形态也比较保守。


  之后进入大数据时代,各行各业的数据与日俱增,随之而来的就是像对这些数据的处理、挖掘、分析、可视化的需求就变得日渐显著。在可视化方面,最明显的变化就是表现形式和可用工具都越来越多。


  形式上,从常见的柱状图、折线图、饼图,到后来的气泡图、瀑布图、仪表图等等。工具上,从专业的数据库,财务软件,也逐渐衍生到了基于各类编程语言,建立了起的形形色色的可视化库,就连常常用的excel,近年来图示化的增强和优化也非常明显。


  这些变化其实正在给我们传达一个信号,那就是对于数据可视化的应用门槛正在越来越低,可以选择工具正在变得越来越多。


  这里和大家聊几个关于数据可视化的关键词:


  1.数据


  在考虑对数据进行可视化之前,首先要做的就是对数据本身做一个认识,因为可视化的设计依据就来源这些原始数据的一些特点。


  对每个数据来说,通常都会包含2个要素,一个是属性,另一个是值。属性是指对数据的性质描述,比如大小,性别,材料类型,地区等等。而值就是用数目表示出来的一个具体的量,比如5公里的“5”。


  通过对数据的解读和前期数据处理,我们可以得到一些数据的分布和分析维度。之后再围绕具体的可视化目标,结合设计逻辑,就可以考虑对数据采取进一步的可视化处理了。


  2.可视化设计


  在数据可视化设计中,和视觉设计一样,都要非常关注对人的视觉和注意力变化的特征。因为这将会决定我们设计出的结果能否抓住受众的注意力。人作为行为的主体,要通过视觉感知来对信息进行获取、编码并形成认知。


  在这个过程中,可视化的作用就是将数据进行可视编码,让数据映射成为人容易“看懂”的信息,通常这里要求呈现的特征是表达直观、容易理解和方便记忆。而具体的编码过程也是从数据的2个要素展开的:


  一个称之为标记,是数据属性到可视化元素到映射,在可视化的过程中就可以映射成点、线、面、体等。


  另一个是视觉通道,指的是数据的值到标记到视觉表现属性到映射,在可视化的过程中就可以映射成位置、大小、形状、色调、亮度、饱和度等等。


  不难发现,对于值的可视化,选择是非常多样的,这里需要注意,虽然选择众多,但是在可视化呈现时还是要尽量精炼,因为复杂的可视化会让看的人感到困惑。


  3.图表选择


  统计中使用的图表算是最早的数据可视化了。在不断使用演化的过程中,图表已经有了基本的套路,这些套路也符合人基本的感知和认知,所以至今都在被频繁的使用。


  我们常见的图表类型包括折线图、柱状图、饼图、散点图、雷达图等等。除了这些常用的图表还,还有一些可以供我们选择:


  数据地图:运用地图来分析和展示与位置相关的数据信息


  面积图:用来强调数量随时间变化的程度,也可以用来引起受众对总值趋势的注意


  桑基图:是一种特殊的流程图,图中延伸的分支宽度可以对应数据流量的大小


  漏斗图:适用于规范、周期长,环节多的过程分析,结合漏斗中每个条目的数据比较,可以直观的发现问题所在。


  词云:显示词出现的频率,频率高的词在视觉上会明显突出,可以快速过滤大量的文本信息,有时它还可以用来做用户画像或者用户标签。


  热力图:通过颜色高亮的形式来显示某些数据密度的含义,比如人群分布、密度、变化趋势等等。


  4.常用工具


  数据可视化常用的工具可谓名目繁多。这里仅介绍几款比较常见的大家参考:


  1、Tableau


  它不仅可以制作图表、图形,还可以绘制地图,使用者可以直接把数据拖到软件当中,其灵活性和动态性一直都被大家所认可。而且它不仅可以支持个人访问,还可以进行团队协作,让大家可以共同完成数据图表的制作。


  2、Excel


  它除了作为一种大家所熟知的一种办公软件,其实在数据处理和可视化呈现方面也是一款非常典型的常用工具。它简单、方便、覆盖面广,而且非常容易上手。我们平时就经常会用Excel制作一些表格,实际上用它来做数据可视化,也可以完全让人眼前一亮。


  3、R


  严格来说,R是一种数据分析语言。但是ggplot2让R成功在可视化工具中完成飞跃。ggplot2作为R的一个强大的作图工具包,让R ggplot2自成一派。它可以把图形要素自由组合,灵活的比较高且不拘泥于规则。如果熟悉了ggplot2的套路,那它也能成为一个非常好用的数据可视化工具。


  中琛魔方大数据表示其实数据可视化虽然只是整个数据处理转化过程中的一个环节,但也起着非常重要的作用。特别是对于可视化技术的具体应用,涵盖的内容还有很多,如果想要知道更多的话,不妨在这方面再多作一些了解吧。

上一篇:如何利用大数据技术解决线下教育机构困难
来源:中琛源
更新时间:2020-01-13 09:58:16
下一篇:大厂是如何搭建大数据平台架构
来源:中琛源
更新时间:2020-01-14 09:57:04