大数据可视化过程中需避免的问题

来源:中琛源 浏览次数: 更新时间:2019-09-10 10:49:18

  可视化是一种添加和共享视图的好方法,但许多大数据的团队却以错误的方式这样做。怎么能做错了呢?事实证明,有几种方法破坏了数据的可视化。让我们来看看几个最常见的错误。


  错误1:显示错误的数据


  这个错误是同第一个错误一样危险。显示信息的子集是好的,只要数据之间是相关的。比如说,如果你关心销售,您可能还关心每个区域的销售以及销售随着时间推移所发生的变化。考虑如何使用这些数据来作出决策。


  显示一些密切相关的图表可以作为在一个图表中显示过多的信息,和并没有显示出足够信息之间的一个很好的折衷。几个干净,清晰的图表通常比单一、复杂的数据的可视化更好。


  错误2:显示所有的数据


  尽管你曾经在学校里被告知,大多数人并不关心是否能看到你的工作。他们不关心你每天处理多少数据或有多大Hadoop集群。客户和内部用户需要得到具体,相关的答案,而且得到的越早越好。你能给他们提供的答案与他们想要的越接近,他们在寻找答案时就越省力。页面上的不相干信息越多他们寻找相关答案时就越费力。不相关的数据(无论多么有效)就是噪音。


  在仪表板上的噪音尤为普遍,其中的指导理念往往是“显示所有的绩效指标。”但大部分绩效指标是正常(和乏味的),不值得一提。显示一切的正常指标使得不正常的指标更易隐藏。


  一个更好的仪表盘的方法是只显示有趣或重要的指标。优先考虑什么是重要的,什么是意想不到的,什么是可行的,并且淡化其它的一切。深入挖掘数据也很重要,但仪表盘不是展示这些东西的地方。广泛的概括非可操作的数据较报告来说会更容易处理一些。


  错误3:数据表示不佳


  即使在你以正确的数据绘图时,你仍然可能犯错误,大多数奇特的图形类型都很少见到,因为它们并不好用。大部分的可视化需求,可以通过条形图和折线图,散点图,以及(如果干得好)饼图来处理。


  想想数据字段之间的重要关系,并考虑在轴上标出这些字段。先按类别,然后按时间或重要性或大小来给数据字段排序。(在没有其他标准时,字母表是最有用的)。使用颜色类别,而不是等级;你可以使用亮度和饱和度来说明等级。使用标签和其他标记选择性地引起人们关注而不会搞乱。


  大数据可视化过程中需避免的问题.中琛魔方大数据表示在处理过程中我们可能还需要进行各种调整。调优并不是坏事,我们可以使用迭代,测试不同的实现方法,然后再迭代以找到最佳的选项。只有仔细考虑并坚持面向用户的设计,我们才能创造出更有效、更高效的数据可视化结果。

上一篇:如何统计和分析利用网络大数据?
来源:中琛源
更新时间:2019-09-10 10:40:43
下一篇:如何提升企业大数据分析应用利用率?
来源:中琛源
更新时间:2019-09-10 11:08:39