数据可视化过程中常见的错误类型

数据人生 2021-09-06

数据可视化大数据饼图

2366 字丨阅读本文需 5 分钟

  数据可视化是一个沟通复杂信息的强大武器。通过可视化信息,我们的大脑能够更好地抓取和保存有效信息,增加信息的印象。但如果数据可视化做的较弱,反而会带来负面效果。错误的表达会损害数据的传播,完全曲解他们。

  所以优秀的数据可视化依赖优异的设计,并非仅仅选择正确的图表模板那么简单。全在于以一种更加有助于理解和引导的方式去表达信息,尽可能减轻用户获取信息的成本。当然并非所有的图表制作者都精于此道。所以,数据可视化的第一印象是十分重要的,为了防止这种情况发生,下面将讲解8个数据可视化过程中常见的错误类型。

  1、数据过载问题

  可视化内容过于拥挤,数据过多,很多不必要的内容可能会让数据更加难以理解。例如,三维图表虽然看起来令人印象深刻,但它们往往会使数据的解释更加困难。

  超过5个数据内容的组件,确实能够展现出大量信息,但如果读者们无法区分哪些是有用的、哪些是无用的,展现再多的信息也是毫无价值。一些不必要的插图、文字等等也会使得数据可视化冗杂。对于数据可视化来说,大多数情况下,少即是多。

  2、访问轴数值设置不当

  在处理定量数据时,条形图或折线图是两种最佳的可视化方法。但是,很多数据分析爱好者都会出现一个与图表轴相关的错误:对于较大的Y轴值来说,如果初始值设定到大于零,那么很可能会截断某些条形值,影响数值的准确性。

  3、数值比例不清晰

  饼图是一种非常流行且受欢迎的数据表现形式,然而却一直饱受非议。

  原因在于,如果不在图表中加入图形文本,那么实际上很难区分饼状图每一段的大小(你能看出类别1数据78和类别2数据80的区别吗的差异吗?),所以,想要确保图表清晰明了,所有区域都要添加标签。另外,使用饼图时,还要注意类别数量,细分太多也可能导致无法区分每个区域。

  4、混乱的交叉线

  位于特定范围内的数据通常用于展示随时间的变化。因此,折线图是传达数据之间的变化或差异的有效方式。您可能已经开始注意到这里的趋势,但重要的是不要在图表中使用太多的线。在图表上有大量的交换线会很快变得混乱,因此我们建议不要使用超过4个系列。

  重要的是,用户不应一味专注于设计美学,却牺牲数据的呈现精确度。用户可以使用不同类型的可视化形式(例如地图、直方图或图表)来相互补充,从而提供更全面的新闻讲述和更多基于数据的新闻。尤其是在人们身处不确定的时期时,可靠的事实和信息至关重要。

  5、引人误会的色彩对比

  色彩是最具说服力的设计元素之一。即使是细微的色调变化也会引起强烈的情绪反应。在数据可视化中,强颜色对比度可能会让观众认为价值差距比实际情况更大。

  在没有附加背景的情况下,这张热力图的高对比度配色方案使其看起来好像红色区域比较暗区域代表更高的数值量级。

  例如,热力图用颜色描述值的大小。较高的值显示为橙色和红色,而较低的值显示为蓝色和绿色。值之间的差异可能很小,但颜色对比会产生热感和增强的差距感。

  尽管如此,数据可视化工具可能会故意犯下一些常见错误,制图人也可能会犯下一些错误。例如,这些内容可以用于服务政治议程或操纵某个故事情节,并且完全误导读者。

  6、2.3D图形使用不当

  3D图形在数据可视化方面带来了两个严重的问题。

  当一个3D图形部分阻挡了另一个图形时,就会发生遮挡。这是在自然世界中模拟空间的结果,在自然世界中,对象的X,Y和Z坐标不同。在数据可视化中,遮挡会遮盖重要数据并创建错误的层次结构,其中无遮挡的图形显得尤为重要。

  当3D图形通过缩短缩入图片平面或从图片平面伸出时,就会发生失真。在绘图中,节距使对象看起来好像它们占据了三维空间,但是在数据可视化中,它创建了更多错误的层次结构。前景图形看起来较大,背景图形较小,并且数据序列之间的关系被不必要地扭曲了。

  7、省略基线和截断量表

  数据变化有时很大,例如根据地理区域衡量收入水平或投票习惯时。为了使可视化效果更加生动或美观,设计人员可以选择操纵图形上的比例值。

  一个常见的示例是省略基线或在零以上的某个地方开始Y轴,以使数据差异更加明显。

  8、选择错误的可视化方法

  每种数据可视化方法都有其自己的用例。例如,饼图用于比较整体的不同部分。它们适用于预算明细和调查结果(同一个饼图),但并不是要在不同的数据集(不同的饼图)之间进行比较。

  饼形图可用于可视化三个竞争企业的收益,但条形图可使两个企业之间的差异(或相似性)更加明显。如果可视化旨在显示一段时间内的收入,则折线图将比条形图更好。

  饼图用于比较整体的各个部分。使用它们比较不同的数据集(例如不同公司的收入),不会给观看者带来什么洞察力

  我们要如何避免这些在数据可视化过程中容易犯的错误?

  不要忽略图轴

  忽略图形的基线是一个常见错误。折线图和条形图轴应从零开始;否则,该图形可能会引起混乱。

  尽管数据在统计上可能是准确的,但其描绘方式传达了对数字的不准确理解。该图发布后也没有引用数据源。

  避免偏见

  记者不应选择数据来讲述他们想讲的新闻。而是,用数据去驱动新闻。允许偏差影响数据可视化是一个危险的错误,数据偏差可能会影响正在传达的信息。例如,如果您要处理的数字在图表上显示出递增的曲线,那么新闻故事应该要符合这一趋势。

  选择合适的图表

  要使用适合您要报告的数据的图表。例如,饼图可以将数据显示为占总数的百分比;地图则可以最好地说明地理情况。折线图本来是更合适的选择。

  遵守常规

  可视化数据时,记者不应破坏公认的规范。例如,与浅色相比,读者通常希望深色能反映图表上的最高密度或最大值。如果颠覆性规范可能会误导读者。

  有些颜色与观众有着直接的精神联系。例如,红色可以表示危险,而绿色可以传达更多积极信息。

  也要注意符号使用,因为它们每个都有自己的意义。例如,不要在正面新闻上使用悲伤的表情表情符号。

  去除不必要的视觉元素

  记着在可视化中应避免添加不必要的元素。如果您的图形或图表元素无法帮助传达信息,那么它只会使混乱甚至误导。

  数据可视化过程中常见的错误类型.中琛魔方大数据平台表示可视化工具可以准确有效地传达您正在讲述的新闻。必须花费必要的时间来收集数据,分析数据并确定其中的故事。可视化数字可以增强您的报告,并更全面地将信息传达给读者。

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:数据人生
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...