【技术】选择正确的数据可视化方式之散点图

作者:admin时间:2019-09-11 10:01:01

1

小编之前给大家介绍了,和弦图、密度图、热点图,今天我们就来介绍下很常见的一种图表——散点图。如想看之前的几种,可从文末往期文章链接查看。

散 点 图

散点图(Scatter Plot)在直角坐标系显示数据的两个变量(X和Y轴)之间的关系,数据显示为点的集合,适合用于在不考虑时间的情况下比较大量的数据点。散点图通常用来识别两个变量之间的相关性或用来观察他们的关系,从而发现某种趋势,对于查找异常值或理解数据分布也很有效。

散点图会显示不同类型的相关性,相关性即变量之间的关系。通常有正相关、负相关、不相关三种相关性。

正相关:数据点从低x、y值的点到高x、y值,一个变量增加,另一个变量增加。

负相关:数据点从高x、y值的点到低x、y值,一个变量增加,另一个变量减少。

不相关:数据没有明显的方向性,一个变量变化对另一个没有影响。

应 用 案 例

2

某公共工程部门人员注意到总水管漏水的情况有所增加,员工怀疑泄露的量直接受到管道长度的影响。但是在一部分水管区域中,这两者的相关性又比较小。于是,员工们主备用一个散点图来查看下每个水管区域的总泄漏量与管道总长度的关系。假设最佳拟合线从图表的左下角到右上角,则管道的总长度与为这些管道调用的服务请求数之间存在正线性关系。因此,管道长度可能是所有泄漏的一个重要因素。

需要注意:

1.如果一个散点图没有显示变量之间的任何关系,那么或许该图表类型不是此数据的最佳选择。

2.散点图只有有足够多的数据点,并且数据之间有相关性时才能呈现很好的结果。如果一份数据只有极少的信息或者数据间没有相关性,那么绘制一个很空的散点图和不相关的散点图都是没有意义的。

注 意 事 项

1.如果一个散点图没有显示变量之间的任何关系,那么或许该图表类型不是此数据的最佳选择。

2.散点图只有有足够多的数据点,并且数据之间有相关性时才能呈现很好的结果。如果一份数据只有极少的信息或者数据间没有相关性,那么绘制一个很空的散点图和不相关的散点图都是没有意义的。

往 期 文 章

1.选择正确的数据可视化方式(开篇)

2.选择正确的可视化方式之和弦图和弦图

3.选择正确的可视化方式之热点图和密度图

 


qianmin700

发表评论

星级评分(1~5):