分享|工具讲解 :散布图
一、散布图的定义:是一种研究成对出现的、两组相关数据之间关系的图示技术。
在散布图种,成对的数据形成点子云,研究点子云的分布状态,便可推断成对数据之间的相关程度。当x值增加,y值也相应增加,就称x 与y之间是正相关;当x值增加,y值也相应减少,就称x 与y之间是负相关;
二、常见散布图类型:
三、散布图的用途:
散布图可以用来发现两组相关数据之间的关系,并确认两组相关数据之间预期的关系;分析两组相关数据之间的关系主要是确认其相关性质,即正相关和负相关;相关程度,即强相关和弱相关。电子云的形态可以反映出相关的性质和程度;两个随机变量的关系可能有函数关系,相关关系和没有关系3种状态。其中函数关系可以看作为不相关;对散布图可以进行定性分析,也可以进行定量分析;
四、散布图分析:
散布图的分析一来般来说有6种形态.
1、在图中当X增加,Y也增加,也就是表示原因与结果有相对的正相关,如下图所示:
2、散布图点的分布较广但是有向上的倾向,这种形态叫做似有正相关称为弱正相关
3、当X增加,Y反而减少,而且形态呈现一直线发展的现象,这叫做完全负相关.如下图所示:
4、当X增加,Y减少的幅度不是很明显,这时的X 除了受Y的影响外,尚有其他因素影响X,这种形态叫作非显着性负相关,如下图所示:
5、如果散布点的分布呈现杂乱,没有任何倾向时,称为无相关,也就是说X与Y之间没有任何的关系,这时应再一次先将资料层别化之后再分析,如下图所示:
6、假设X增大,Y也随之增大,但是X增大到某一值之后,Y反而开始减少,因此产生散布图点的分布有曲线倾向的形态,称为曲线相关,如下图所示:
五、散布图做法:
1、收集成对数据(x,y):收集成对数据一般在30组以上;
2、确定坐标并标明刻度:横坐标x轴为自变量(原因或因素),纵坐标y轴为因变量(结果或特性),且两轴的长度大体相等。
3、描点,形成散布图:当两组数据相等时,即数据点重合时,可围绕数据点画同心圆表 示,或在离第一个点最近出画上第二个点表示;
4、图形分析:根据点子云的形状,确定相关关系的性质和程度。
对散布图的分析判断方法有:
①对照典型图形分析法:将绘制的散布图与6种典型图相对比,从而确定其相关关系和程度。
②简单象限法:
*在图上画一条与y轴平行的P线,使P线左、右两侧的点数相等或大致相等;
*在图上再画一条与x轴平行的Q线,使Q线上、下两侧的点数相等或大致相等;
*PQ两线把图形分成四个象限,计算各象限区域内的点数,线上的不计
*计算对角象限内的点数,即 nⅠ+nⅢ, nⅡ+nⅣ
@当nⅠ+nⅢ﹥nⅡ+nⅣ时,为正相关;
@当nⅠ+nⅢ﹤nⅡ+nⅣ时,为负相关;
@当nⅠ+nⅢ=nⅡ+nⅣ时,为不相关;
六、注意事项:
数据的性质要相同,否则会导致不真实的判断结果;
散布图的相关规律的运用范围一般局限于观测值数据的范围内,不能任意扩大相关推断范围;
散布图中出现的个别偏离分布趋势的异常点,应当查明原因予以剔除;
七、实例解析:(咱们用Excel哈~)
某酒厂要判定中间产品酒中的酸度和酒度2个变量之间有无关系,存在什么关系?(搜集到的数据如下表)
Step1:我们用Excel将搜集到的数据整理,然后插入散布图,如下图:
Step2:插入散布图如下图
Step3:为了让点更加明显清晰,我们更改X轴和Y轴的最大值和间距,便于后面数点数,见下图:
Step4:更改X轴和Y轴的最大值和间距
Step5:更改X轴和Y轴的最大值和间距
Step6:然后画出P线和Q线
Step7:数点,然后做小学1年级的加减法和对比:图形分析,可以认为酸度和酒度之间存在着弱负相关关系。
(本文来源:SQE供应商质量)
暂无评论