1.相关系数公式
1、标准差公式:D(X)=E(X2)-E2(X);协方差公式:COV(X,Y)=E([X-E(X)][Y-E(Y)]);相关系数公式:协方差/[根号D(X)*根号D(Y)]。
2、相关系数是最早由统计学家卡尔·皮尔逊设计的统计指标,是研究变量之间线性相关程度的量,一般用字母r表示。由于研究对象的不同,相关系数有多种定义方式,较为常用的是皮尔逊相关系数。
3、相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的程度。相关系数是用以反映变量之间相关关系密切程度的统计指标。相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数。
4、需要说明的是,皮尔逊相关系数并不是唯一的相关系数,但是最常见的相关系数,以下解释都是针对皮尔逊相关系数。
5、依据相关现象之间的不同特征,其统计指标的名称有所不同。如将反映两变量间线性相关关系的统计指标称为相关系数(相关系数的平方称为判定系数);将反映两变量间曲线相关关系的统计指标称为非线性相关系数、非线性判定系数;将反映多元线性相关关系的统计指标称为复相关系数、复判定系数等。
2.相关系数越大
1、相关系数越大,说明两个变量之间的关系就越强。当相关系数为1时,两个变量其实就是一次函数关系。
2、相关系数介于0与1之间,用以反映变量之间相关关系密切程度的统计指标。相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数。
3、相关系数是最早由统计学家卡尔·皮尔逊设计的统计指标,是研究变量之间线性相关程度的量,一般用字母r表示。由于研究对象的不同,相关系数有多种定义方式,较为常用的是皮尔逊相关系数。
3.线性相关系数r公式
线性相关系数r公式:-1
4.回归系数和相关系数的关系
回归系数大于零,则相关系数大于零。回归系数小于零,则相关系数小于零。相关系数是研究变量之间线性相关程度的量。回归系数在回归方程中表示自变量x对因变量y影响大小的参数。
相关系数与回归系数的方向,即符号相同。回归系数与相关系数的正负号都有两变量离均差积之和的符号业决定,所以同一资料的b与其r的符号相同。回归系数有单位,形式为(应变量单位/自变量单位)相关系数没有单位。相关系数的范围在-1~+1之间,而回归系数没有这种限制。