线性相关系数通常称为Pearson相关系数,它给出了两个变量之间线性相关大小的度量指标,该系数简单易懂,当r大于0时,说明两个变量之间存在正相关的关系,而当r小于0时,则说明二者之间为负向的线性相关,当r=0时,说明二者之间没有线性相关。
那怎样评估二者之间的线性相关的强弱呢?有人将大于0.7作为强相关,也有人认为大于0.8才算强相关,不一而论,但确实这些划分没有理论依据,很难做实践指导,因为这与不同领域的标准相关,比如,实验室检测数据,往往要求相关系数大于0.9才算好,而在社会学、流行病学调查数据中,相关系数达到0.5就算非常不错了。
然而相关系数不管再怎么大,也只是一个样本数据的统计量,要想推广到总体,则必须进行假设检验,以证明你的系数不是偶然得到的。
相关系数的检验至少有两种方式:t检验法和置信区间法。
根据置信区间可以看出r的分布是否包含0,如果不包含,即可认为相关系数不等于0,两个变量之间存在相关性, 而且根据置信区间的范围,可以有95%的信心认为该区间包含了总体的相关系数。
Ref: 《白话统计》 冯国双著
大家都在看
版权声明:本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 349073828@qq.com 举报,一经查实,本站将立刻删除。