科研达人 | 虐我千百遍的统计学,我还是那么爱你

来源:SOHU  责任编辑:小易  

原标题:科研达人 | 虐我千百遍的统计学,我还是那么爱你

读者 反馈

近一周,小编收到十几位研一同学的反馈,迫切地想了解多因素分析,估计是已经着手开始科研了。

什么是多因素分析

多因素分析为统计方法的一种,包含了许多的方法,最基本的为单变量,再延伸出来的多变量分析。统计资料中有多个变量(或称因素、指标)同时存在时的统计分析,是统计学的重要分支,是单变量统计的发展。

常见的多因素分析方法

当有多个处理因素时,且分析的观察指标是正态分布时,要分析各种因素对结果是否有影响、影响的程度以及处理因素之间是否有交互作用应采用析因设计分析。

当各处理组间的某些影响因素不均衡时,应采用协方差分析,以更好地评价各种处理的效应。

当研究多个因素对一个因变量的影响并建立回归方程进行预测时,应针对因变量的性质来决定。如计量资料且服从正态分布可用多重线性回归分析;是分类变量则应采用logistic回归分析;是时间变量(包含有终检数据)应用Cox回归分析。

多重线性回归

根据反馈数量,下面针对数量最多的多重线性回归分析模型进行介绍。

在应用多重线性回归模型之前,所需要满足的8个适用条件,简单概括如下:

(1) 自变量与因变量存在线性关系;

(2) 残差间相互独立;

(3) 残差服从正态分布;

(4) 残差具有方差齐性;

(5) 因变量为连续变量;

(6) 自变量为连续变量或分类变量;

(7) 自变量间不存在多重共线性;

(8) 样本量应为自变量的20倍以上。

对n例观察对象测定了一个因变量y与m个自变量x1x2x3…xm的数值,形式如表1。

多重线性回归模型一般表达式为:μy|x1,x2…xN1=β0+β1x1+β2x2+…+βmxm+λ

其中β0是回归方程的常数项,即截距。β0,β1,β2βm称为偏回归系数,偏回归系数βi(i=1,2,…,m)表示在其他自变量固定的条件下,xi每增加或减少一个单位时,y的平均变化量,y变化的方向由βi的符号决定。λ则是去除了m个自变量的影响后的随机误差,也称为残差。

通常情况下我们可以根据样本数据求得模型参数β0,β1,β2βm的估计值b0b1b2…bm,从而得到因变量y与多个自变量x1x2…xm的数量表达式:?=b0+b1x1+b2x2+…+bmxm

与简单回归相同,?是y的估计值或回归值,上式称为多重线性回归方程。

多重线性回归方程的建立

多重线性回归方程同样根据数学上的最小二乘法求解b1b2…bm,然后求b0,既求得系数所建立的回归方程使估计值?与观测值y之间差异的平方和∑(y-?2达到最小。

实例解释

1、表2(模型摘要表)中的复相关系数(R)表示为y与m个自变量(x1x2x3…xm)的线性相关的密切程度。确定系数(R Square)为复相关系数的平方,用以反映线性回归模型能在多大程度上解释因变量y的变异,记为R2。调整的R2(Adjusted R Square)记为R2adj表示当回归方程包含有多个自变量,当方程中增加了一个贡献极小的自变量时R2只增不减,而R2adj却会降低。剩余标准差(Std. Error of the Estimate)反映回归方程的估计精度,为实测值y与方程估计值?的平均误差。

2、多重线性回归的假设检验:对回归方程的检验用方差分析,各偏回归系数的检验用t检验。

回归方程的假设检验

本检验的目的是推断自变量和因变量间的多重线性关系是否存在,即整个回归方程是否有统计学意义。一般回归方程的假设检验采用方差分析,其步骤如下:

(1) 建立检验假设,确定检验水准

H0:β1=β2=…=βm=0

H1各偏回归系数(βi)不全为0

α=0.05

(2) 计算统计量F值:

确定P值,做出统计推断

表3(方差分析表)中F=2.656,P=0.020,回归方程成立。

3、建立的回归方程有统计学意义,即各偏回归系数不全为0,但并不代表所有自变量的总体偏回归系数都不为0,即所有自变量对因变量的贡献都有统计学意义,需要对每一个偏回归系数进行假设检验,其目的是推断每个自变量对因变量的作用是否具有统计学意义。一般用方差分析或t检验,SPSS统计软件包默认用t检验,t检验步骤如下:

(1) 建立检验假设,确定检验水准

H0:β=0

H1:βi0

α=0.05

(2) 计算统计量t值

tj=bj/sbj 一般采用统计软件包计算。

(3) 确定P值,做出统计推断

表4(回归系数表)建立的回归方程:

?=99.039-5.452x1+0.281x2-1.078x3-2.203x4-1.600x5+0.051x6

由于偏回归系数有单位,当自变量的单位改变时,偏回归系数也相应的改变,因而不能直接比较偏回归系数的大小。若比较自变量对因变量的贡献大小,应采取标准化的偏回归系数。

本例Beta依绝对值大小来看,x1贡献最大、x5贡献次之,x2贡献最小。

小编

多重线性回归自变量的选择

前面讨论的多重线性回归方程中的自变量是研究者根据专业知识和经验事先选好的。有时,所拟合的方程经假设检验不成立,或虽然方程成立了,但方程中有些变量经检验作用没有统计学意义。一般多重回归分析时,不是引入模型的变量越多越好。与y不相干的变量引入模型不但不能改善模型的预测效果,可能还会增加预测误差,降低方程的精度。因此筛选自变量拟合“较优”的模型是多重回归分析的重要任务之一。选择自变量的目的是对因变量有显著作用的自变量全部引入回归方程,对因变量无显著作用的自变量剔除回归方程。

多重线性回归方程中的自变量选择一般采用前进法、后退法和逐步回归法。

(一) 前进法(只进不出)

前进法又称向前法,从引入一个自变量(其偏回归平方和最大,Fj>Fα(1,n-m-1))开始,y对每一个自变量作直线回归,对回归平方和最大的自变量有意义(P小)则引入。在此基础上,计算其他自变量的偏回归平方和,选取偏回归平方和最大者作F检验,如此反复。自变量由少到多逐个引入,使方程外有统计学意义的变量全部引入为止。

(二) 后退法(只出不进)

后退法又称向后法,开始可将自变量xi全部引入方程中,然后逐个剔除(偏回归平方和最小,Fj<Fα(1n-m-1),当第一个无统计学意义的自变量剔除后,须重建立新的回归方程,重复上述过程,直到方程内无统计学意义的变量全部剔除为止。

(三)逐步回归法(有进有出)

逐步回归法是向前法的改进,具有向前法和向后法的优点。逐步回归的基本原理是:在可供选择的所有自变量xi中,按其对因变量的作用大小(即偏相关系数或偏回归平方和的大小),由大到小地把自变量逐个引入方程,每引入一个自变量,都要对其进行假设检验,有统计学意义时才引入。而当新的自变量进入方程后,再对方程中的所有自变量按照偏回归平方和由小到大进行假设检验,并把退化为没有统计学意义的变量剔除方程,这样如此反复进行下去,直到没有被剔除的变量在后面又可能被引入方程。

对选入和剔除自变量的F检验,可以设置不同和相同的检验水准α。一般取进入水准α=0.05,剔除水准β=0.10。α值越小,被选入的自变量的个数相对较少,反之,α值越大,被选入的自变量的个数相对较多。需要注意是:进入水准α和剔除水准β相差0.05。

小伙伴们,小编今天就介绍到这里了,想了解更多,请持续关注本公众号。

编辑、排版:黄伟

校对:李爽

审阅:刘思佳返回学路,查看更多

责任编辑:

  • 本文相关:
  • 抓时间补弱科不熬夜抓效率
  • 如何利用假期提高中考作文水平?(图)
  • 2016高考生必看:每月高考大事备忘录
  • 备考2016高考:只有1%的高三学生知道这样做
  • 新高三开学了,艺术生该如何开始各科复习?
  • 作为一个过来人写给高三党的建议
  • 高三生的学习和生活应该是这样的!
  • 166中学高考文科状元张子秋:高三生要努力、自信
  • 高考微问答81期:新高三生怎么开始复习?
  • 高三考生培养十大学习习惯 可上名校
  • 新高三复习计划 助你快速提分
  • 2016年高考复习时的六点注意事项
  • 2016年高考改革下各科目备考攻略
  • 新高三必读 成绩提升应循序渐进
  • 高三新学期刚开始 学生别急着打疲劳战
  • 教育资格教育大全EDU资格考试考试高考考试EDU教育考试教育|教育|天文|地球科学|物理|农业|生物|社会学|培训|数学|科学技术|环境学|心理学|职业教育|升学入学|化学|外语学习|医学|语文|纺织|建筑学|出国留学教育科学艺术文学地球科学化学环境科学建筑学科技留学农业培训社会学生物升学数学天文学外语物理心理学医学语文职业教育美术书法外国文学戏剧中国文学教育/科学高考菁菁校园人文学科理工学科外语学习辅助考研/考证公务员留学/出国 考试 作业作业2作业3幼儿教育幼儿读物少儿英语唐诗宋词育儿理论经验育儿知识家庭教育小升初学科竞赛其它课程小学教育初中教育中考科学学科竞赛其它课程高中教育学科竞赛其它课程职业教育中职中专职高对口职业技术培训其他成人教育成人考试电大自考专升本远程、网络教育高等教育理学工学经济学管理学文学哲学历史学法学教育学农业医学军事艺术研究生入学考试院校资料其它人文社科法律资料军事/政治广告/传媒设计/艺术教育学/心理学社会学文化/宗教哲学/历史文学研究经管营销人力资源管理财务管理生产/经营管理企业管理公共/行政管理销售/营销金融/投资经济/市场工程科技信息与通信电子/电路建筑/土木城乡/园林规划环境/食品科学电力/水利交通运输能源/化工机械/仪表冶金/矿山/地质纺织/轻工业材料科学兵器/核科学IT/计算机互联网电脑基础知识软件及应用硬件及网络自然科学数学物理化学生物学天文/地理医药卫生临床医学基础医学预防医学中医中药药学农林牧渔农学林学畜牧兽医水产渔业求职/职场简历封面/模板求职/面试职业规划自我管理与提升计划/解决方案学习计划工作计划解决方案商业计划营销/活动策划总结/汇报学习总结实习总结工作总结/汇报党团工作入党/转正申请思想汇报/心得体会党团建设工作范文制度/规范演讲/主持行政公文表格/模板合同协议书信模板表格类模板饮食游戏体育/运动音乐旅游购物娱乐时尚美容化妆影视/动漫保健养生随笔幽默滑稽语文一年级语文二年级语文三年级语文四年级语文五年级语文六年级语文数学一年级数学二年级数学三年级数学四年级数学五年级数学六年级数学英语一年级英语二年级英语三年级英语四年级英语五年级英语六年级英语一年级其它课程二年级其它课程三年级其它课程四年级其它课程五年级其它课程六年级其它课程小学作文语文初一语文初二语文初三语文数学初一数学初二数学初三数学英语初一英语初二英语初三英语政史地初一政史地初二政史地初三政史地理化生初一理化生初二理化生初三理化生初中作文语文高一语文高二语文高三语文数学高一数学高二数学高三数学英语高一英语高二英语高三英语政史地高一政史地高二政史地高三政史地理化生高一理化生高二理化生高三理化生高中作文高考外语学习英语考试英语学习日语学习法语学习韩语学习其它语言学习资格考试/认证IT认证公务员考试司法考试财会/金融考试从业资格考试交规考试其它考试教学研究教学案例/设计教学计划教学反思/汇报PPT模板商务科技简洁抽象艺术创意可爱清新节日庆典卡通动漫自然景观动物植物中国风国外设计风格动态背景图表模板其它模板PPT制作技巧图片/文字技巧动画/交互技巧音频/视频技巧其它技巧笔试社交礼仪其它其它其它其它调查/报告法律文书调解书判决书起诉状辩护词家居家电社会民生 文库教育文档幼儿教育小学教育初中教育高中教育高等教育教学研究外语学习资格考试/认证成人教育职业教育IT/计算机经管营销医药卫生自然科学农林牧渔人文社科工程科技PPT模板PPT制作技巧求职/职场计划/解决方案总结/汇报党团工作工作范文表格/模板法律文书饮食游戏体育/运动音乐旅游购物娱乐时尚美容化妆家具家电社会民生影视/动漫保健养生随笔摄影摄像幽默滑稽 小学作文初中作文高中作文话题作文考试作文单元作文作文素材儿童教育 教学设计文库22 34 56 78 910 1112 1314 15文库214综合范文 教学方法综合教案英语学习学习中心教育资讯1教育资讯1 考试 课题研究课件下载考试试卷留学类日记语文教学资源托福知道 教育论文教育生活学习方法模拟考教育教育资讯1英语作文 日常工作资源公务员考试简笔画考试作文问答 资讯综合学习学习考试学习方法学习问答外语学习资格考试职场学习交流高考清华大学复旦大学毕业季厦门大学浙江大学武汉大学作文南京大学五道口职业技术学校翻译韩语英语英文名日语英语翻译教师资格证智联招聘前程无忧语文日记数学读后感读书笔记
    免责声明 - 关于我们 - 联系我们 - 广告联系 - 友情链接 - 帮助中心 - 频道导航
    Copyright © 2018 www.xue63.com All Rights Reserved