这里写目录标题
要求:
线性回归练习。“父亲高则儿子高,父亲矮则儿子矮”(即父亲与儿子身高相关,且为正相关)、“母高高一窝,父高高一个”(即母亲的身高比父亲的身高对子女的影响更大)的习俗传说是否成立?请在“父母子女身高”数据集(高尔顿数据集)基础上利用线性回归做出科学分析。
1)选取父子身高数据为X-Y,用Excel计算线性回归方程和相关系数、方差、p值等,判断回归方程是否成立。
现在如果有一个新家庭的数据,已知父亲身高75英寸,请测算儿子的身高为多少?
2)选取母子身高数据为X-Y,用Excel计算线性回归方程和相关系数、方差、p值等,判断回归方程是否成立。
3)根据以上数据,阐明你对习俗说法是否正确的分析。 4)你能用多元线性回归方法,计算出父亲、母亲与儿子身高的回归方程吗?
2. 线性回归方法的有效性判别。 针对“Anscombe四重奏”数据集,用excel对四组数据进行线性回归分析,判断其中哪些回归方程是成立的,哪些不成立?不成立的应该如何解决?
- 选取父子相关数据做线性回归分析得到以下结果:
通过上面的可计算得到公式y=0.241x+53.34,发现当父亲身高每增加1个单位,其儿子的身高增加0.241个单位。
相关系数R平方计算的结果为0.9086,父亲身高与儿子身高的线性相关性很强。通过方差分析的表格可以看出F>F表,说明数据存在显著差异。P值远小于0.01,说明得到的回归方程是可靠的。
由线性回归函数可知,当父亲身高为75英寸时,儿子的身高为71.415英寸。
- 选取母子数据进行分析: