诚洁范文网
当前位置 首页 >心得体会 >

相关与回归分析实验报告心得体会总结(3篇)

发布时间:2023-07-18 12:00:07 来源:网友投稿

篇一:相关与回归分析实验报告心得体会总结

  

  相关与回归分析实验报告

  学

  号:

  2014106146课程论文

  题

  学

  专

  班

  目

  院

  业

  级

  统计学实验

  数学与统计学院

  金融数学

  14金融数学

  罗星蔓

  胡桂华

  教授

  学生姓名

  指导教师

  职

  称

  2016年

  6月

  21日

  相关与回归分析实验报告

  实验目的:用EXCEL进行相关分析和回归

  分析.

  .二、实验内容:

  1用EXCEL进行相关分析..2.用EXCEL进行回归分析.

  -■、实验步骤

  米用卜面的例子进行相关分析和回归分析.学

  数学分数(x)

  统计学分数

  生

  (y)80906090788790458592709083909450938212345678987108相关分析:数学分数(x)

  统计学分数(y)

  数学分数(x)

  ------10.986011统计学分数(y)

  回归分析:

  dfSS回归分

  析

  11616.699残差

  46.200689总计

  91662.9SUMMARYOUTPUT

  回归统计

  MultipleR0.986011RSquare0.972217AdjustedR0.96874Square4标准误差

  2.403141观测值

  x方差分

  析

  MS1616.6995.775086279.9438SignificanceF1.65E-0Intercept数学分数

  (x)

  12.320180.05360.8968217916.7310131.65E-52910.773207051.020418360.77322405361.02041824RESIDUALOUTPUT观测

  预测统计学分数

  值

  (y)84.0658793.0340残差

  0.934133-1034083.870554-3.034080.727775-0.343610.965922-2.677132.656385-2.0658标准残

  差

  0.412293-0.45641.708324-1.339130.321214-0.151660.426323-1.181591.172433-0.9118366.1294593.0340882.272234567890.3436193.0340852.6771390.3436184.0658PROBABILITYOUTPUT统计学分数

  百分比排

  位

  5152535(y)50708283455565758595859090929394学生成绩

  数学分数(x)ResidualPlot

  4-

  差2-?

  ?f*

  残0-

  ||

  11-202040.6080:1)

  -4数学分数(X)

  +数学分数(X)

  ■统计学分数(y)

  数

  分数学分数(x)

  LineFitPlot*统计学分数(y)5学

  计

  统

  -预测统计学分数

  (y)50数学分数(x)10NormalProbabilityPlotXVariable1代表斜率为0.896821,即数学分数每增加1分,统计学分数平均

  增加0.896821分。

  x平均值为78.7,y平均值为92.9可以得出回归方程y=0.896821x+12.32018100「

  *

  50-**

  数分学计统

  0-------------

  -------

  --------------

  -------11110,「十八,20406080100SamplePercentile结果分析

篇二:相关与回归分析实验报告心得体会总结

  

  实验报

  告

  实验名称:

  数据整理与分析

  相关分析实验报告

  实验课程:

  统计学

  数据的整理与分析

  一、实验目的:

  学会运用Excel中次数分布表、透视表、统计图以及描述性统计功能来分析

  一组有调查意义的数据;从而通过分析得出有意义的结论以及推测预计。

  二、实验原理

  :

  次数分布表的制作过程,第一步找出最大、最小值,确定全距

  R;第二步利

  用斯透奇斯规则确定组数

  m,再根据组数与组距的关系确定组距;第三步分组,根据分组标志和分组上限确定在组内数据的频数以及频率。

  数据透视表,选中当

  前数据库表中人一个单元格,单击菜单中的“数据”—“数据透视表与数据透视

  图”。直方图是在平面坐标上一横轴根据各组组距的宽度标明各组组距,一纵轴

  根据次数的高度表示各组次数绘制成的统计图。

  折线图是在直方图的基础上,用

  折线连接各个直方形顶边中点并在直方图形两侧各延伸一组,使者限于横线相

  连。

  三、实验环境:

  实验地点:实训楼计算机实验中心五楼实验室

  3试验时间:第五周周二

  实验软件:MicrosoftExcel2003四、实验内容

  1、(1)在数据源中选取所需数据,对数据进行分析。利用

  Excel对数据进

  行描述性统计分析。实验内容包括:数据分组、直方图、描述性分析、透视表、实验结果分析。

  (2)数据资料:

  数据来源

  “9-33各地区农村居民家庭平均每人主要食品消费量

  (2008年)”

  如下图所示。

  2、实验步骤

  第一步:

  在数据库中把所要研究的数据对象复制黏贴到新建的Excel工作表

  sheet1中。我要研究的是“各地区农村居民家庭平均每人主要食品消

  费量(2008年)”挑选了其中的蔬菜。

  第二步:

  对sheet2中的数据进行分组。

  (1)

  找出这

  31个数据中的最大、最小值,得到全距

  R(2)

  其次利用斯透奇斯规则确定组数

  m,再根据组数与组距的关系确定组

  距i;

  (3)

  然后分组,根据分组标志和分组上限确定在组内数据的频数以及频

  率

  (4)

  最后得到全国各地区蔬菜消费量的次数分布表。

  第三步:

  数据分析

  (1)

  在

  Excel

  表工具栏中点开“加载宏”—“分析工具库”确认(如图);

  (2)

  再次打开工具栏“数据分析”

  —

  “描述统计”确定,得到对该组数据的描述性统计数据。

  以下截图为部分实验步骤:

  图1.1图1.2图1.3图1.4图1.5图1.6图1.图1.图1.图1.1图1.11图1.12图1.13图1.14图1.15图1.16五、实验结果

  :

  这次的实验是运用Excel的统计分析功能,进行数据的搜集整理和显示

  .并进

  行统计数据的录入、分组、汇总及各种常用统计图表的绘制,让我对数据的整理有了更深层次的理解,从而在有限经验样本的基础上实现对总体或现实世界的认识。

  先讲述下本次的实验过程。首先是对斯透奇斯公式的计算,m=1+3.322lgN,从以上实验数据中可以得出,N=31,代入公式后得出m=5.95.约等于6.所以组数

  为6组;组限R=Max-Min=Max(B3:B33)=Min(B3:B33)=162.79-20.57=142.22;组距i=R/m=142.22/6=23.7,所以得出i=25.

  其次根据算出来的分组标志进行分组。

  分成(20~45),(45~70),(70~95),(95~120),(120~145),(145~170)共六个组。根据“上组限不计入的原则”,在下方将每组的最大值一次排列为“44,69,94,119,144,169”.之后依次计算出“各组频数,各组频率,向上累计次数,向上累计频率,向下累计次数,向下累

  计频率”。

  接下来是FREQUENCY函数的应用。

  它的用途是以一列垂直数组返回某个区域中数据的频率分布。所以先选中D20:D25区域,然后在菜单栏上面点击“插入”,选择“插入函数”,将或选择类别改成“统计”,选择函数“FREQUENCY”,然

  后点击确定。在Dataarray中填入B:B,在Binsarray中填入E13:E18。则各组数据则显示出来,将每一列的数据加起来,看看是否与题目总提供的个数相同,确实为31.以此类推,将各组频率,向上累计次数,向上累计频率,向下累计次数,向下累计频率均填写完整。

  再次,点击“工具-加载宏-勾选分析数据库-确定”,然后,点击“工具

  -数

  据分析”,然后在数据分析中选择“描述统计”,点确定。将

  31个原始数据,输入到工作表中的B3:B33。然后步骤如下:第1步:选择“工具”下拉菜单。第

  2步:选择“数据分析”选项。第3步:在分析工具中选择“描述统计”

  。第4步:当出现对话框时,在“输入区域”方框内键入B3:B33;在“输出选项”中选择输出区域(在此选择“新工作表”);选择“汇总统计”(该选项给出全部描述统计量);选择“确定”最后得出这31个数的平均数92.4994,中位数93.85.标准差为34.269,方差1174.354等一系列数据。

  六、实验结果分析

  (运用理论分析实验结果)

  在这一组实验数据中,蔬菜的最大产量为162.79千克,最小为20.57千克,而平均值为92.4994千克,所以用平均值分析离散趋势还是不准确的。

  他不能准确估计平均水品,也让我们判断出不同地区的实际差距还是很大的。

  这个应该与各个地区的气候地域、环境是密切相关的,比如辽宁,这是一个土地肥沃适合农产种植的地方,而且近年来辽宁省很多地方农村采用保护地生产

  (以日光温室和大中小棚生产为主)与露地蔬菜栽培相结合的技术措施,一年四季均可栽培蔬菜,并获得优质高产,增加农民收入,满足城市居民蔬菜需求。那该地区的蔬菜人均消费量当然大大提高。

  而相对于那些土地贫瘠,农业生产相对资源不足,只能以拓展畜牧业为生的地区,人均蔬菜消费量肯定很低。

  而住在牧区的人他们吃得东西主要是藏族传统食物,在牧区的帐篷里,你才有机会吃到最好的酥油,最棒的酸奶.有些地理环境艰苦地方的牧民一年内可能吃得蔬菜很有限。

  然后在这组数据中中位数是第16个数,这就说明大部分地区消费量还是比较少,这就是因为各地之间的经济水平,蔬菜的产量不同而决定。

  要增加各个地区人均蔬菜消费量的话,除了积极开发当地的经济水平,多多调节南北之间的物资,还应多依靠科学技术,增加产量。

  7结论(验证理论、新发现、体会)在本次实验过程中,首先进行的就是对统计数据的输入与分析。

  这个输入过程并不轻松,既要细心又要用心。

  不仅仅是仔细的输入一组数据就可以,还要考虑到整个数据模型的要求,合理而正确的分配和输入数据。

  因此,输入正确的数据也就成为了整个统计实验的基础。

  数据输入后就是统计数据的描述与分析,这是整个统计实验关键中的关键。对统计数据的众数,中位数,均值的描述可以让我们对其有一个初步的印象和大体的了解,在此基础上的概率分析,抽样分析,方差分析,图形描述等则更具体和深刻的向我们揭示了统计数据的内在规律性。

  在对数据进行描述和分析的过程中,Excel软件的数据处理功能得到了极大的发挥,工具栏中的工具和数据功能对数据的处理是问题解决起来是事半功倍。

  所以EXCEL是我们统计试验的基础知识。若不知

  EXCEL的运用则无法进行试验。

  这一次的统计学实验是我大学生活中不可或缺的重要经历,它对我的学习以及将来工作生活中都有很大的帮助。

  其一,我可以将自己所学的知识应用于实践

  中,理论和实际是不可分的,在实践中理论知识得到了巩固与加强,解决问题的能力也受到了锻炼得以提升;

  其次,本次实验开阔了我的视野,使我对统计在现实中的运作有所了解,也对统计也有了进一步的掌握。

  统计学广泛吸收和融合相关学科的新理论,不断开发应用新技术和新方法,深化和丰富了统计学传统领域的理论与方法,并拓展了新的领域。

  统计学是收集、处理、分析、解释数据并从数据中得出结论的科学,统计方法是适用于所有学科领域的通用数据分析方法,只要有数据的地方就会用到统计方法。通过运用统计学的数据分析,还可以方便我们日常生活中很多问题,比如

  CPI的增长,GDP的变化,可以让我们看出每年中国的变化,可以看出人们的生活水平的变化。因此学好统计学以及流利应用EXCEL进行实际操作对我们来说变

  的至关重要。

篇三:相关与回归分析实验报告心得体会总结

  

  关于SPSS回归分析与数据预处理的?得体会,句句都是肺腑之?关于SPSS学习与交流的专业论坛,?兵博客?直推荐?家去??经济论坛(现在叫做经管之家)SPSS专版。这个板块?乎覆盖了SPSS统计分析从理论到实践、从?具到?法的各类资料。特别适合SPSS初学者和使?者交流互动,传授经验。今天?兵就先为?家分享?篇论坛?友SPSS数据分析的?得体会,原作者:xddlovejiao1314,谢谢他的宝贵经验分享。关于SPSS数据预处理拿到?份数据,或者在看到国内外某个学者的?章有想法?????的数据刚好符合这个想法可以做时,在整理好数据后不要急于建模。?定要对数据做缺失值处理、异常值处理。在数据预处理的基础上再进?步建模,否则可能得到错误的结果。?得1:缺失值的处理我个?有?个看法:数据样本量?够?,在删除缺失值样本的情况下不影响估计总体情况,可考虑删除缺失值;数据样本量本?不?的情况下,可从以下两点考虑:1是采?缺失值替换,SPSS中具体操作为“转换”菜单下的“替换缺失值”功能,??有5种替换的?法。若数据样本量不?,同质性?较强,可考虑总体均值替换?法,如数据来?不同的总体(如我做农户调研不同村的数据),可考虑以?个?总体的均值作为替换(如我以?个村的均值替换缺失值)。2是根据原始问卷结合客观实际??推断估计?个缺失值的样本值,或者以?个类似家庭的值补充缺失值。?得2:异常值的处理我?概学了两门统计软件SPSS和Stata,SPSS?的时间久些,熟悉?下,Stata最近才学,不是太熟。关于这点我结合着来说。关于异常值的处理可分为两点,?是怎么判定?个值是异常值,?是怎么去处理。判定异常值的?法我个?认为常?的有两点:1是描述性统计分析,看均值、标准差和最?最?值。?般情况下,若标准差远远?于均值,可粗略判定数据存在异常值。2是通过做指标的箱图判定,箱图上加“*”的个案即为异常个案。发现了异常值,接下来说怎么处理的问题。?概有三种?法:1是正偏态分布数据取对数处理。我做农户微观实证研究,很多时候得到的数据(如收?)都有很?的异常值,数据呈正偏态分布,这种我?般是取对数处理数据。若原始数据中还有0,取对数ln(0)没意义,我就取ln(x+1)处理;2是样本量?够?删除异常值样本;3是从stata?学到的,对数据做结尾或者缩尾处理。这?的结尾处理其实就是同第?个?法,在样本量?够?的情况下删除?尾1%-5%的样本。缩尾指的是?为改变异常值??。如有?组数据,均值为50,存在?个异常值,都是500多

  删除?尾1%-5%的样本。缩尾指的是?为改变异常值??。如有?组数据,均值为50,存在?个异常值,都是500多(我这么说有点夸张,?概是这个意思),缩尾处理就是将这?个500多的数据?为改为均值+3标准差左右数据??,如改为100。总结??,我个?认为做数据变换的?式?较好,数据变换后再做图或描述性统计看数据分布情况,再剔除个别极端异常值。关于SPSS回归分析?得1:如何做好回归分析经过多次实战,以及看了N多视频,上了N多课,看了N多专业的书。我个?总结做回归的步奏如下:1对数据进?预处理,替换缺失值和处理异常值;2是将单个?变量分别与因变量做散点图和做回归,判定其趋势,并做好记录(尤其是系数正负号,要特别记录);3是?变量和因变量?起做相关系数,看各个变量相关关系强弱,为下?步检验多重共线性做准备;4是?变量多重共线性诊断。若变量存在多重共线性,可采?主成分回归,即先将存在多重共线性的变量做主成分分析合并为1个变量,然后再将合并成的新变量和其余?变量?起纳?模型做回归;5是做残差图,看残差图分布是否均匀(?般在+-3个单位之间均匀分布就?较好);6是报告相应结果。?得2:不建议采?后向步进法处理变量多重共线性记得张?彤?师说过他有个同学做过?个研究,即采?后向步进法剔除变量的?式去做回归,得到的结果犯错的?率?较?。张?师也不建议?这个?法处理多重共线性。处理多重共线性?较好的?法是做主成分回归。?得3:?未标准化的回归系数好,还是?标准化后的回归系数好我个?觉得这个问题仁者见仁智者见智,要看想表达什么。具体??,如果想表达在其它条件不变的情况下,?变量X每变化1个单位,因变量变化多少个单位,这种情况?未标准化回归系数就好;如果想?较各个?变量对因变量影响的相对??,即判断相对??,哪个变量对因变量影响更?。这时需要消除量纲的影响,看标准化后的回归系数。?得4:稳健性检验我做的是

  ?序多分类logistic回归模型。因变量分了5类,有?类个数?较多,达到300多,有1-2类个案?较少,只有30左右。专家提到了要做稳健性检验。这个?stata软件编程加?个robust即可解决问题。不知道在SPSS??怎么做。欢迎知道的朋友?起讨论下。我个?认为这是?个好问题的。不做稳健性检验模型可能受?些极端值的影响,结果不稳定。可能本来显著的变量剔除1-2个样本后就变得不显著了。所以做回归分析稳健性检验也?较重要。通知:?易云课堂《?学SPSS:数据分析12?经典案例》视频课程正在做年底回馈活动,感兴趣可以点【阅读原?】前往关注。

推荐访问:相关与回归分析实验报告心得体会总结 心得体会 回归 实验

Top