1、大学体育统计学大学体育统计学第一章第一章绪论绪论第一节第一节第一节第一节 体育统计及其研究对象体育统计及其研究对象体育统计及其研究对象体育统计及其研究对象统计的作用统计的作用客观事物的特征客观事物的特征质的特征质的特征质的特征质的特征量的特征量的特征量的特征量的特征统计活动统计活动统计活动统计活动研究统计的分类(从性质上)统计的分类(从性质上)(一)(一)描述性统计描述性统计 对事物的特征与状态进行数量描对事物的特征与状态进行数量描述述 身高身高=226cm=226cm体重体重=141kg=141kg百米速度百米速度=15s=15s投篮命中率投篮命中率=52%=52%(二)(二)推断性统计推断
2、性统计通过样本数量特征估计推断总体特征通过样本数量特征估计推断总体特征总体总体总体总体抽取随机样本抽取随机样本抽取随机样本抽取随机样本均值均值 X X=14.6=14.6秒秒抽样总体平均成绩是14.6秒吗 体育统计的概念体育统计的概念体育统计体育统计体育统计体育统计是运用数理统计的原理和方法对体育领域里各种随机现象规律性进行研究的一门基础应用学科。属于方法论学科范畴。理解:理解:理解:理解:1:用普遍的方法研究特殊领域的问题。2:无论描述统计还是推断统计,都服务于对随机现象规律性的研究。统计工作的基本过程统计工作的基本过程统计资料的搜集统计资料的搜集统计资料的搜集统计资料的搜集统计资料的整理统
3、计资料的整理统计资料的整理统计资料的整理统计资料的分析统计资料的分析统计资料的分析统计资料的分析统计资料的搜集:(基础环节)根据研究设计的要求获取有关数据资料。统计资料的整理:(中间环节)按照分析的要求对数据资料进行审核和分类。统计资料的分析:(决定性阶段)按照研究目的对整理后的数据进行统计学处理。统计工作的基本过程统计工作的基本过程体育统计的研究对象及其特征体育统计的研究对象及其特征研究对象:(1)体育领域里的各种可量化的随机现象。(2)非体育领域里对体育发展有关的各种随机现象。研研究究范范围围逐逐渐渐扩扩大大了了!体育统计研究对象的特征体育统计研究对象的特征运动性特征:反映运动能力心理能力
4、等方面的数量指标是具有 运动性特征的。(1,与运动有关;2,是动态的)综合性特征:兼有自然科学和社会科学的综合属性。客观性特征:数据来源于客观事物本身,是对客观事物的反映。第二节第二节体育统计在体育活动中的作用体育统计在体育活动中的作用是体育教育科研活动的基础是体育教育科研活动的基础有助于训练工作的科学化有助于训练工作的科学化能帮助研究者制定研究设计能帮助研究者制定研究设计能帮助研究者有效地获取文献资料能帮助研究者有效地获取文献资料总体与个体总体与个体总体与个体总体与个体1,总体的概念:根据统计研究的具体研究目的而确定的同质对象的全体。2,个体的概念:组成总体的每个基本单位。3,总体的分类:第
5、三节第三节体育统计中的若干基本概念体育统计中的若干基本概念总体总体总体总体现存总体现存总体现存总体现存总体假想总体假想总体假想总体假想总体有限总体有限总体有限总体有限总体无限总体无限总体无限总体无限总体有限总体:基本研究单位的边界是明晰的,并且基本研究单位的数量是有限的总体。无限总体:基本研究单位的数量是无限多个的总体。样本样本样本样本1,样本的概念:根据研究需要与可能,从总体中抽取的部 分研究对象所形成的子集为样本。2,样本的分类:随机样本和非随机样本样本样本样本样本随机样本随机样本随机样本随机样本非随机样本非随机样本非随机样本非随机样本采用随机抽样方法获得的样本采用随机抽样方法获得的样本采
6、用随机抽样方法获得的样本采用随机抽样方法获得的样本研究者根据研究需要,制定某些研究者根据研究需要,制定某些研究者根据研究需要,制定某些研究者根据研究需要,制定某些条件获得的带非随机性质的样本条件获得的带非随机性质的样本条件获得的带非随机性质的样本条件获得的带非随机性质的样本必然事件和随机事件必然事件和随机事件必然事件和随机事件必然事件和随机事件1 1,必然事件:在确定的条件范围内,必然发生,必然事件:在确定的条件范围内,必然发生 (或不发生)的事件。(或不发生)的事件。(具备可预言性)(具备可预言性)2 2,随机事件:在一定的实验条件下,有可能发生,也,随机事件:在一定的实验条件下,有可能发生
7、,也有可能不发生的事件。有可能不发生的事件。(具备不可预言性,只能猜)(具备不可预言性,只能猜)随机变量随机变量随机变量随机变量1 1,随机变量:随机事件的数量表现。,随机变量:随机事件的数量表现。随机变量随机变量随机变量随机变量连续型随机变量连续型随机变量连续型随机变量连续型随机变量离散型随机变量离散型随机变量离散型随机变量离散型随机变量至少理论上至少理论上可以穷举可以穷举不能穷举总体参数和样本统计量总体参数和样本统计量1 1,总体参数:反映总体数量特征的指标。,总体参数:反映总体数量特征的指标。2 2,样本统计量:反映样本数量特征的指标。,样本统计量:反映样本数量特征的指标。概率概率概率概
8、率1 1,古典概率:适用于总体明晰的情况下。,古典概率:适用于总体明晰的情况下。2 2:统计概率:适用于总体状况不明的情况下。:统计概率:适用于总体状况不明的情况下。补充内容:补充内容:连加和的缩写式连加和的缩写式 在高等数学中,采用连加求和缩写式形式来表示连加求和数,它的一般形式为:其中:连加求和号 变量(一组观测数据)在 中,i 是下标,n 是上标,i、n 表示连加求和的界限,即从通项公式具体分解的第一项开始相加一直到第n项为止。各具体项根据 i 的取值不同而有所不同,i 取1为第一项,取“n”为第n项。体育中常用的连加求和运算:为了避免符号过于复杂,今后凡在求和范围可以看清的为了避免符号
9、过于复杂,今后凡在求和范围可以看清的条件下,通常将条件下,通常将号上下标省略不写,简记为号上下标省略不写,简记为 补充内容:连加和的缩写式课堂练习:展开连加和缩写式课堂练习:展开连加和缩写式体育统计学体育统计学第二章第二章统计资料的收集与整理统计资料的收集与整理 收集资料的基本要求收集资料的基本要求 1:资料的准确性 2:资料的齐同性 3:资料的随机性 收集资料的基本方法收集资料的基本方法 1:日常积累 2:全面普查 3:专题研究第一节第一节第一节第一节 统计资料的收集统计资料的收集统计资料的收集统计资料的收集几种常用的抽样方法几种常用的抽样方法简单随机抽样(完全随机抽样)简单随机抽样(完全随
10、机抽样)抽取特点:1:不分组,不分类,不排队地抽取;2:总体中每个个体都有被抽中的机会;3:总体中每个个体被抽中的机会是均等的。抽取方法:1:抽签法 2:随机数表法(见随机数表)该方法的优点:样本代表性好该方法的缺点:总体含量大时,编号困难。工作量大。几种常用的抽样方法几种常用的抽样方法分层抽样分层抽样分层抽样分层抽样抽取步骤方法:1:按属性特征分成若干类型、部分或层;2:在类型、部分或层中按照比例进行简单随机抽样。分层的需注意的问题:1:层间必须有清晰的界面;(类间差异大,类内差异小)2:必须知道各类型中的个体数目和比例;3:层的数目不宜太多,但也不要极少。分层抽样的优点:1:能够提高样本代
11、表性,又不至于给调查工作带来麻烦,在代表性和工作量之间做出了平衡;2:适用于总体情况复杂、个体数目较多的情况。分层抽样范例分层抽样范例某大学体育系大一新生总体人数合计900人田径350人篮球200人足球150人网球100人体操80人游泳20人分层田径35人篮球20人足球15人网球10人体操8人游泳2人按照10%比例简单随机抽样研究样本含量为90人按照学生专按照学生专项属性分层项属性分层继续下一步继续下一步继续下一步继续下一步的研究过程的研究过程的研究过程的研究过程几种常用的抽样方法几种常用的抽样方法整群抽样整群抽样整群抽样整群抽样整群抽样的特点:区别于简单随机抽样和分层抽样,抽样的单位不再是总
12、体中的个体,是总体中的划分出来的群。划分群应注意的问题:群间差异要小,群内差异要大。讨论:调查广东省初中毕业生体质达标的情况。如何抽样?第二节第二节统计资料的整理统计资料的整理 资料的审核资料的审核1:初审简单排误2:逻辑检查专业知识、常识,指标关系间排误3:复核按比例抽样复核频数整理频数整理频数分布表的制作频数分布表的制作频数分布表的编制频数分布表的编制(实例)(实例)【例例例例】某某某某 小小小小学学学学 五五五五 年年年年 级级级级 学学学学生生生生 跳跳跳跳 绳绳绳绳 成成成成 绩绩绩绩如如如如下下下下(单单单单位位位位:个个个个/分分分分钟钟钟钟)。对对对对 数数数数 据据据据 进进
13、进进 行行行行分组。分组。分组。分组。11712212412913910711713012212511712212412913910711713012212510813112511712213312612211810810813112511712213312612211810811011812312613313412712311811211011812312613313412712311811211213412712311911312012312713511213412712311911312012312713513711412012812411513912812412113711412012
14、8124115139128124121分组方法分组方法单变量值分组单变量值分组1.将一个变量值作为一组2.适合于离散变量3.适合于变量值较少的情况单变量值分组表单变量值分组表表表某小学五年级学生跳绳成绩表某小学五年级学生跳绳成绩表成绩成绩(个个)频数频数(人人)成绩成绩(个个)频数频数(人人)成绩成绩(个个)频数频数(人人)1071071081081101101121121131131141141151151171171181181 12 21 12 21 11 11 13 33 31191191201201211211221221231231241241251251261261271271
15、12 21 14 44 43 32 22 23 31281281291291301301311311331331341341351351371371391392 21 11 11 12 22 21 11 12 2组距分组组距分组将变量值的一个区间作为一组适合于连续变量适合于变量值较多的情况必须遵循“不重不漏”的原则可采用等距分组,也可采用不等距分组组距分组的步骤(等距分组)组距分组的步骤(等距分组)1.1.求全距(极差)求全距(极差)R R:R R R R最大值最小值最大值最小值最大值最小值最大值最小值2.2.确确定定组组数数:组组数数的的确确定定应应以以能能够够显显示示数数据据的的分分布布特
16、特征征和和规规律律为为目目的的。在在实实际际分分组组时时,可可以以按按 Sturges Sturges 提提出出的的经经验验公公式式来来确确定定组组数数K K3.3.3.3.确确确确定定定定组组组组距距距距I I I I:组组组组距距距距(Class(Class(Class(Class Width)Width)Width)Width)是是是是一一一一个个个个组组组组的的的的上上上上限限限限与与与与下下下下限限限限之之之之差差差差,可可可可根根根根据据据据全全全全部部部部数数数数据据据据的的的的最最最最大大大大值值值值和和和和最最最最小小小小值值值值及及及及所所所所分分分分的的的的组组组组数数数
17、数来来来来确确确确定定定定,即即即即:组距组距组距组距(最大值最大值最大值最大值最小值)最小值)最小值)最小值)组数组数组数组数 (k k)4.4.4.4.确确确确定定定定组组组组限限限限 (组组组组限限限限:是是是是指指指指每每每每组组组组的的的的起起起起点点点点值值值值与与与与终终终终点值)点值)点值)点值)5.5.5.5.根据分组整理成频数分布表根据分组整理成频数分布表根据分组整理成频数分布表根据分组整理成频数分布表 填填填填写写写写组组组组限限限限 按按按按照照照照从从从从上上上上到到到到下下下下、从从从从小小小小到到到到大大大大的的的的顺顺顺顺序填写,只写下限,不写上限序填写,只写下
18、限,不写上限序填写,只写下限,不写上限序填写,只写下限,不写上限 划划划划记记记记 将将将将数数数数据据据据逐逐逐逐个个个个划划划划记记记记到到到到相相相相应应应应的的的的组组组组中中中中,五五五五个为一组个为一组个为一组个为一组 计算:频数(计算:频数(计算:频数(计算:频数(f f f f);频率;组中值);频率;组中值);频率;组中值);频率;组中值(组中值该组下限组中值该组下限组中值该组下限组中值该组下限 组距组距组距组距2 2 2 2 )组距分组涉及的几个概念组距分组涉及的几个概念1.1.下下 限:限:一个组的最小值一个组的最小值2.2.上上 限:限:一个组的最大值一个组的最大值3.
19、3.组组 距:距:上限与下限之差上限与下限之差4.4.组中值:组中值:下限与上限之间的中点值下限与上限之间的中点值课堂练习课堂练习课堂练习课堂练习11712212412913910711713012212511712212412913910711713012212510813112511712213312612211810810813112511712213312612211810811011812312613313412712311811211011812312613313412712311811211213412712311911312012312713511213412712311911
20、3120123127135137114120128124115139128124121137114120128124115139128124121【例例例例】某某某某 小小小小学学学学 五五五五 年年年年 级级级级 学学学学生生生生 跳跳跳跳 绳绳绳绳 成成成成 绩绩绩绩如如如如下下下下(单单单单位位位位:个个个个/分分分分钟钟钟钟)。对对对对 数数数数 据据据据 进进进进 行行行行分组。分组。分组。分组。1.求全距(极差)求全距(极差)R:RR最大值最大值最大值最大值(XmaxXmax)139139最小值最小值最小值最小值(XminXmin)10710732322.2.确定组数确定组数:3.
21、确定组距:确定组距:组距组距组距组距(最大值最大值最大值最大值139-139-最小值最小值最小值最小值107107)组数组数组数组数7 7551+1.70/0.306.66774.4.确定组限:确定组限:第一组下限(第一组下限(第一组下限(第一组下限(L L L L1 1 1 1)最小值()最小值()最小值()最小值(X X X Xminminminmin)组距(组距(组距(组距(I I I I)/2/2/2/2 107 107 107 107 5/2 5/2 5/2 5/2 104.5105104.5105104.5105104.5105 其他组组限的确定:其他组组限的确定:其他组组限的确定
22、:其他组组限的确定:从第一组开始,每一组的下限从第一组开始,每一组的下限从第一组开始,每一组的下限从第一组开始,每一组的下限加上组距,就得到该组的上限,此上限又是下一组加上组距,就得到该组的上限,此上限又是下一组加上组距,就得到该组的上限,此上限又是下一组加上组距,就得到该组的上限,此上限又是下一组的下限,于是就形成了一列的下限,于是就形成了一列的下限,于是就形成了一列的下限,于是就形成了一列左闭右开的半开区间左闭右开的半开区间左闭右开的半开区间左闭右开的半开区间5.5.根据分组整理成频数分布表:根据分组整理成频数分布表:根据分组整理成频数分布表:根据分组整理成频数分布表:(略,参照书(略,参
23、照书(略,参照书(略,参照书P P P P17171717-P-P-P-P18181818)需要说明的几个问题需要说明的几个问题关于组数的确定:关于组数的确定:关于组数的确定:关于组数的确定:1 1:可以依据已有的成熟的:可以依据已有的成熟的专业经验来确定;专业经验来确定;2 2:可参考前苏联专家制定:可参考前苏联专家制定的参考表(如右表)确定:的参考表(如右表)确定:关于图形的绘制:关于图形的绘制:关于图形的绘制:关于图形的绘制:可以绘制直观的图形来方可以绘制直观的图形来方便了解数据的信息。便了解数据的信息。较常使用的图形形式有多较常使用的图形形式有多边形图和直方图等。边形图和直方图等。图形
24、中,一般图形中,一般横坐标横坐标代表代表组限组限,纵坐标纵坐标代表代表频数频数。样本含量(n)分组数(k)30-605-860-1007-10100-2009-12200-50011-15作业作业1.1.每人准备一本固定的作业本。每人准备一本固定的作业本。每人准备一本固定的作业本。每人准备一本固定的作业本。2.2.教材教材教材教材P P1919第二章习题第第二章习题第第二章习题第第二章习题第4 4题,按照步骤与格式制作频数分布表及其直方图。题,按照步骤与格式制作频数分布表及其直方图。题,按照步骤与格式制作频数分布表及其直方图。题,按照步骤与格式制作频数分布表及其直方图。体育统计学体育统计学第三
25、章第三章样本特征数样本特征数第一节第一节 集中位置量数集中位置量数集中趋势集中趋势集中趋势集中趋势(位置位置位置位置)离中趋势离中趋势离中趋势离中趋势(分散程度分散程度分散程度分散程度)偏态和峰度偏态和峰度偏态和峰度偏态和峰度(形状)(形状)(形状)(形状)数据的分布特征及其测量指标数据的分布特征及其测量指标数据特征及其测量指标数据特征及其测量指标分布状况分布状况集中趋势集中趋势离散程度离散程度方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差平均差平均差平均差平均差平均差平均差峰峰峰峰峰峰度度度度度度绝对差绝对差绝对差绝对差绝对差绝对差全距全距全距全距全距全距偏偏偏偏偏
26、偏态态态态态态几何平均数几何平均数几何平均数几何平均数几何平均数几何平均数众数众数众数众数众数众数中位数中位数中位数中位数中位数中位数算术平均数算术平均数算术平均数算术平均数算术平均数算术平均数集中趋势集中趋势(Centraltendency)1.1.一组数据向其中心值靠拢的倾向和程度一组数据向其中心值靠拢的倾向和程度2.2.测度集中趋势就是寻找数据一般水平的代表值或测度集中趋势就是寻找数据一般水平的代表值或中心值中心值3.3.不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值4.4.低层次数据的集中趋势指标值适用于高层次的测低层次数据的集中趋势指标值适用于高层次的测量数
27、据,反过来,高层次数据的集中趋势指标值量数据,反过来,高层次数据的集中趋势指标值并不适用于低层次的测量数据并不适用于低层次的测量数据5.5.选用哪一个测度值来反映数据的集中趋势,要根选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定据所掌握的数据的类型来确定中位数中位数(Median)中位数,又称中数,中点数。中位数,又称中数,中点数。符号符号Md(Median)Md(Median),定义:是指位于一组数据中较大一半与定义:是指位于一组数据中较大一半与较小一半中间位置的那个数。较小一半中间位置的那个数。Md50%50%中位数中位数(Median)特征:此数可能是数据中的某一个
28、,也可能根本特征:此数可能是数据中的某一个,也可能根本不是原有的数据。不受极端值的影响不是原有的数据。不受极端值的影响计算方法:将数据依大小次序排列,若数据个数计算方法:将数据依大小次序排列,若数据个数为奇数,则取数列中间的那个数为中数;若数据为奇数,则取数列中间的那个数为中数;若数据个数为偶数,则取中间两个数的平均数为中数。个数为偶数,则取中间两个数的平均数为中数。概念:样本观测值在频数分布表中频数最多的那一组概念:样本观测值在频数分布表中频数最多的那一组的组中值。的组中值。(分组数据的众数,属于引申概念)分组数据的众数,属于引申概念)原始概念:众数,符号原始概念:众数,符号MoMo,它指在
29、一组数中出现次数,它指在一组数中出现次数最多的那个数。计算方法是直接找到出现次数最多的最多的那个数。计算方法是直接找到出现次数最多的那个数。那个数。众数具有不唯一性。例如:众数具有不唯一性。例如:众数众数(Mode)无众数无众数无众数无众数原始数据原始数据原始数据原始数据:10 5 9 12 6 8:10 5 9 12 6 8:10 5 9 12 6 8:10 5 9 12 6 8一个众数一个众数一个众数一个众数原始数据原始数据原始数据原始数据:6 5 9 8 5 5:6 5 9 8 5 5:6 5 9 8 5 5:6 5 9 8 5 5多于一个众数多于一个众数多于一个众数多于一个众数原始数据
30、原始数据原始数据原始数据:25 28 28 36 42 42:25 28 28 36 42 42:25 28 28 36 42 42:25 28 28 36 42 42分组数据中众数的计算分组数据中众数的计算频数最多的那一组的组中值。频数最多的那一组的组中值。如书如书P21-P22:P21-P22:练习:找找众数,利用上次所做的作业。练习:找找众数,利用上次所做的作业。几何平均数几何平均数概念:样本观测值的连乘积,并以样本观测值概念:样本观测值的连乘积,并以样本观测值的总数作为次数,开方所得的数据。的总数作为次数,开方所得的数据。主要适用于一组数据中有少量数据偏大或偏小,主要适用于一组数据中有
31、少量数据偏大或偏小,数据分布呈偏态。数据分布呈偏态。计算公式:计算公式:举例说明:举例说明:1 1,2 2,3 3,4 4,8 8,1616,4242,108108见教材见教材P22,P22,例题例题3.43.4算术平均数算术平均数算术平均数简称为平均数或均值,符号为算术平均数简称为平均数或均值,符号为M M(MeanMean)总体算术平均数:希腊字母总体算术平均数:希腊字母 (音:音:miu)miu)样本算术平均数:英文字母样本算术平均数:英文字母 (音:音:X bar)X bar)。算术平均数是由所有数据之和除以数据个数所得的算术平均数是由所有数据之和除以数据个数所得的商数,用公式表示为:
32、商数,用公式表示为:算术平均数在应用上有如下特点算术平均数在应用上有如下特点:算术平均数是一个良好的集中量数,具有反应灵敏、确定严密、简明易解、计算简单、适合进一步演算和较小受抽样变化的影响等优点。算术平均数易受极端数据的影响,这是因为平均数反应灵敏,每个数据的或大或小的变化都会影响到最终结果。第二节:离中趋势量数第二节:离中趋势量数1.1.数据分布的另一个重要特征数据分布的另一个重要特征数据分布的另一个重要特征数据分布的另一个重要特征2.2.离中趋势的各指标值是对数据离散程度所作的描述离中趋势的各指标值是对数据离散程度所作的描述离中趋势的各指标值是对数据离散程度所作的描述离中趋势的各指标值是
33、对数据离散程度所作的描述3.3.反反反反映映映映各各各各变变变变量量量量值值值值远远远远离离离离其其其其中中中中心心心心值值值值的的的的程程程程度度度度,因因因因此此此此也也也也称称称称为为为为离离离离中趋势中趋势中趋势中趋势4.4.从另一个侧面说明了集中趋势测度值的代表程度从另一个侧面说明了集中趋势测度值的代表程度从另一个侧面说明了集中趋势测度值的代表程度从另一个侧面说明了集中趋势测度值的代表程度5.5.不同类型的数据有不同的离散程度测度值不同类型的数据有不同的离散程度测度值不同类型的数据有不同的离散程度测度值不同类型的数据有不同的离散程度测度值 全距(极差,两极差)全距(极差,两极差)概念
34、:一组数据最大值与最小值之差。公式:R R R R最大值(最大值(最大值(最大值(X X X Xmaxmaxmaxmax)最小值(最小值(最小值(最小值(X X X Xminminminmin)特征与缺陷:1:能够了解数据的范围(区域,区间)。2:只考虑极值,容易受到异常数据的影响,属于粗略的指标值,精细程度不够。绝对差与平均差绝对差与平均差绝对差:平均差;方差和标准差方差和标准差1 1:是离散程度的测量指标值之一,最常用。:是离散程度的测量指标值之一,最常用。2 2:能反映数据的分布。:能反映数据的分布。3 3:能反映各变量值与均值的平均差异。:能反映各变量值与均值的平均差异。4 4:根据总
35、体数据计算的,称为总体方差或标准差;:根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差。根据样本数据计算的,称为样本方差或标准差。4 6 8 10 124 6 8 10 12X=X=8.38.3总体方差和标准差的计算公式总体方差和标准差的计算公式总体方差的计算公式总体方差的计算公式总体方差的计算公式总体方差的计算公式总体标准差的计算公式总体标准差的计算公式总体标准差的计算公式总体标准差的计算公式样本方差和标准差样本方差和标准差样本方差的计算公式样本方差的计算公式样本方差的计算公式样本方差的计算公式样本标准差的计算公式样本标准差的计算公式样本标准差的计算公式样本
36、标准差的计算公式自由度自由度(degree of freedom)(degree of freedom)1.1.一组数据中可以自由取值的数据的个数一组数据中可以自由取值的数据的个数2.当当样样本本数数据据的的个个数数为为n 时时,若若样样本本均均值值 x 确确定定后后,只只有有n-1个个数数据据可可以以自自由由取取值值,其其中中必必有有一一个个数数据据则则不能自由取值不能自由取值例例如如,样样本本有有3个个数数值值,即即x1=2,x2=4,x3=9,则则 x=5。当当 x=5确确定定后后,x1,x2和和x3有有两两个个数数据据可可以以自自由由取取值值,另另一一个个则则不不能能自自由由取取值值,
37、比比如如x1=6,x2=7,那么,那么x3则必然取则必然取2,而不能取其他值,而不能取其他值样样本本方方差差用用自自由由度度去去除除,其其原原因因可可从从多多方方面面来来解解释释,从从实实际际应应用用角角度度看看,在在抽抽样样估估计计中中,当当用用样样本本方方差差去估计总体方差去估计总体方差2时,它是时,它是2的无偏估计量的无偏估计量 平均数与标准差在体育中的应用平均数与标准差在体育中的应用平均数与标准差在决策中的直接应用。平均数与标准差在决策中的直接应用。变异系数在稳定性研究中的应用。变异系数在稳定性研究中的应用。法在原始数据逻辑审核中的应用。法在原始数据逻辑审核中的应用。平均数与标准差在决
38、策中的直平均数与标准差在决策中的直接应接应用用例题:教练员要从两名标枪运动员中决定一人参加例题:教练员要从两名标枪运动员中决定一人参加例题:教练员要从两名标枪运动员中决定一人参加例题:教练员要从两名标枪运动员中决定一人参加 比赛,如何作出决策?比赛,如何作出决策?比赛,如何作出决策?比赛,如何作出决策?队员甲:队员甲:40.5040.50;41.2641.26;40.4440.44;39.6239.62;40.1240.12 42.10 42.10;39.8439.84;40.1840.18;38.7038.70;39.5439.54 队员乙:队员乙:40.4840.48;42.8842.88
39、;40.5040.50;39.5039.50;38.0038.00;43.32 43.32;38.7238.72;41.8241.82;36.8436.84;40.2440.24简单应用平局数与标准差进行数据决策的步骤:简单应用平局数与标准差进行数据决策的步骤:1 1:确定样本数据的全域。:确定样本数据的全域。2 2:确定样本数据的平均水平。:确定样本数据的平均水平。3 3:确定样本数据的离散程度。:确定样本数据的离散程度。4 4:根据专业专项应用要求采取相应不同决策。:根据专业专项应用要求采取相应不同决策。注意:决策前提是认同所取得的数据是真实客观有效的。注意:决策前提是认同所取得的数据是真
40、实客观有效的。注意:决策前提是认同所取得的数据是真实客观有效的。注意:决策前提是认同所取得的数据是真实客观有效的。变异系数在稳定性研究中的应变异系数在稳定性研究中的应用用 例题:某运动员主项为例题:某运动员主项为例题:某运动员主项为例题:某运动员主项为100m100m跑,兼项为跳远,在竞技期内,跑,兼项为跳远,在竞技期内,跑,兼项为跳远,在竞技期内,跑,兼项为跳远,在竞技期内,其主、兼项目测试结果如下:其主、兼项目测试结果如下:其主、兼项目测试结果如下:其主、兼项目测试结果如下:100m100m:ssss跳远:跳远:跳远:跳远:mmmm试比较该运动员主项、兼项成绩的稳定性。试比较该运动员主项、
41、兼项成绩的稳定性。试比较该运动员主项、兼项成绩的稳定性。试比较该运动员主项、兼项成绩的稳定性。(试比较该运动员(试比较该运动员(试比较该运动员(试比较该运动员100m100m跑、跳远两成绩的离散程度。)跑、跳远两成绩的离散程度。)跑、跳远两成绩的离散程度。)跑、跳远两成绩的离散程度。)解答:二者的指标单位不同且性质不同,不能够直接进行比较。解答:二者的指标单位不同且性质不同,不能够直接进行比较。解答:二者的指标单位不同且性质不同,不能够直接进行比较。解答:二者的指标单位不同且性质不同,不能够直接进行比较。依据变异系数的概念特征,可以计算依据变异系数的概念特征,可以计算依据变异系数的概念特征,可
42、以计算依据变异系数的概念特征,可以计算CVCV进行比较:进行比较:进行比较:进行比较:由于该运动员由于该运动员由于该运动员由于该运动员100m100m跑的跑的跑的跑的CVCV 跳远的跳远的跳远的跳远的CVCV,故该运动员的,故该运动员的,故该运动员的,故该运动员的100m100m跑跑跑跑的成绩比跳远成绩稳定。的成绩比跳远成绩稳定。的成绩比跳远成绩稳定。的成绩比跳远成绩稳定。(或说(或说(或说(或说100m100m跑成绩的离散程度小于跳远成绩)跑成绩的离散程度小于跳远成绩)跑成绩的离散程度小于跳远成绩)跑成绩的离散程度小于跳远成绩)例题:随机抽取某市例题:随机抽取某市例题:随机抽取某市例题:随机
43、抽取某市300300名初中男生的身高,经检验基名初中男生的身高,经检验基名初中男生的身高,经检验基名初中男生的身高,经检验基本服从正态分布,并得出本服从正态分布,并得出本服从正态分布,并得出本服从正态分布,并得出cmcm,cmcm,在这在这在这在这300300名学生中,有三人的身高原始数据为名学生中,有三人的身高原始数据为名学生中,有三人的身高原始数据为名学生中,有三人的身高原始数据为cmcm,cmcm,cmcm。试用。试用。试用。试用法检查法检查法检查法检查这三个数据是否为可疑数据。这三个数据是否为可疑数据。这三个数据是否为可疑数据。这三个数据是否为可疑数据。法进行原始数据逻辑审核的步骤:法
44、进行原始数据逻辑审核的步骤:法进行原始数据逻辑审核的步骤:法进行原始数据逻辑审核的步骤:1 1:求:求:求:求的下限和上限。的下限和上限。的下限和上限。的下限和上限。2 2:数据检验,看数据是否存在:数据检验,看数据是否存在:数据检验,看数据是否存在:数据检验,看数据是否存在 下限,上限下限,上限下限,上限下限,上限 区间之内。区间之内。区间之内。区间之内。3 3:作出初步判定:作出初步判定:作出初步判定:作出初步判定aa:在区间之内,可以初步认定数据正常;:在区间之内,可以初步认定数据正常;:在区间之内,可以初步认定数据正常;:在区间之内,可以初步认定数据正常;bb:在区间之外,需要进一步审
45、核数据的准确性。:在区间之外,需要进一步审核数据的准确性。:在区间之外,需要进一步审核数据的准确性。:在区间之外,需要进一步审核数据的准确性。法在原始数据逻辑审核中的应用法在原始数据逻辑审核中的应用作业作业1.1.计算教材计算教材计算教材计算教材P P1919第二章习题第第二章习题第第二章习题第第二章习题第4 4题中样本数据的所有集中量数指标和离散量数指标。题中样本数据的所有集中量数指标和离散量数指标。题中样本数据的所有集中量数指标和离散量数指标。题中样本数据的所有集中量数指标和离散量数指标。2.2.教材教材教材教材P P3939第三章习题第第三章习题第第三章习题第第三章习题第2 2题。题。题
46、。题。3.3.自习教材第三章与第四章未讲到的内容。自习教材第三章与第四章未讲到的内容。自习教材第三章与第四章未讲到的内容。自习教材第三章与第四章未讲到的内容。体育统计学体育统计学第五章第五章 正态分布正态分布 正态分布的概念与性质正态分布的概念与性质100100个样本数据的频率分布直方图个样本数据的频率分布直方图200200个样本数据的频率分布直方图个样本数据的频率分布直方图总体密度曲线总体密度曲线无穷多个样本数据的频率分布直方图无穷多个样本数据的频率分布直方图正态分布的重要性正态分布的重要性1.1.描述连续型随机变量的最重要的分布描述连续型随机变量的最重要的分布2.2.可用于近似连续型的离散
47、变量的分布可用于近似连续型的离散变量的分布3.3.经典统计推断的基础经典统计推断的基础x xf f(x x)概率密度函数概率密度函数f(x):随机变量:随机变量X 的频数的频数 :总体方差:总体方差 =3.14159;e=2.71828x=随机变量的取值随机变量的取值(-x02.正态曲线的最高点在均值,它也是分布的中位数和众数3.正态分布是一簇分布,每一特定正态分布通过均值和标准差来区分。决定曲线的位置,称为位位位位置置置置参参参参数数数数;决定曲线的形状,称为形状参数形状参数形状参数形状参数。4.曲线f(x)相对于均值对称,尾端向两个方向无限延伸,且理论上永远不会与横轴相交5.正态曲线下的总
48、面积等于1,即概率值等于16.随机变量的概率由曲线下的面积给出 和和 对对正态曲线的影响正态曲线的影响xf(x)CAB正态分布的概率正态分布的概率概率是曲线下的概率是曲线下的概率是曲线下的概率是曲线下的面积面积面积面积!a ab bx xf f(x x)标准正态分布标准正态分布 任何一个一般的正态分布,可通过下面的线性变换任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布转化为标准正态分布 标准正态分布的概率密度函数标准正态分布的概率密度函数标准正态分布的概率密度函数标准正态分布的概率密度函数x 一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布 u标准正态分
49、布标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布 标准正态分布标准正态分布标准正态分布的重要性标准正态分布的重要性一般正态分布的不同取决于均值一般正态分布的不同取决于均值 和标准差和标准差 计算概率时计算概率时 ,每一个一般正态分布都需要有自己的,每一个一般正态分布都需要有自己的正态概率分布表,这种表格是无穷多的。正态概率分布表,这种表格是无穷多的。若能将一般正态分布转化为标准正态分布,计算概率若能将一般正态分布转化为标准正态分布,计算概率时就只需查一张表(标准正态分布表)就可以了。时就只需查一张表(标准正态分布表)就可以了。1.1.先将一个先将一个一般一般正态分布转换为正态分布
50、转换为标准标准正态分布正态分布2.2.计算概率时计算概率时,查标准正态概率分布表,查标准正态概率分布表3.3.对于负的对于负的 x x ,可由,可由 (-(-x x)-x x 得到得到4.4.对于标准正态分布,即对于标准正态分布,即X X N N(0,1(0,12 2),有,有P P(a a X X b b)b b a a P P(|X|(|X|a a)2 2 a a 1 15.5.对于对于一般一般正态分布,即正态分布,即X X N N(,2 2),有,有标准正态分布表的使用标准正态分布表的使用 标准化的例子标准化的例子A A(5 5,10102 2)x 55 一般正态分布一般正态分布一般正态