文档视界 最新最全的文档下载
当前位置:文档视界 › 专题十概率与统计第二十九讲回归分析与独立性检验 十年高考数学(文科)真题题型分类汇编

专题十概率与统计第二十九讲回归分析与独立性检验 十年高考数学(文科)真题题型分类汇编

专题十概率与统计第二十九讲回归分析与独立性检验 十年高考数学(文科)真题题型分类汇编
专题十概率与统计第二十九讲回归分析与独立性检验 十年高考数学(文科)真题题型分类汇编

专题十 概率与统计

第二十九讲 回归分析与独立性检验

2019年

1.(2019全国1文17)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:

(1)分别估计男、女顾客对该商场服务满意的概率;

(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?

附:2

2

()()()()()

n ad bc K a b c d a c b d -=++++.

2010-2018年

一、选择题

1.(2015湖北)已知变量x 和y 满足关系0.11y x =-+,变量y 与z 正相关,下列结论中正确的是

A .x 与y 正相关,x 与z 负相关

B .x 与y 正相关,x 与z 正相关

C .x 与y 负相关,x 与z 负相关

D .x 与y 负相关,x 与z 正相关 2.(2014湖北)根据如下样本数据

得到的回归方程为?y

bx a =+,则 A .0a >,0b < B .0a >,0b > C .0a <,0b < D .0a <,0b >

3.(2014江西)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关

系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是

4.(2012新课标)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不

全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线1

12

y x =+上,则这组样本数据的样本相关系数为

A .?1

B .0

C .1

2

D .1

5.(2012湖南)设某大学的女生体重y (单位:kg )与身高x (单位:cm )具有线性相关关

系,根据一组样本数据(i x ,i y )(i =1,2,…,n ),用最小二乘法建立的回归方程为y =0.85x -85.71,则下列结论中不正确...的是 A .y 与x 具有正的线性相关关系 B .回归直线过样本点的中心(x ,y )

C .若该大学某女生身高增加1cm ,则其体重约增加0.85kg

D .若该大学某女生身高为170cm ,则可断定其体重必为58.79kg 6.(2011山东)某产品的广告费用x 与销售额y 的统计数据如下表

根据上表可得回归方程???y

bx a =+中的?b 为9.4,据此模型预报广告费用为6万元时销

售额为

A .63.6万元

B .65.5万元

C .67.7万元

D .72.0万元

二、填空题

7.(2015北京)高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩

与总成绩在全年级中的排名情况如下,甲、乙、丙为该班三位学生.

从这次考试成绩看,

①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是 ; ②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 . 三、解答题

8.(2018全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)

的折线图.

为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回

归模型.根据2000年至2016年的数据(时间变量t 的值依次为1217,,

…,)建立模型①:?30.413.5=-+y

t ;根据2010年至2016年的数据(时间变量t 的值依次为127,,…,)建立模型②:?9917.5=+y

t .

(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.

9.(2017新课标Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该

生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:

经计算得16119.9716i i x x ===∑

,s ==0.212≈

18.439≈,16

1

()(8.5) 2.78i i x x i =--=-∑,其中i x 为抽取的

第i 个零件的尺寸,i =1,2, (16)

(1)求(,)i x i (1,2,,16)i =???的相关系数r ,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若||0.25r <,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).

(2)一天内抽检零件中,如果出现了尺寸在(3,3)x s x s -+之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查. (ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?

(ⅱ)在(3,3)x s x s -+之外的数据称为离群值,试剔除离群值,估计这条生产线当天生

产的零件尺寸的均值与标准差.(精确到0.01)

附:样本(,)i i x y (1,2,,)i n =???的相关系数()()

n

i

i

x x y y r --=

∑,

0.09≈.

10.(2016年全国III 卷)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿

吨)的折线图.

注:年份代码1–7分别对应年份2008–2014.

(Ⅰ)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (Ⅱ)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化

处理量.

附注:参考数据:

7

1

9.32i

i y

==∑,7

1

40.17i i i t y ==∑

0.55=

≈2.646.

参考公式:相关系数()()

n

i

i

t t y y r --=

∑ 回归方程y a bt =+中斜率和截距的最小二乘估计公式分别为:

1

2

1

()()

()n

i

i i n

i

i t

t y y b t

t ==--=

-∑∑,=.a y bt -

11.(2015新课标1)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单

位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费i x 和年销售量i y (i =1,2,···,8)数据作了初步处理,得到下面的散点图及一些统计量的值.

表中i w =w =

1

8

8

1

i i w =∑.

(Ⅰ)根据散点图判断,y a bx =+与y c =+哪一个适宜作为年销售量y 关于年

宣传费x 的回归方程类型?(给出判断即可,不必说明理由) (Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y 关于x 的回归方程;

(Ⅲ)已知这种产品的年利率z 与x 、y 的关系为0.2z y x =-.根据(Ⅱ)的结果回

答下列问题:

(ⅰ)年宣传费49x =时,年销售量及年利润的预报值是多少? (ⅱ)年宣传费x 为何值时,年利率的预报值最大?

附:对于一组数据11(,)u v ,22(,)u v ,???,(,)n n u v ,其回归线v u αβ=+的斜率和截

距的最小二乘估计分别为1

2

1

()()

?()

n

i

i

i n

i

i u u v v u u β

==--=-∑∑,??v u α

β=-. 12.(2014新课标2)某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数

据如下表: (Ⅰ)求y 关于t 的线性回归方程;

(Ⅱ)利用(Ⅰ)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收

入的变化情况,并预测该地区2015年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘估计公式分别为:

()()

()

1

2

1

n

i

i i n

i i t

t

y y b t t ∧

==--=

-∑∑,??a

y bt =- 13.(2012辽宁)电视传媒公司为了解某地区电视观众对某体育节目的收视情况,随机抽取

了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:

将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.

(I )根据已知条件完成下面22?列联表,并据此资料你是否认为“体育迷”与性别有关?

(II )将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育

迷”中有2名女性.若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.

2

1212

211222112

)(++++-=

n n n n n n n n n χ, 附:

文科数学专题概率与统计(专练)高考二轮复习资料含答案

专題16概率与统计(押题专练〉 1 12 1 ?围棋盒子中有多粒黑子和白子,已知从中取出2粒都是黑子的概率为7都是白子的概率是35.则从 中任意取出2粒恰好是同一色的概率是 ( ) 1 12 A : B. 35 7 17 C D. 1 35 【答案】 C 【解析】设如中取出2粒都是黒子彷事件直「从中取出2粒者卩是白子彷事件B 「任竜取出2粒恰 好是 同一色悄事件C f 则C=AUB,且事件A 与B 互斥-所叹PQ=P(A)+P(B)=昇||二¥即任青取出 -粒恰好是同一色的概率为紧 n 1 2?若[0 , n ],则sin ( 0 + 3)>5成立的概率为( ) 2 C 3 D 1 【答案】B n n 4 n n 1,口 n n 5 n n 【解析】依题意,当 0 € [0, n ]时,0 +-3€[§,丁],由 sin ( 0 +~3)>2得"3 w 0 + _3<_^,。三 0 <2. n 1 因此,所求的概率等于二十n =二,选B 3?在{1,3,5}和{2,4}两个集合中各取一个数组成一个两位数,则这个数能被 4整除的概率是( ) 1 1 A 3 B -2 C 1 【答案】D 【解析】所有的两位数为 12,14,21,41,32,34,23,43,52,54,25,45 ,共12个, 能被4整除的数为12,32,52,共3个, 3 1 故所求概率P = ;7=匚.故选D 12 4 4.在平面区域{(x , y)|0 w x w 1, 1w y w 2}内随机投入一点 P,则点P 的坐标(x , y)满足y w 2x 的概率 1 A 3 1 B-2

1 1 X - X1 S阴影2 2 5.在区间[0,1]上随机取一个数x,则事件“ log°.5(4x —3)>0”发生的概率为( 1 1 C3 D-4 【答案】D 【解析】因为log o.5(4x —3)>0,所以0<4x —3< 1,即|

高二数学1-2 独立性检验

独立性检验 教学重点、独立性检验的基本方法,独立性检验的步骤 难点:.基本思想的领会及方法应用. 知识点 一、独立性检验的基本概念和原理 独立性检验是研究相关关系的方法。 1.分类变量:变量的不同“值”表示个体所属的不同类别的变量称为分类变量.比如男女、是否吸烟、是否患癌症,宗教信仰、国籍等等。 2列联表:分类变量的汇总统计表(频数表). 一般我们只研究每个分类变量只取两个 3.条形图 为了更清晰地表达这个特征,我们还可用如下的等高条形图表示两种情况下患肺癌的比例.如图3.2一3 所示,在等高条形图中,浅色的条高表示不患肺癌的百分比;深色的条高表示患肺癌的百分比. 通过分析数据和图形,我们得到的直观印象是“吸烟和患肺癌有关”.那么我们是否能够以一定的把握认为“吸烟与患肺癌有关”呢? 4.独立性检验的步骤 为了回答下面问题,我们先假设H :吸烟与患肺癌没有关系,看看能够得到什么样 的结论。 不患肺癌患肺癌合计不吸烟 a b a+b 吸烟 c d c+d 合计a+c b+d a+b+c+d 样本容量 n=a+b+c+d 如果“吸烟与患肺癌没有关系”,则吸烟者中不患肺癌的的比例应该与不吸烟者中相应的比例差不多,即:

()()() ()()()() 2 2 0a c a c d c a b ad b c a b c d ad bc ad bc n ad bc k a b c d a c b d n a b c d ≈?+≈+?-≈++---= ++++=+++因此 : 越小, 说明吸烟与患肺癌之间关系越弱. 越大, 说明吸烟与患肺癌之间关系越强构造随机变量 其中 为样本容量 若 H 0 成立,即“吸烟与患肺癌没有关系”,则 K “应该很小.根据表3一7中的数据,利用公式(1)计算得到 K “的观测值为 ()2 2 996577754942209956.63278172148987491 K ?-?=≈???, 这个值到底能告诉我们什么呢? 统计学家经过研究后发现,在 H 0成立的情况下, 2( 6.635)0.01P K ≥≈. (2) (2)式说明,在H 0成立的情况下,2 K 的观测值超过 6. 635 的概率非常小,近似为0 . 01, 是一个小概率事件.现在2 K 的观测值k ≈56.632 ,远远大于6. 635,所以有理由断定H 0 不成立,即认为“吸烟与患肺癌有关系”.但这种判断会犯错误,犯错误的概率不会超过0.01,即我们有99%的把握认为“吸烟与患肺癌有关系” . 在上述过程中,实际上是借助于随机变量2 K 的观测值k 建立了一个判断H 0是否成立的规则: 如果k ≥6. 635,就判断H 0不成立,即认为吸烟与患肺癌有关系;否则,就判断H 0成立,即认为吸烟与患肺癌没有关系. 在该规则下,把结论“H 0 成立”错判成“H 0 不成立”的概率不会超过 2( 6.635)0.01P K ≥≈, 即有99%的把握认为H 0不成立. 假设检验 备择假设H 1 不成立的前提下进行推理 10成立 推出有利于H 1成立的小概率事件(概率不超过α的事件)发 生,意味着H 1成立的可能性(可能性为(1-α))很大 下任上例的解决步骤 第一步:提出假设检验问题 H 0:吸烟与患肺癌没有关系? H 1:吸烟与患肺癌有关系 第二步:选择检验的指标 2 2 ()K ()()()() n ad bc a b c d a c b d -=++++ (它越小,原假设“H 0:吸烟与患肺癌没有关系”成立的可能性越大;它越大,备择假设“H 1:吸烟与患肺癌有关系”成立的可能性越大. 第三步:查表得出结论

2020高考文科数学概率与统计专项练习

概率与统计专项练习 一、选择题(本题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的) 1.[2019·山东滨州模考]若复数(1-a i)2 -2i 是纯虚数,则实数a =( ) A .0 B .±1 C .1 D .-1 答案:C 解析:(1-a i)2 -2i =1-a 2 -2a i -2i =1-a 2-(2a +2)i. ∵(1-a i)2 -2i 是纯虚数,∴? ?? ?? 1-a 2 =0,2a +2≠0,解得a =1,故选C. 2.[2019·广东广州执信中学测试]从某社区65户高收入家庭,280户中等收入家庭,105户低收入家庭中选出100户调查社会购买力的某一项指标,应采用的最佳抽样方法是( ) A .系统抽样 B .分层抽样 C .简单随机抽样 D .各种方法均可 答案:B 解析:因为社会购买力的某一项指标受到家庭收入的影响,而社区中各个家庭收入差别明显,所以应采用分层抽样的方法,故选B. 3.用反证法证明命题“设a ,b 为实数,则方程x 3 +ax +b =0至少有一个实根”时,要做的假设是( ) A .方程x 3 +ax +b =0没有实根 B .方程x 3+ax +b =0至多有一个实根 C .方程x 3+ax +b =0至多有两个实根 D .方程x 3+ax +b =0恰好有两个实根 答案:A 解析:因为“方程x 3 +ax +b =0至少有一个实根”等价于“方程x 3 +ax +b =0的实根的个数大于或等于1”,因此,要做的假设是“方程x 3 +ax +b =0没有实根”. 4.[2019·山东烟台模拟]将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽到的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为( ) A .26,16,8 B .25,17,8

(完整word版)2018年高考数学总复习概率及其计算

第十三章概率与统计本章知识结构图

第一节 概率及其计算 考纲解读 1.了解随机事件发生的不确定性、频率的稳定性、概率的意义、频率与概率的区别。 2.了解两个互斥事件的概率的加法公式。 3.掌握古典概型及其概率计算公式。 4.了解随机数的意义,能运用模拟方法估计概率。 5.了解几何概型的意义。 命题趋势探究 1.本部分为高考必考内容,在选择题、填空题和解答题中都有渗透。 2.命题设置以两种概型的概率计算及运用互斥、对立事件的概率公式为核心内容,题型及分值稳定,难度中等或中等以下。 知识点精讲 一、必然事件、不可能事件、随机事件 在一定条件下: ①必然要发生的事件叫必然事件; ②一定不发生的事件叫不可能事件; ③可能发生也可能不发生的事件叫随机事件。 二、概率 在相同条件下,做次重复实验,事件A 发生次,测得A 发生的频率为,当很大时,A 发生的频率总是在某个常数附近摆动,随着的增加,摆动幅度越来越小,这时就把这个常数叫做A 的概率,记作。对于必然事件A ,;对于不可能事件A ,=0. 三、基本事件和基本事件空间 在一次实验中,不可能再分的事件称为基本事件,所有基本事件组成的集合称为基本事件空间。 四、两个基本概型的概率公式 1、古典概型 条件:1、基本事件空间含有限个基本事件 2、每个基本事件发生的可能性相同 ()(A) = ()A card P A card = Ω包含基本事件数基本事件总数 2、几何概型 条件:每个事件都可以看作某几何区域Ω的子集A ,A 的几何度量(长度、面积、体积或时间)记为 A μ.

()P A = A μμΩ 。 五、互斥事件的概率 1、互斥事件 在一次实验中不能同时发生的事件称为互斥事件。事件A 与事件B 互斥,则 ()()() P A B P A P B =+U 。 2、对立事件 事件A,B 互斥,且其中必有一个发生,称事件A,B 对立,记作B A =或A B =。 ()() 1P A p A =- 。 3、互斥事件与对立事件的联系 对立事件必是互斥事件,即“事件A ,B 对立”是”事件A ,B 互斥“的充分不必要条件。 题型归纳及思路提示 题型176 古典概型 思路提示 首先确定事件类型为古典概型,古典概型特征有二:有限个不同的基本事件及各基本事件发生的可能性是均等的;其次计算出基本事件的总数及事件A 所包含的基本事件数;最后计算 ()A P A = 包含基本事件数 基本事件总数。 例13.1 设平面向量(),1m a m =,()2,n b n = ,其中{}, 1.2,3,4m n ∈ (1)请列出有序数组(),m n 的所有可能结果; (2) 若“使得()m m n a a b ⊥-成立的(),m n 为事件A ,求事件A 发生的概率。 分析:两向量垂直的充要条件是两向量的数量积为0,从而可得m 与n 的关系,再从以上 (),m n 的16个有序数组中筛选出符合条件的,即得事件A 包含的基本事件个数。 解析:(1)由{}, 1.2,3,4m n ∈,有序数组(),m n 的所有可能结果为()1,1 , ()()() 1,2,1,3,1,4, ()()()() 2,1,2,2,2,3,2,4, ()()()() 3,1,3,2,3,3,3,4, ()()()()4,1,4,2,4,3,4,4 共16个。 (2)因为(),1m a m =,()2,n b n =,所以()2,1m n a b m n -=-- .又()m m n a a b ⊥-,得 ()(),12,10m m n ?--= ,即22m 10m n -+-= ,所以()21n m =- 。故事件A 包含的

全国卷文科数学概率统计汇总

概率统计高考题 1.[2016.全国卷3.T5] 小敏打开计算机时,忘记了开机密码的前两位,只记得第一位是M ,I,N 中的一个字母,第二位是1,2,3,4,5中的一个数字,则小敏输入一次密码能够成功开机的概率是( ) A. 158 B. 81 C. 151 D. 30 1 2.[2016.全国卷2.T8] 某路口人行横道的信号灯为红灯和绿灯交替出现,红灯持续时间为40秒.若一名行人来到该路口遇到红灯,则至少需要等待15秒才出现绿灯的概率为( ) A. 710 B. 58 C.38 D.310 3.[2015.全国卷1.T4] 如果3个整数可作为一个直角三角形三条边的边长,则称这3个数为一组勾股数,从1,2,3,4,5中任取3个不同的数,则3个数构成一组勾股数的概率为( ) A. 103 B.15 C.110 D.1 20 4.[201 5.全国卷2.T3]根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论不正确的是( ) A .逐年比较,2008年减少二氧化硫排放量的效果最显著 B .2007年我国治理二氧化硫排放显现成效 C .2006年以来我国二氧化硫年排放量呈减少趋势 D .2006年以来我国二氧化硫年排放量与年份正相关 5.[2013.全国卷1.T3]从1,2,3,4中任取2个不同的数,则取出的2个数之差的绝对值为2的概率是( ) A. 12 B.13 C.14 D.1 6 6.[2012.全国卷.T3]在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( ) A. -1 B.0 C. 1 2 D. 1 7.[2011.全国卷.T6]有3个兴趣小组,甲、乙两位同学各自参加其中一个小组,每位同学参加各个小组的可能性相同,则这两位同学参加同一个兴趣小组的概率为( ) A. 13 B. 12 C.23 D.34 8.[2014.全国卷1.T13] 将2本不同的数学书和1本语文书在书架上随机排成一行,则2本数学书相邻的概率为 2004年 2005年 2006年 2007年 2008年 2009年 2010年 2011年 2012年 2013年

高中数学 怎样进行独立性检验(b版)解题方法谈

怎样进行独立性检验(B 版) 一、独立性检验的基本思想 独立性检验的基本思想类似于数学中的反证法.其目的是为了确认“两个分类变量有关系”这一结论成立的可信程度.它首先假设结论不成立,即“两个分类变量没有关系”成立,在该假设下,构造的随机变量2X 的值应该很小.如果由观测数据计算得到的2X 的观测值很大,则在一定程度上说明假设不合理.因此可以根据随机变量2X 的含义来确定该假设不合理的程度.如果2X >6.635,则说明该假设不合理的程度是99%,从而可认为“两个分类变量有关系”这一结论成立的可信程度为99%. 二、独立性检验的相关概念 1.2×2列联表 一般地,如果有两个分类变量X 和Y ,它们的值域分别是1212{}{}x x y y ,,,,它们的样本频数列联表(见下表)称为2×2列联表. 2. 2X 统计量 2X 统计量是统计学中的一个非常有用的统计量,它是根据概率的统计定义和事件的独 立性得到的,其计算公式是2 2 112212211212 ()n n n n n n n n n ++++-=X .利用它的大小可以决定是否拒绝原来 的统计假设,如果计算出的2X 值较大,就拒绝假设;如果2 X 值较小,就接受假设. 3.临界值 通过对2 X 统计量分布和大量的试验数据的研究,已经得到了一些临界值,其中比较常用的有两个:3.841和6.635.在对具体问题进行独立性检验时,把计算出的2 X 值与以上两个临界值进行对比,从而确定两个事件的关系. 三、独立性检验步骤 使用2 X 统计量作2×2列联表的独立性检验的步骤是: (1)检查2×2列联表中的数据是否符合要求;

高中数学概率统计知识万能公式文科

第六部分 概率与统计万能知识点及经典题型Ⅰ 【考题分析】 1、考试题型:选择填空1个,解答题:18(必考) 2、考题分值:17分; 3、解答题考点:①频率直方图的应用,②线性回归直线的应用,③独立性检验和概率 4、难度系数:0.7-0.8左右,(120分必须全对,100以上者全对) 【知识总结】 一、普通的众数、平均数、中位数及方差 1、 众数:一组数据中,出现次数最多的数。 2、平均数:①、常规平均数:12n x x x x n ++???+= ②、加权平均数:112212n n n x x x x ωωωωωω++???+=++???+ 3、中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数。 4、方差:2222121 [()()()]n s x x x x x x n = -+-+???+- 二、频率直方分布图下的频率 1、频率 =小长方形面积:f S y d ==?距;频率=频数/总数 2、频率之和:121n f f f ++???+=;同时 121n S S S ++???+=; 三、频率直方分布图下的众数、平均数、中位数及方差 1、众数:最高小矩形底边的中点。 2、平均数: 112233n n x x f x f x f x f =+++???+ 112233n n x x S x S x S x S =+++???+ 3、中位数:从左到右或者从右到左累加,面积等于0.5时x 的值。 4、方差:22221122()()()n n s x x f x x f x x f =-+-+???+- 四、线性回归直线方程:???y bx a =+ 其中:1 1 2 2 2 1 1 ()() ?() n n i i i i i i n n i i i i x x y y x y nxy b x x x nx ====---∑∑== --∑∑ , ??a y bx =- 1、线性回归直线方程必过样本中心(,)x y ; 2、?0:b >正相关;?0:b <负相关。 3、线性回归直线方程:???y bx a =+的斜率?b 中,两个公式中分子、分母对应也相等;中间可以推导得到。 五、回归分析 1、残差:??i i i e y y =-(残差=真实值—预报值)。 分析:?i e 越小越好; 2、残差平方和:21 ?()n i i i y y =-∑, 分析:①意义:越小越好; ②计算:222211221 ????()()()()n i i n n i y y y y y y y y =-=-+-+???+-∑

高考数学概率与统计知识点汇编

高中数学之概率与统计 求等可能性事件、互斥事件和相互独立事件的概率 解此类题目常应用以下知识: (1)等可能性事件(古典概型)的概率:P(A)=)()(I card A card =n m ; 等可能事件概率的计算步骤: 计算一次试验的基本事件总数n ; 设所求事件A ,并计算事件A 包含的基本事件的个数m ; 依公式 ()m P A n = 求值; 答,即给问题一个明确的答复. (2)互斥事件有一个发生的概率:P(A +B)=P(A)+P(B); 特例:对立事件的概率:P(A)+P(A )=P(A +A )=1. (3)相互独立事件同时发生的概率:P(A ·B)=P(A)·P(B); 特例:独立重复试验的概率:Pn(k)=k n k k n p p C --)1(.其中P 为事件A 在一次试验中发生的 概率,此式为二项式[(1-P)+P]n 展开的第k+1项. (4)解决概率问题要注意“四个步骤,一个结合”: 求概率的步骤是: 第一步,确定事件性质?? ?? ???等可能事件 互斥事件 独立事件 n 次独立重复试验 即所给的问题归结为四类事件中的某一种. 第二步,判断事件的运算 ?? ?和事件积事件 即是至少有一个发生,还是同时发生,分别运用相加或相乘事件. 第三步,运用公式()()()()()()()()(1) k k n k n n m P A n P A B P A P B P A B P A P B P k C p p -? =???+=+? ??=??=-??等可能事件: 互斥事件: 独立事件: n 次独立重复试验:求解 第四步,答,即给提出的问题有一个明确的答复. 例1. 在五个数字12345,,,,中,。 例2. 若随机取出三个数字,则剩下两个数字都是奇数的概率是 (结果用数值表示). [解答过程]0.3提示:13 35C 33. 54C 10 2P ===?

高三文科数学统计概率总结

高三文科数学统计概率 总结 文档编制序号:[KKIDT-LLE0828-LLETD298-POI08]

统计概率考点总结 【考点一】分层抽样 01、交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对 甲、乙、丙、丁四个社区做分层抽样调查。假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人。若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为() 02、A、101 B、808 C、1212 D、2012 03、某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽 取一个容量为280的样本,则此样本中男生人数为____________. 04、一支田径运动队有男运动员56人,女运动员42人。现用分层抽样的方法抽取若 干人,若抽取的男运动员有8人,则抽取的女运动员有______人。 05、某单位有840名职工, 现采用系统抽样方法, 抽取42人做问卷调查, 将840人 按1, 2, , 840随机编号, 则抽取的42人中, 编号落入区间[481, 720]的人数为() 06、A.11 B.12 C.13 D.14 07、将参加夏令营的600名学生编号为:001,002,……600,采用系统抽样方法抽取 一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495住在第Ⅱ营区,从496到600在第Ⅲ营 区,三个营区被抽中的人数依次为() 08、A.26, 16, 8B.25,17,8 C.25,16,9 D.24,17,9 【考点二】频率分布直方图(估计各种特征数据) 01、从某小区抽取100户居民进行月用电量调查,发现其用电量都在50到350度之间, 频率分布直方图所示. 02、(I)直方图中x的值为________; 100,250内的户数为_____. 03、(II)在这些用户中,用电量落在区间[) 04、下图是样本容量为200的频率分布直方图。根据样本的 频率分布直方图估计,样本数据落在[6,10]内的频数 为,数据落在(2,10)内的概率约为

高中数学 选修1-2 3.独立性检验

3.独立性检验 教学目标 班级____姓名________ 1.了解分类变量、列联表、随机变量2 K . 2.了解独立性检验的基本思想和方法. 教学过程 一、知识要点. 1.分类变量:变量不同的值表示个体所属的类别不同. 2.列联表:两个分类变量的频数表. 3.随机变量:) )()()(()(22 d b c a d c b a bc ad n K ++++-=,010.0)635.6(2 ≈≥K P (小概率事件) 4.独立性检验:运用统计分析的方法确定分类变量的关系. (1)要判断“两个分类变量有关系”; (2)假设结论不成立,即“0H :两个分类变量没有关系”; (3)确定一个判断规则的临界值0k :当02k K ≥时,认为“两个分类变量有关系”,否则认为“两个分类变量没有关系”;(0k 是根据允许误判概率的上限来确定的) (4)按照上述规则,误判概率为)(02k K P ≥. 0k 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.82 )(02k K P ≥ 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 (5)拓展: ①令|| d c c b a a W +-+=,则) )(() )((22d b c a d c b a n W K ++++?=; ②令) )(() )((00d c b a n d b c a k w ++++? = ; ③02 k K ≥等价于0w W ≥,所以)(0w W P ≥等价于)(02 k K P ≥; ④可以用)(0w W P ≥来作为判断依据. 二、例题分析. 例1:研究吸烟与患肺癌的关系. 1.确定研究对象:吸烟与患肺癌的关系.

高三文科数学概率与统计

达濠侨中高三数学(文科)第二轮复习题 概率与统计 一 选择题 1.(2015·新课标全国卷Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( ) A .逐年比较,2008年减少二氧化硫排放量的效果最显着 B .2007年我国治理二氧化硫排放显现成效 C .2006年以来我国二氧化硫年排放量呈减少趋势 D .2006年以来我国二氧化硫年排放量与年份正相关 2.为了解某社区居民的家庭收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,该社区一户年收入为15万元家庭的年支出为( ) A .11.4万元 B .11.8万元 C .12.0万元 D .12.2万元 3.一个频数分布表(样本容量为30)不小心被损坏了一部分,若样本中数据在[20,60)上的频率为0.8,则估计样本在[40,50),[50,60)内的数据个数共为( ) A .15 B .16 C .17 D .19 4. 【2015高考新课标文】如果3个正整数可作为一个直角三角形三条边的边长,则称这3个数为一组勾股数,从1,2,3,4,5中任取3个不同的数,则这3个数构成一组勾股数的概率为( ) (A ) 310 (B )15 (C )110 (D )1 20 5. 设复数(1)z x yi =-+(,)x y R ∈,若||1z ≤,则y x ≥的概率( ) A .3142π+ B . 112π+ C .1142π- D . 112π - 6.某班级有50名学生,现用系统抽样的方法从这50名学生中抽出10名学生,将这50名学生随机编号为1~50号,并按编号顺序平均分成10组(1~5号,6~10号,…,46~50号),若在第三组抽到的编号是13,则在第七组抽到的编号是( ) A .23 B .33 C .43 D .53 7.在样本频率分布直方图中,共有9个小长方形,若中间一个小长方形的面积等

高考数学复习专题:统计与概率(经典)

11 12 13 3 5 7 2 2 4 6 9 1 5 5 7 图1 统计与概率专题 一、知识点 1、随机抽样:系统抽样、简单随机抽样、分层抽样 1、用简单随机抽样从100名学生(男生25人)中抽选20人进行评教,某男生被抽到的概率是( ) A . 1001 B .251 C .5 1 D . 5 1 2、为了解1200名学生对学校教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔k 为( ) A .40 B .30 C .20 D .12 3、某单位有职工160人,其中业务员有104人,管理人员32人,后勤服务人员24人,现用分层抽样法从中抽取一容量为20的样本,则抽取管理人员( ) A .3人 B .4人 C .7人 D .12人 2、古典概型与几何概型 1、一枚硬币连掷3次,只有一次出现正面的概率是( ) A .83 B .32 C .31 D .4 1 2、如图所示,在正方形区域任意投掷一枚钉子,假设区域内每一点被投中的可能性相等,那么钉子投进阴影区域的概率为____________. 3、线性回归方程 用最小二乘法求线性回归方程系数公式1 2 211 ???n i i i n i x y nx y b a y bx x nx ==-==--∑∑,. 二、巩固练习 1、随机抽取某中学12位高三同学,调查他们春节期间购书费用(单位:元),获得数据的茎叶图如图1, 这12位同学购书的平均费用是( ) A.125元 B.5.125元 C.126元 D.5.126元 2、200辆汽车通过某一段公路时的时速频率分布直方图如图所示,时速在[50,60) 的汽车大约有( ) A .30辆 B . 40辆 C .60辆 D .80辆 3、某校有高级教师26人,中级教师104人,其他教师若干人.为了了解该校教师 的工资收入情况,若按分层抽样从该校的所有教师中抽取56人进行调查,已知从其 他教师中共抽取了16人,则该校共有教师 ______人. 4、执行下边的程序框图,若0.8p =,则输出的n = . 0.04 0.030.020.01频率 组距时速8070605040开始 10n S ==, S p

2020年高考文科数学概率与统计题型归纳与训练

2020年高考文科数学《概率与统计》题型归纳与训练 【题型归纳】 题型一古典概型 例1 从甲、乙等5名学生中随机选出2人,则甲被选中的概率为(). A. 1 5B. 2 5 C. 8 25 D. 9 25 【答案】B 【解析】可设这5名学生分别是甲、乙、丙、丁、戊,从中随机选出2人的方法有: (甲,乙),(甲,丙),(甲,丁),(甲,戊),(乙,丙),(乙,丁),(乙,戊),(丙,丁),(丙,戊),(丁,戊),共有10种选法,其中只有前4种是甲被选中,所以所求概率为42 105 =.故选B. 例2 将2本不同的数学书和1本语文书在书架上随机排成一行,则2本数学书相邻的概率为________. 【答案】2 3 【解析】根据题意显然这是一个古典概型,其基本事件有:数1,数2,语; 数1,语,数2;数2,数1,语; 数2,语,数1;语,数2,数1; 语,数1,数2共有6 种,其中2本数学书相邻的有4种,则其概率为:42 63 p==. 【易错点】列举不全面或重复,就是不准确 【思维点拨】直接列举,找出符合要求的事件个数. 题型二几何概型 1 / 18

例 1 如图所示,正方形ABCD 内的图形来自中国古代的太极 图,正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是( ). A. 14 B. π8 C. 12 D. π 4 【答案】B 【解析】不妨设正方形边长为a ,由图形的对称性可知,太极图中黑白部分面积相等,即各占圆面积的一半.由几何概型概率的计算公式得,所求概率为 8 22122 ππ=??? ????a a .故选B. 例2 在区间[0,5]上随机地选择一个数p ,则方程22320x px p 有两个负根的概率为________. 【答案】3 2 【解析】方程2 2320x px p 有两个负根的充要条件是2121244(32)0 20320 p p x x p x x p ??=--≥? +=-? 即 2 1,3 p <≤或2p ≥,又因为[0,5]p ∈,所以使方程22320x px p 有两个负根的p 的取值范围为2(,1][2,5]3,故所求的概率2(1)(52)23503 -+-=-,故填:32. 【易错点】“有两个负根”这个条件不会转化. 【思维点拨】“有两个负根”转化为函数图像与x 轴负半轴有两个交点.从而得到参数p 的范围.在利用几何概型的计算公式计算即可. D

高中数学选修1-2《独立性检验基本思想及其初步应用》教案

高中数学选修1-2《独立性检验基本思想及其初步应用》教案 High school mathematics elective 1-2 "basic idea of independe nce test and its preliminary application" teaching plan

高中数学选修1-2《独立性检验基本思想及 其初步应用》教案 前言:数学是研究数量、结构、变化、空间以及信息等概念的一门学科,从某种角 度看属于形式科学的一种,在人类历史发展和社会生活中,数学发挥着不可替代的 作用,是学习和研究现代科学技术必不可少的基本工具。本教案根据数学课程标准 的要求和教学对象的特点,将教学诸要素有序安排,确定合适的教学方案的设想和 计划、并以启迪发展学生智力为根本目的。便于学习和使用,本文档下载后内容可 按需编辑修改及打印。 教学要求:通过探究“吸烟是否与患肺癌有关系”引出 独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示在吸烟者中患肺癌的比例比不吸烟者中患肺癌的比例高,让学生亲身体验独立性检验的实施步骤与必要性. 教学重点:理解独立性检验的基本思想及实施步骤. 教学难点:了解独立性检验的基本思想、了解随机变量 的含义. 教学过程: 教学过程: 一、复习准备: 独立性检验的基本步骤、思想

二、讲授新课: 1.教学例1: 例1 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶. 分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效? ① 第一步:教师引导学生作出列联表,并分析列联表,引导学生得出“秃顶与患心脏病有关”的结论; 第二步:教师演示三维柱形图和二维条形图,进一步向学生解释所得到的统计结果; 第三步:由学生计算出的值; 第四步:解释结果的含义. ② 通过第2个问题,向学生强调“样本只能代表相应总体”,这里的数据来自于医院的住院病人,因此题目中的结论能够很好地适用于住院的病人群体,而把这个结论推广到其他群体则可能会出现错误,除非有其它的证据表明可以进行这种推广.

高中文科数学(统计与概率)综合练习

《概率与统计》练习 求:(Ⅰ)年降雨量在) 200 , 100 [范围内的概率; (Ⅱ)年降雨量在) 150 , 100 [或) 300 , 250 [范围内的概率; (Ⅲ)年降雨量不在) 300 , 150 [范围内的概率; (Ⅳ)年降雨量在) 300 , 100 [范围内的概率. > · 2.高三某班40名学生的会考成绩全部在40分至100分 之间,现将成绩分成6段:) 50 , 40 [、) 60 , 50 [ 、) 70 , 60 [、 ) 80 , 70 [、) 90 , 80 [、] 100 , 90 [.据此绘制了如图所示的频率分布直方图。在这40名学生中, (Ⅰ)求成绩在区间) 90 , 80 [内的学生人数; (Ⅱ)从成绩大于等于80分的学生中随机选2名学生,求至少有1名学生成绩在区间] 100 , 90 [内的概率. " @

3.已知集合}1,1(},2,0,2{-=-=B A . ; (Ⅰ)若},|),{(B y A x y x M ∈∈=,用列举法表示集合M ; (Ⅱ)在(Ⅰ)中的集合M 内,随机取出一个元素),(y x ,求以),(y x 为坐标的点位于区 域D :?? ? ??-≥≤-+≥+-10202y y x y x 内的概率. . 4.某生物技术公司研制出一种新流感疫苗,为测试该疫苗的有效性(若疫苗有效的概率小于%90,则认为测试没有通过),公司选定2000个流感样本分成三组,测试结果如 A 组 B 组 C 组 ? 疫苗有效 673 x y 疫苗无效 77 90 z > 已知在全体样本中随机抽取1个,抽到B 组疫苗有效的概率是33.0. (Ⅰ)求x 的值; (Ⅱ)现用分层抽样的方法在全体样本中抽取360个测试结果,问C 组应抽取几个? (Ⅲ)已知465≥y ,30≥z ,求不能通过测试的概率.

高考数学概率与统计

高考数学概率与统计 SANY GROUP system office room 【SANYUA16H-

第16讲概率与统计 概率内容的新概念较多,相近概念容易混淆,本课时就学生易犯错误作如下归纳总结: 类型一“非等可能”与“等可能”混同 例1 掷两枚骰子,求所得的点数之和为6的概率. 错解掷两枚骰子出现的点数之和2,3,4,…,12共11种基本事件,所以概率为 P=1 11 剖析以上11种基本事件不是等可能的,如点数和2只有(1,1),而点数之和为6有(1,5)、(2,4)、(3,3)、(4,2)、(5,1)共5种.事实上,掷两枚骰子共有36 种基本事件,且是等可能的,所以“所得点数之和为6”的概率为P=5 36 . 类型二“互斥”与“对立”混同 例2 把红、黑、白、蓝4张纸牌随机地分给甲、乙、丙、丁4个人,每个人分得1张,事件“甲分得红牌”与“乙分得红牌”是() A.对立事件 B.不可能事件 C.互斥但不对立事件 D.以上均不对 错解A 剖析本题错误的原因在于把“互斥”与“对立”混同,二者的联系与区别主要体现在: (1)两事件对立,必定互斥,但互斥未必对立;(2)互斥概念适用于多个事件,但对 立概念只适用于两个事件;(3)两个事件互斥只表明这两个事件不能同时发生,即至多只能发生其中一个,但可以都不发生;而两事件对立则表示它们有且仅有一个发生. 事件“甲分得红牌”与“乙分得红牌”是不能同时发生的两个事件,这两个事件可能恰有一个发生,一个不发生,可能两个都不发生,所以应选C.

类型三 “互斥”与“独立”混同 例3 甲投篮命中率为O .8,乙投篮命中率为,每人投3次,两人恰好都命中2次的 概率是多少? 错解 设“甲恰好投中两次”为事件A ,“乙恰好投中两次”为事件B ,则两人都恰好投中 两次为事件A+B ,P(A+B)=P(A)+P(B): 22223 30.80.20.70.30.825c c ?+?= 剖析 本题错误的原因是把相互独立同时发生的事件当成互斥事件来考虑,将两人都恰 好投中2次理解为“甲恰好投中两次”与“乙恰好投中两次”的和.互斥事件是指 两个事件不可能同时发生;两事件相互独立是指一个事件的发生与否对另一个 事件发生与否没有影响,它们虽然都描绘了两个事件间的关系,但所描绘的关 系是根本不同. 解: 设“甲恰好投中两次”为事件A ,“乙恰好投中两次”为事件B ,且A ,B 相互独 立, 则两人都恰好投中两次为事件A·B ,于是P(A·B)=P(A)×P(B)= 类型四 “条件概率P(B / A)”与“积事件的概率P(A·B)”混同 例4 袋中有6个黄色、4个白色的乒乓球,作不放回抽样,每次任取一球,取2次, 求第二次才取到黄色球的概率. 错解 记“第一次取到白球”为事件A ,“第二次取到黄球”为事件B,”第二次才取到黄球” 为事件C,所以P(C)=P(B/A)=6293 =. 剖析 本题错误在于P(A ?B)与P(B/A)的含义没有弄清, P(A ?B)表示在样本空间S 中,A 与B 同时发生的概率;而P (B/A )表示在缩减的样本空间S A 中,作为条件的 A 已经发生的条件下事件 B 发生的概率。 解: P (C )= P(A ?B)=P (A )P (B/A )= 46410915 ?=. 备用

概率统计专题复习(文科)

概率、统计专题复习(文科) 例1.近年来,某市为了促进生活垃圾的分类处理,将生活垃圾分为厨余垃圾、可回收物和其 他垃圾三类,并分别设置了相应的垃圾箱,为调查居民生活垃圾分类投放情况,现随机抽取了该市三类垃圾箱中总计1000吨生活垃圾,数据统计如下(单位:吨): “厨余垃圾”箱 “可回收物”箱 “其他垃圾”箱 厨余垃圾 400 100 100 可回收物 30 240 30 其他垃圾 20 20 60 (1)试估计厨余垃圾投放正确的概率;(2)试估计生活垃圾投放错误的概率; (3)假设厨余垃圾在“厨余垃圾”箱、“可回收物”箱、“其他垃圾”箱的投放量分别为,,a b c ,其中0a >,600a b c ++=.当数据,,a b c 的方差2 S 最大时,写出,,a b c 的值(结论不要求证明),并求此时2 S 的值.(注:方差2222121[()()()]n s x x x x x x n =-+-++-,其 中x 为12,,n x x x 的平均数) 例2.从装有编号分别为a,b 的2个黄球和编号分别为 c,d 的2个红球的袋中无放回地摸球,每次任摸一球,求:(Ⅰ)第1次摸到黄球的概率;(Ⅱ)第2次摸到黄球的概率. 例3.一汽车厂生产A ,B ,C 三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表(单位:辆): 轿车A 轿车B 轿车C 舒适型 100 150 z 标准型 300 450 600 按类用分层抽样的方法在这个月生产的轿车中抽取50辆,其中有A 类轿车10辆. (1)求z 的值; (2)用分层抽样的方法在C 类轿车中抽取一个容量为5的样本.将该样本看成一个总体,从中任取2辆,求至少有1辆舒适型轿车的概率; (3)用随机抽样的方法从B 类舒适型轿车中抽取8辆,经检测它们的得分如下: 9.4,8.6,9.2,9.6,8.7,9.3,9.0,8.2,把这8辆轿车的得分看成一个总体,从中任取一个数,求该数与样本平均数之差的绝对值不超过0.5的概率.

高三数学概率统计知识点归纳

高三数学概率统计知识 点归纳 Company number:【WTUT-WT88Y-W8BBGB-BWYTT-19998】

概率统计知识点归纳 平均数、众数和中位数 平均数、众数和中位数.要描述一组数据的集中趋势,最重要也是最常见的方法就是用这“三数”来说明. 一、正确理解平均数、众数和中位数的概念 平均数平均数是反映一组数据的平均水平的特征数,反映一组数据的集中趋势.平均数的大小与一组数据里的每一个数据都有关系,任何一个数据的变化都会引起平均数的变化. 2.众数在一组数据中出现次数最多的数据叫做这一组数据的众数.一组数据中的众数有时不唯一.众数着眼于对各数出现的次数的考察,这就告诉我们在求一组数据的众数时,既不需要排列,又不需要计算,只要能找出样本中出现次数最多的那一个(或几个)数据就可以了.当一组数据中有数据多次重复出现时,它的众数也就是我们所要关心的一种集中趋势. 3.中位数中位数就是将一组数据按大小顺序排列后,处在最中间的一个数(或处在最中间的两个数的平均数).一组数据中的中位数是唯一的. 二、注意区别平均数、众数和中位数三者之间的关系 平均数、众数和中位数都是描述一组数据的集中趋势的量,但它们描述的角度和适用的范围又不尽相同.在具体问题中采用哪种量来描述一组数据的集中趋势,那得看数据的特点和要关注的问题. 三、能正确选用平均数、众数和中位数来解决实际问题 由于平均数、众数和中位数都是描述一组数据的集中趋势的量,所以利用平均数、众数和中位数可以来解决现实生活中的问题.

极差、方差、标准差 极差、方差和标准差都是用来研究一组数据的离散程度的,反映一组数据的波动范围或波动大小的量. 极差 一组数据中最大值与最小值的差叫做这组数据的极差,即极差=最大值-最小值.极差能够反映数据的变化范围,差是最简单的一种度量数据波动情况的量,它受极端值的影响较大. 二、方差 方差是反映一组数据的整体波动大小的特征的量.它是指一组数据中各个数据与这组数据的平均数的差的平方的平均数,它反映的是一组数据偏离平均值的情况.方差越大,数据的波动越大;方差越小,数据的波动越小. 求一组数据的方差可以简记先求平均,再求差,然后平方,最后求平均数.一组数据x1、x2、x3、…、xn 的平均数为x ,则该组数据方差的计算公式为: ])()()[(1222212x x x x x x n S n -++-+-= . 三、标准差 在计算方差的过程中,可以看出方差的数量单位与原数据的单位不一致,在实际的应用时常常将求出的方差再开平方,此时得到量为这组数据的标准差. 即标准差=方差. 四、极差、方差、标准差的关系 方差和标准差都是用来描述一组数据波动情况的量,常用来比较两组数据的波动大小.两组数据中极差大的那一组并不一定方差也大.在实际问题中有时用到标

相关文档
相关文档 最新文档