如何正确认识生物统计结果

 我来答
帐号已注销
2023-01-08 · 超过35用户采纳过TA的回答
知道答主
回答量:1376
采纳率:93%
帮助的人:34万
展开全部
第一章绪论
1.生物统计学的内容:统计原理、统计方法和试验设计。
2.生物统计的作用:a.科学地整理分析数据;b.判断试验结果的可能性;c.确定事物之间的相互关系;d.提供试验设计的原理。
3.样本容量常记为n,通常把n≤30的样本称为小样本,n.>30的样本称为大样本。
4.名解:(重)①生物统计:生物统计是应用概率论和数据统计的原理和方法来研究生物界数量变化的学科;
②总体:是被研究对象的全体,据所含的个体的多少,总体分为有限总体和无限总体。
③样本:是指总体内随机抽取出来若干个体所组成的单位。
④随机误差:由于许多无法控制的内在和外在的偶然因素所造成的误差,内在如个体差异,外在如环境,它影响试验的精确性。
(了)①参数:从总体计算出来的数量特征值,它是一个真值,没有抽样变动的影响,一般用平均数u,标准差s。
②统计量:是从样本计算出来的数量特征值,它是参数的估计值,受样本变动的影响,一般用拉丁字母表示,如平均数。
③系统误差:主要是试验动物的初始条件不同,试验条件相差较大,仪器不准,标准试剂未经校正,药品批次不同,药品用量与种类不符合试验计划要求,以及观察,记录抄案,计算中的错误所引起的误差,它影响试验的准确性。
④准确性:指在试验或调查中某试验指标或形状的观测值与其真值接近的程度。
⑤精确性:指试验或调查中一试验指标或形状的重复观测值彼此接近的程度。
第二章资料的整理
1.统计资按性质分为:计量资料、次数资料和半定量资料。
2.计量资料是指用量测方式获得的数量性状资料,即用度、量、衡等计量工具直接测量获得的数量性状资料。计量资料整理的五步骤如下:
(1)求全距,即资料中最大值和最小值之差R=Max(x)—Min(x);
(2)确定组数即按样本大小而定;
样本含量与组数
样本含量 组数
30~60 6~8
60~100 8~10
100~200 10~12
200~500 12~17
500以上 17~30
(3)确定组距,每组最大值与最小值之差记为i ,公式:组距(i)=全距(R)/组数k ;(4)确定组中值及组限,各组的最大值和最小值称为组限,最小值为下限,最大值为上限,每组的中点值称为组中值,组中值=(下限+上限)/2=下限+组距/2=上限-组距/2;(5)归组划线计数,作次数分布表。
3.常用的五种统计图为长条图、圆图、线图、直方图、折线图,掌握直方图和折线图的绘制。
4.原始资料的检查核对主要进行下面三性的检查:①检查资料的完整性;②检查资料的正确性;③检查资料的精确性。
5大样本资料需整理成次数分布表。
第三章资料的统计描述
1.平均数包括以下五种算术平均数、中位数、众数、几何平均数及调和平均数。
2.用来度量资料变异程度的指标主要有极差、方差、标准差、变异系数。
3.平均数的基本性质是(1)样本各观测值与平均数之差的和为零,简述为离均差之和为;(2)样本各观测值与平均数之差的平方和为最小,简述为离均差平方和为最小。
4.10头母猪第一胎产仔数为9、8、7、10、12、10、11、14、8、9(头)计算10头母猪第一胎产仔数的平均数、中位数、标准差和变异系数。
解:①平均数Σx=9+8+7+10+12+10+11+14+8+9=98,n=10

②资料数据按小到大排列如:7、8、8、9、9、10、10、11、12、14
中位数
③标准差
④变异系数
第四章常用概率分布
1.事件概率具有以下性质:①对于任何事件A,有0≤P(A)≤1;②必然事件的概率为1,即P(Ω)=1:③不可能的事件概率为0,即P(Ø)=0。
2.(1)正态分布:若连续型随机变量X的概率分布密度函数为
其中 为平均数,σ2为方差,则称随机变量X服从正态分布,记为X~ 。相应的概率分布函数为
正态分布密度曲线为:
(2)标准正态分布::当μ=0、σ=l时,正态总体称为标准正态总体,其相应的函数表示式是,(-∞<x<+∞)
其相应的曲线称为标准曲线;.标准正态总体的概率问题:

对于标准正态总体N(0,1), 是总体取值小于 的概率,
即 ,
其中 ,图中阴影部分的面积表示为概率 只要有标准正态分布表即可查表解决.从图中不难发现:当 时, ;而当 时,Φ(0)=0.5;标准正态总体 在正态总体的研究中有非常重要的地位,为此专门制作了“标准正态分布表”.在这个表中,对应于 的值 是指总体取值小于 的概率,即 , .
若 ,则 .
利用标准正态分布表,可以求出标准正态总体在任意区间 内取值的概率,即直线 , 与正态曲线、x轴所围成的曲边梯形的面积 .
(3)有关概率计算的公式:
P(0≤u<u1)=Φ(u1)-0.5
P(u≥u1) =Φ(-u1)
P(|u|≥u1)=2Φ(-u1)
P(|u|<u1)=1-2Φ(-u1)
P(u1≤u<u2)=Φ(u2)-Φ(u1)
注:用曲线图和面积来理解记忆。
(4)关于标准正态分布要熟记下列几种常用概率:
P(-1≤u<1)=0.6826
P(-2≤u<2)=0.9545
P(-3≤u<3)=0.9973
P(-1.96≤u<1.96)=0.95
P (-2.58≤u<2.58)=0.99
(5)例:①已知u~N(0,1),试求: (1) P(u<-1.64)=? (2) P (u≥2.58)=? (3) P (|u|≥2.56)=? (4) P(0.34≤u<1.53) =?
利用(4-12)式,查附表1得:
(1) P(u<-1.64)=0.05050
(2) P (u≥2.58)=Φ(-2.58)=0.024940
(3) P (|u|≥2.56)=2Φ(-2.56)=2×0.005234=0.010468
(4) P (0.34≤u<1.53)=Φ(1.53)-Φ(0.34)=0.93669-0.6331=0.30389
②已知u~N(0,1)试求:
(1) P(u<- )+P(u≥ )=0.10的
(2) P(- ≤u< ﹚=0.86的
因为附表2中的α值是:

所以
(1) P(u<- )+ P(u≥ )=1- P(- ≤u< ﹚=0.10=α
由附表2查得: =1.644854
(2) P (- ≤u< )=0.86 ,α=1- P (- ≤u< )=1-0.86=0.14
由附表2查得: =1.475791
对于x~N(μ,σ2),只要将其转换为u~N(0,1),即可求得相应的双侧分位数。
③已知猪血红蛋白含量x服从正态分布N(14.52, ), 若P(x<1.1) =0.025, P(x> )=0.025,P(x< ) =0.005,P(x> )=0.005,求 , , , 。
由题意可知,α/2=0.025,α=0.05 又因为

P(x> )=
故 P(x< =+ P(x> )= P(u<- =+ P(u> )
=1- P(- 由附表2查得: =1.959964,所以
( -14.52)/1.68=-1.959964, ( -14.52)/1.68=1.959964
即 ≈11.23, ≈17.81。
同理 =2.575829,所以
( -14.52)/1.68=-2.575829, ( -14.52)/1.68=2.575829
即 ≈10.19, ≈18.85。
④已知猪血红蛋白含量x服从正态分布N(12.86, ), 若P(x< ) =0.03, P(x≥ )=0.03,求 , 。
由题意可知,α/2=0.03,α=0.06 又因为
P(x≥ )=
故 P(x< =+ P(x≥ )= P(u<- =+ P(u≥ )
=1- P(- ≤P< )=0.06=α
由附表2查得: =1.880794,所以
( -12.86)/1.33=-1.880794, ( -12.86)/1.33=1.880794
即 ≈10.36, ≈15.36。
3. ①双侧概率(重):把随机变量X落在平均数 左右标准差σ一定倍数区间之外的概率记作σ;②单侧概率:指所求得随机变量X小于平均数 左侧标准差σ一定倍数或大于平均数 右侧标准差σ一定倍数的概率记作σ/2。
第五章假设检验
1.显著性检验:就是指在对资料进行统计分析时,先提某一问题对样本所在总体的参数提出一个统计假设,然后根据从样本获得的统计量所服从的概率分布,对这一假设进行检验;其目的是主要是看样本是否来自于均数相同的总体即通过对样本的研究来对总体作出统计推断;检验的对象是在统计学中,是以样本平均数差异x1- x2的大小时样本所在的总样本平均数 1、 2是否相同作出推断。
2.为什么以样本均数作为检验对象呢?是因为样本平均数具有下述特性:
(1)离均差的平方和 (xi- )2最小。说明样本平均数与样本各个观测值最接近,平均数是资料的代表数。
(2)样本平均数是总体平均数的无偏估计值,即E( )= 。
(3)根据统计学中心极限定理,样本平均数 服从或逼近正态分布。
所以,以样本平均数作为检验对象,由两个样本平均数x1和x2的差异去推断样本所属总体平均数是否相同时有依据的。
3.(了) ①标准误(平均数抽样总体的标准差) 的大小反映样本平均数 的抽样误差的大小,即精确性的高低。标准误大,说明各样本平均数 间差异程度大,样本平均数的精确性低。反之, 小,说明 间的差异程度小,样本平均数的精确性高。 的大小与原总体的标准差σ成正比,与样本含量n的平方根成反比。从某特定总体抽样,因为σ是一常数,所以只有增大样本含量才能降低样本平均数 的抽样误差。在实际工作中,总体标准差σ往往是未知的,因而无法求得 。此时,可用样本标准差S估计σ。于是,以 估计 。记 为 ,称作样本标准误或均数标准误。②区别:样本标准差与样本标准误是既有联系又有区别的两个统计量, = 已表明了二者的联系。二者的区别在于:样本标准差S是反映样本中各观测值 , ,…, 变异程度大小的一个指标,它的大小说明了 对该样本代表性的强弱。样本标准误 是样本平均数 的标准差,它是 抽样误差的估计值, 其大小说明了样本间变异程度的大小及 精确性的高低。
4. ①小概率事件通常指发生的概率小于5%的事件,认为在一次试验中该事件是几乎不可能发生的。随机事件的概率表示了随机事件在一次试验中出现的可能性大小。若随机事件的概率很小,例如小于0.05、0.01、0.001,称之为小概率事件。小概率事件虽然不是不可能事件,但在一次试验中出现的可能性很小,不出现的可能性很大,以至于实际上可以看成是不可能发生的。在统计学上,把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理,亦称为小概率原理。小概率事件实际不可能性原理是统计学上进行假设检验(显著性检验)的基本依据。
②一统计资料进行统计推断判断的原则如下:
Ⅰ、当 < ,P>0.05 时,差异不显著,用“NS”表示,不能否H0 ;
Ⅱ、当 ≤ ≤ ,0.01< P <0.05时,差异显著,用“*”表示,接受HA,否定H0 ;
Ⅲ、当 ≥ ,P≤0.01时,差异极显著,用“**”表示,接受HA,否定H0 。
5.计算题:了解样本均数与总体均数的差异性显著检验及两样本均数的差异性显著检验;重点知道正态总体平均数 的置信区间。
例:①计算下列资料总体平均数的95%,99%置信区间,119、22、104、32、53、31、118、57、30、101、、58、48、68、70。
解:资料总体平均数的95%,99%置信区间
df=n-1=14-1=13,故 =2.160, =3.012
=65.0714 ,S=33.3293, 9.2431
所以⑴95%置信半径为 =19.9668
95%置信下限为 — =45.1046
95%置信上限为 — =85.0382
即该资料总体平均数u 的95%置信区间为45.1046≤u≤85.0382
⑵99%置信半径为 =27.8426
99%置信下限为 — =37.2288
99%置信上限为 — =92.9140
即该资料总体平均数u 的99%置信区间为37.2288≤u≤92.9140 。
②随机抽测了10只兔的直肠温度,其数据为:38.7、39.0、38.9、39.6、39.1、39.8、38.5、39.7、39.2、38.4℃。已知该品种兔直肠温度的总体平均数为 ℃,检验该样本平均数温度与 是否有显著性差异?
解:⑴提出无效假设与备择假设
H0 : =39.5,HA: <39.5
⑵计算t值 经计算得 =39.09,S=0.4909
t=( - )/ =-2.6411
⑶统计推断
由df=n-1=10-1=9,查附表得临界t值
=2.262 =3.250, <︱t︱< ,0.01< P < 0.05
否定H0,HA接受,表明样本平均数 与已知总体平均数 差异显著
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式