统计学的基本概念有哪些?
统计学中的基本概念介绍如下:
1.变异(variation):是社会和生物医学中的普遍现象。
2.总体(population):根据研究目的确定的同质研究对象的全体(集合)。分有限总体与无限总体。
3.样本(sample):从总体中随机抽取的部分研究对象。
4.随机抽样(random sampling):为了保证样本的可靠性和代表性,需要采用随机的方法抽取样本(在总体中每个个体具有相同的机会被抽到)。
5.参数(parameter):总体的统计指标,如总体均数、标准差,采用希腊字母分别记为μ、σ。固定的常数。
6.统计量(statistic):样本的统计指标,如样本均数、标准差,采用拉丁字母分别记为 s。 参数附近波动的随机变量 。
7.频率(frequency):样本的实际发生率称为频率。设在相同条件下,独立重复进行n次试验,事件A出现f 次,则事件A出现的频率为f/n。
8.概率(probability):随机事件发生的可能性大小,用大写的P 表示;取值[0,1]。
9.小概率事件:P ≤ 0.05(5%)或P ≤ 0.01(1%)称为小概率事件(习惯),统计学上认为不大可能发生。
10.随机误差 (random error):随机误差受测量精确度限制,重复测量获得的实际测量值往往并不能稳定在同一值,而是无方向性地围绕某一个数值左右波动,这种误差称为随机误差 。
11.系统误差 (systematic error):也叫偏倚(bias) , 是测量仪器或人为因素等导致的实际测量值与真实值之差。
12.准确度(accuracy)或真实性(validity):观察值与真值的接近程度,受系统误差的影响(常用指标:如灵敏度、特异度)。
13.可靠度(reliabiliy):也称精密度(precision)或重复性(repeatability) :重复观察时观察值与其均值的接近程度,受随机误差的影响(常用指标:一致百分率、Kappa值)。
14.相关系数(correlation coefficient):又称Pearson积差相关系数,用来说明具有直线关系的两变量间相关的密切程度与相关方向。相关系数没有单位,其值为-1 r 1。r值为正表示正相关,r值为负表示负相关,r的绝对值等于1为完全相关,r=0为零相关。
15.决定系数(coefficient of determination) :回归平方和与总平方和之比。取值在0到1之间且无单位,其数值大小反映了回归贡献的相对程度,也就是在Y的总变异中回归关系所能解释的百分比。