【统计学】统计学基础
发布日期:2021-09-18 21:55:53
浏览次数:2
分类:技术文章
本文共 2319 字,大约阅读时间需要 7 分钟。
浅谈统计学
五种抽样方法:
1、简单随机:选取热量相同且每个样本有同等概率被选择的样本 2、系统:简单的系统抽取样本 3、任意:使用一个碰巧很容易被选择的样本 4、整群:先将总体分为不同组群,从中随机挑选几个组群作为样本 5、分层:定义层级,在每个层级随机抽取样本。 抽样方法的选择一定要符合: 1、只有样本对总体具有代表性,研究才有意义 2、有偏差的样本不可能是代表性样本 3、由于在实际选择样本时运气不好,即使是一个精心选择的样本也可能不具有代表性 总体:所研究的人或事物的完整集合 总体参数:总体中对某变量的概括性描述样本:总体的子集
原始样本:对样本进行实际测量或观测所收集的数据 样本统计量:描述从原始样本中筛选总结的样本特征的数据误差幅度:描述一个很可能包含总体参数的值域或置信区间
样本统计量 — 误差幅度 到 样本统计量 + 误差幅度 统计研究的两种基本类别: 1、观察研究中,调查者只是观察或测量主体的特征,并不影响或改变这些特性 2、实验研究中,调查者进行一些处理并观察其对实验个体的效果
统计测量
变量:可以变化或有不同取值的项目或者数量
目标变量:研究中所需要测量的项目或数量 解释变量:解释引起效果的变量 反应变量:反应解释变量变化程度的变量 混杂变量:不能确定特定变量的影响程度,导致混乱的变量(不同变量间存在混合影响,则存在混杂性。)观察研究的变量:
1、回顾性研究(个案对照研究):使用过去的数据 2、前瞻性研究(纵向研究):从拥有共同影响因素的组群中收集未来的观测数据实验组和对照组:
实验组:在实验中得到处理的群体 对照组:在实验中没有得到处理的群体选择实验组和对照组策略:
随机分组:确保实验主体被随机分为实验组和对照组 充分大的样本:确保实验组和对照组都是充分的大样本实验者效应:调查者和实验者通过某些因素影响研究对象
实验中的盲法:
单盲试验:参与者不知是实验组还是对照组成员,而实验者知道的实验 双盲实验:参与者和实验者不知自身是实验组还是对照组成员综合分析:调查者回顾以往数据,将其作为一个群体的研究。
批判性评估统计研究的八个原则:
(1)明确统计研究的目标、总体和类型。 (2)考虑来源。特别要注意研究人员自身的潜在偏差。 (3)注意样本偏差。检查抽样方法是否可以得到一个代表性样本。 (4)注意有关定义或度量目标变量的问题。变量的模糊性会给解释报告结果带来困难。 (5)注意混杂变量。如果研究中忽视潜在的混杂变量,所得结果可能是不可靠的 (6)考虑调查的问题设置和叙述。尤其要注意任何可能导致不精确或不真实回答的情况。 (7)确保结果被合理地呈现。例如,检查研究是否支撑在媒体上呈现的结论。 (8)客观地考虑结论。例如,评估研究是否达到预期目标。如果是,那么研究结论是否有意义并具有实际价值。 选择性偏差(或选择效应):是指研究人员以一种有偏方式选择样本而出现的偏差 参与性偏差:是指只要参与研究是自愿的就会出现的偏差。 自主选择调查(或自愿回答调查):是指人们自主决定是否参与的调查
数据类型:
定性(分类)数据:非数值类别 定量数据(离散+连续):数量或尺度的值
离散数据和连续数据
1、连续数据能够在给定的区间中取任一个值 2、离散数据能取特定的、个别的值,而不能取这些值之间的值。测量尺度:
1、定类测量:的数据仅仅是由名称、代号、类别组成的数据。定类测量的数据是定性数据,不能对其进行等级划分和排列。 2、定序测量:距用于可以按某一顺序进行排列(如从低到高排列)的定性数据。通常,对定序测量的数据进行计算是没有意义的。 3、定距测量:适用于间距有意义,而比例没有意义的定量数据。定距测量数据的零点是任意的。 4、定比测量:用于间距和比例都有意义的定量数据。定比测量数据的零点是确定的。数据类型和测量尺度的关系(图)
测量误差的两种类型:
1、随机误差:产生是由于测量过程中存在随机的以及固有的不可孤知的件 2、系统误差:的产生是由于测量系统存在间题,这个问题一直以相同的方式影响所有测量结果。 绝对误差和相对误差: 绝对误差:描述测量值与真实值之间的差距 绝对误差 = 测量值 - 真实值 相对误差:绝对误差的大小与真实值相比 相对误差 = 绝对误差 / 真实值 * 100%准确度和精确度:
准确度:描述了测量值与真实值的接近程度一个准确的测量值与真实值非常接近(接近通常被定义为有一个小的相对误差而不是绝对误差 精确度:描述了测量中数值的详细程度绝对变化和相对变化:
绝对变化:参考值到新值的实际增加或者减少 绝对变化 = 新值 - 参考值 相对变化: 绝对变化的大小与参考值之比 相对变化 = (新值 - 参考值)/ 参考值 *100%绝对差异和相对差异:
绝对差异:比较值与参考值之间的差异 绝对差异 = 比较值- 参考值 相对差异: 绝对差异的大小与参考值之比 相对差异 = (比较值 - 参考值)/ 参考值 *100%“是多少”与“多多少”(或“少多少”):
如果新值或比较值比参考值多P%,那么新值或比较值是参考值的(100+P)% 如果新值或比较值比参考值少P%,那么新值或比较值是参考值的(100-P)%。百分点与%:
当我们看到一个变化或差异用百分点表示的时候,可以假设这是绝对变化或绝对差异。如果是用百分数表示,很可能是相对变化或相对差异指数:
指数为比较不同时间、不同地点的测量值提供了一种简单的方法。必须选择某一时间(或地点)的数值为参考值(或基础值),其他时间(或地点)的指数是: 指数 = 数值/参考值 * 100%转载地址:https://blog.csdn.net/ChenVast/article/details/83270715 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!
发表评论
最新留言
网站不错 人气很旺了 加油
[***.192.178.218]2024年04月03日 18时53分27秒
关于作者
喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!
推荐文章
merge语句导致的CPU使用率过高的优化(r7笔记第4天)
2019-04-27
学习笔记600天总结(r7笔记第8天)
2019-04-27
备库归档删除策略失效的问题分析 (r7笔记第6天)
2019-04-27
merge语句导致的CPU使用率过高的优化(二) (r7笔记第9天)
2019-04-27
Oracle 12c PDB浅析(r9笔记第10天)
2019-04-27
DBA和开发同事的代沟(二)(r7笔记第18天)
2019-04-27
一个简单的MySQL参数导致的连接问题解惑(r7笔记第33天)
2019-04-27
DBA和开发同事的一些代沟(四) (r7笔记第36天)
2019-04-27
论oracle备库的设计方案(r7笔记第38天)
2019-04-27
物化视图相关的性能改进 (r7笔记第58天)
2019-04-27
ACOUG年会归来(r7笔记第59天)
2019-04-27
一次归档报错的处理和分析(r7笔记第60天)
2019-04-27
物化视图自动刷新的碰壁(r7笔记第61天)
2019-04-27
关于几个MySQL环境问题的对比 (r7笔记第66天)
2019-04-27
11g备库搭建碰到自己给自己埋的坑(r7笔记第63天)
2019-04-27
由一条报警信息发现的一系列问题(r7笔记第67天)
2019-04-27
一个清理和查询都要兼顾的简单方案(r7笔记第68天)
2019-04-27
一则备库CPU报警的思考(r7笔记第69天)
2019-04-27