关注公众号的朋友都知道郑老师我之前连续4年开设了“30天学会医学统计学”从理论到实操一步一步教会大家统计学、SPSS课程。2026年我们对这门课程进行全新升级课程时间大幅度缩短内容大幅度提升我称为9天实用医学统计学公益训练营。课程介绍“9天实用医学统计学”公益训练营即将启动更高效、更高级的统计课本课程是浙江中医药大学医学统计学教研室的公益、免费公开视频课不是骗人入坑收费的广告。本课程公益视频课定期开课欢迎您参与学习。欢迎报名本公众号“医学论文与统计分析”后台回复“报名”加入微信学习群吧。Day 2-2 统计学基本过程今天继续讲解统计分析的基本过程。在介绍统计分析基本过程时会讲解每个过程常用的方法。将传统医学教科书中的常用假设检验方法浓缩成一节希望大家能够消化吸收。统计学的基本过程三个步骤统计分析的基本过程可以分为三个步骤。第一步叫做“说现象”即进行统计描述--描述研究对象的特征例如社会人口学特征、疾病一般特征等。第二步叫做“比差异”--差异是统计分析的重要思维和目的。我们会比较不同人群之间的特征差异例如男性和女性、不同年龄、不同组别如不同暴露的结果差异。开展研究时总有一个指标需要比较其在人群之间的分布和差异。第三步叫做“找关联”--从关联性的角度分析变量与变量之间是否有关系。一般情况下会借助统计模型回归模型是常见的选择用于探讨影响因素、控制混杂偏倚、构建预测模型。这三块内容在课程体系中都会讲到。统计描述说现象统计描述包括三点。第一如果数据呈正态或近似正态分布中间多、两边少用均数加减标准差来描述。第二如果数据呈明显偏态分布或分布未知用中位数和四分位数间距来描述。均数和中位数用于描述数据的集中趋势主要集中位置标准差和四分位距用于描述数据的离散程度变异大小。均数与标准差是固定组合中位数与四分位数间距也是固定组合。第三对于分类变量用绝对数绝对数量和相对数率、构成比来描述。通过直方图我们可以直观判断数据的分布情况。例如在下面的直方图中右侧的正态分布数据呈现中间多、两边少的特征直方图中的长方形代表个体数。左侧是偏态分布例如我们在统计住院天数时大多数在10天以内但少数个体住院天数非常长30天、60天存在极大值数据就会呈现偏态的样式。√表一研究对象的基本特征在数据分析时通常会绘制一张表在论文中称为“表一”即研究对象的基本特征表。可以描述整个人群的特征也可以分组描述。例如病例组和对照组的年龄通常用均数加减标准差表示。甲胎蛋白与癌症相关数据呈偏态分布不能用均数加减标准差而应用中位数和四分位数间距。四分位数间距IQR是将数据分为四等份Q1为下四分位数25%百分位数Q3为上四分位数75%百分位数IQR即Q3与Q1的差值。对于分类数据如性别用绝对数和相对数构成比描述数据分布。统计描述是分析报告中最基础也最必要的工作。不描述样本信息就无法猜测总体参数。输差异性分析比差过程二是比较基本的统计分析方法——差异性分析。差异性是统计分析经常进行的内容用于比较两组或多组的均数、率、构成比是否有差异方法包括t检验、F检验、卡方检验、秩和检验、log rank检验等。通常情况下我们会结合P值下结论当P值≤0.05时认为总体参数有统计学差异当P值0.05时还不能认为有差异。√t检验两组正态数据均数比较t检验用于两组正态分布数据的总体均数比较分为两个场景。独立分组个体之间没有关系例如随机化分组或自然成组男性和女性是独立人群干预组和对照组是独立群体。两个独立群体之间的总体均数比较称为成组两样本t检验。不独立配对两组数据之间存在配对关系称为配对t检验。例如10对双胞胎每对中的一个分配到甲组、另一个分配到乙组两组数据配在一起属于非独立性数据需用配对t检验。案例两种镇痛方式的比较我们用上一节提到的案例来举例。例如两组手术病人随机分为两组采用不同的镇痛方式观察24小时后血清中白介素6水平是否有差别。从下表中可以得出两组均数呈正态分布所以采用成组两样本t检验。t检验用于两组数据总体均数的比较若P值≤0.05则认为两组总体均数有统计学差异。√方差分析多组正态数据均数比较方差分析F检验用于多组独立定量正态分布数据的总体均数比较。例如120名病人随机分为A、B、C三组有三个样本均数需要比较总体均数总体上是否有差别。三组不能用t检验而应用方差分析F检验。这里介绍的是独立性方差分析不独立的多因素方差分析暂不展开。√秩和检验偏态数据的分析秩和检验用于两组或多组偏态数据的比较是t检验和方差分析的重要补充。t检验用于两组正态数据方差分析用于多组正态数据偏态数据则用秩和检验。秩和检验不再比较总体均数而是比较总体分布位置的差异性。偏态数据不再用均数反映而是比较分布位置平均位置。案例两种镇痛方式的比较还是之前那个案例只不过换个情形。研究目的相同两组手术病人随机分为两组采用不同的镇痛方式观察24小时后血清中白介素6水平是否有差别。比较两组术后血清白介素6水平用均数±标准差描述但标准差非常大甚至大于均数。当观察值均为正值时标准差大于均数通常提示数据存在极端值、呈偏态分布。此时独立、定量、严重偏态的资料应用成组两样本秩和检验。√卡方检验与Fisher确切概率法分类数据的比较分类数据用卡方检验或Fisher确切概率法。两组率和两组构成比的比较、多组率和多组构成比的比较常用卡方检验。Fisher确切概率法是极端条件下的补充适用于样本量较小或卡方检验条件不满足时。卡方检验要求理论频数不能过小当理论频数较小时需用Fisher确切概率法。例如两组病人随机分为两组采用两种药物治疗结局指标为有效/无效数据汇总为四格表。试验组40人对照组36人分为有效和无效计算每组有效率比较两组率用卡方检验。√秩和检验等级资料的比较有些数据是多分类且有序的等级资料。例如两组病人采用两种药物治疗疗效分为显效、有效、无效三个等级比较两组疗效差异时应用秩和检验两组秩和或多组秩和。等级资料的程度比较不用卡方而用秩和检验。√小结四种基本差异性方法以上是常见的差异性比较方法t检验、方差分析、卡方检验、秩和检验。这些方法并非绝对但对零基础学员来说是基本且合适的处理手段。不建议将100%的应用场景全部列出那样反而不利于学习。掌握这四种基本方法即可t检验用于两组均数比较方差分析用于多组均数比较偏态资料和等级资料用秩和检验分类数据用卡方检验或Fisher确切概率法。最后提醒要学习本推文的完全对应的课程视频请发送关键词“报名”至公众号加入高校公益免费课程群来学习吧。关于郑老师团队及公众号全国较大的医学统计服务平台专注于医学生、医护工作者学术研究统计支持郑老师团队可以提供诸多统计支持各式统计课程、临床试验设计构建预测模型与真实世界研究“双库”保发表训练营、医学数据库挖掘详情联系助教小董咨询微信号aq566665
医学研究的常用统计学方法【9天实用统计学公益训练营(Day2-2】
关注公众号的朋友都知道郑老师我之前连续4年开设了“30天学会医学统计学”从理论到实操一步一步教会大家统计学、SPSS课程。2026年我们对这门课程进行全新升级课程时间大幅度缩短内容大幅度提升我称为9天实用医学统计学公益训练营。课程介绍“9天实用医学统计学”公益训练营即将启动更高效、更高级的统计课本课程是浙江中医药大学医学统计学教研室的公益、免费公开视频课不是骗人入坑收费的广告。本课程公益视频课定期开课欢迎您参与学习。欢迎报名本公众号“医学论文与统计分析”后台回复“报名”加入微信学习群吧。Day 2-2 统计学基本过程今天继续讲解统计分析的基本过程。在介绍统计分析基本过程时会讲解每个过程常用的方法。将传统医学教科书中的常用假设检验方法浓缩成一节希望大家能够消化吸收。统计学的基本过程三个步骤统计分析的基本过程可以分为三个步骤。第一步叫做“说现象”即进行统计描述--描述研究对象的特征例如社会人口学特征、疾病一般特征等。第二步叫做“比差异”--差异是统计分析的重要思维和目的。我们会比较不同人群之间的特征差异例如男性和女性、不同年龄、不同组别如不同暴露的结果差异。开展研究时总有一个指标需要比较其在人群之间的分布和差异。第三步叫做“找关联”--从关联性的角度分析变量与变量之间是否有关系。一般情况下会借助统计模型回归模型是常见的选择用于探讨影响因素、控制混杂偏倚、构建预测模型。这三块内容在课程体系中都会讲到。统计描述说现象统计描述包括三点。第一如果数据呈正态或近似正态分布中间多、两边少用均数加减标准差来描述。第二如果数据呈明显偏态分布或分布未知用中位数和四分位数间距来描述。均数和中位数用于描述数据的集中趋势主要集中位置标准差和四分位距用于描述数据的离散程度变异大小。均数与标准差是固定组合中位数与四分位数间距也是固定组合。第三对于分类变量用绝对数绝对数量和相对数率、构成比来描述。通过直方图我们可以直观判断数据的分布情况。例如在下面的直方图中右侧的正态分布数据呈现中间多、两边少的特征直方图中的长方形代表个体数。左侧是偏态分布例如我们在统计住院天数时大多数在10天以内但少数个体住院天数非常长30天、60天存在极大值数据就会呈现偏态的样式。√表一研究对象的基本特征在数据分析时通常会绘制一张表在论文中称为“表一”即研究对象的基本特征表。可以描述整个人群的特征也可以分组描述。例如病例组和对照组的年龄通常用均数加减标准差表示。甲胎蛋白与癌症相关数据呈偏态分布不能用均数加减标准差而应用中位数和四分位数间距。四分位数间距IQR是将数据分为四等份Q1为下四分位数25%百分位数Q3为上四分位数75%百分位数IQR即Q3与Q1的差值。对于分类数据如性别用绝对数和相对数构成比描述数据分布。统计描述是分析报告中最基础也最必要的工作。不描述样本信息就无法猜测总体参数。输差异性分析比差过程二是比较基本的统计分析方法——差异性分析。差异性是统计分析经常进行的内容用于比较两组或多组的均数、率、构成比是否有差异方法包括t检验、F检验、卡方检验、秩和检验、log rank检验等。通常情况下我们会结合P值下结论当P值≤0.05时认为总体参数有统计学差异当P值0.05时还不能认为有差异。√t检验两组正态数据均数比较t检验用于两组正态分布数据的总体均数比较分为两个场景。独立分组个体之间没有关系例如随机化分组或自然成组男性和女性是独立人群干预组和对照组是独立群体。两个独立群体之间的总体均数比较称为成组两样本t检验。不独立配对两组数据之间存在配对关系称为配对t检验。例如10对双胞胎每对中的一个分配到甲组、另一个分配到乙组两组数据配在一起属于非独立性数据需用配对t检验。案例两种镇痛方式的比较我们用上一节提到的案例来举例。例如两组手术病人随机分为两组采用不同的镇痛方式观察24小时后血清中白介素6水平是否有差别。从下表中可以得出两组均数呈正态分布所以采用成组两样本t检验。t检验用于两组数据总体均数的比较若P值≤0.05则认为两组总体均数有统计学差异。√方差分析多组正态数据均数比较方差分析F检验用于多组独立定量正态分布数据的总体均数比较。例如120名病人随机分为A、B、C三组有三个样本均数需要比较总体均数总体上是否有差别。三组不能用t检验而应用方差分析F检验。这里介绍的是独立性方差分析不独立的多因素方差分析暂不展开。√秩和检验偏态数据的分析秩和检验用于两组或多组偏态数据的比较是t检验和方差分析的重要补充。t检验用于两组正态数据方差分析用于多组正态数据偏态数据则用秩和检验。秩和检验不再比较总体均数而是比较总体分布位置的差异性。偏态数据不再用均数反映而是比较分布位置平均位置。案例两种镇痛方式的比较还是之前那个案例只不过换个情形。研究目的相同两组手术病人随机分为两组采用不同的镇痛方式观察24小时后血清中白介素6水平是否有差别。比较两组术后血清白介素6水平用均数±标准差描述但标准差非常大甚至大于均数。当观察值均为正值时标准差大于均数通常提示数据存在极端值、呈偏态分布。此时独立、定量、严重偏态的资料应用成组两样本秩和检验。√卡方检验与Fisher确切概率法分类数据的比较分类数据用卡方检验或Fisher确切概率法。两组率和两组构成比的比较、多组率和多组构成比的比较常用卡方检验。Fisher确切概率法是极端条件下的补充适用于样本量较小或卡方检验条件不满足时。卡方检验要求理论频数不能过小当理论频数较小时需用Fisher确切概率法。例如两组病人随机分为两组采用两种药物治疗结局指标为有效/无效数据汇总为四格表。试验组40人对照组36人分为有效和无效计算每组有效率比较两组率用卡方检验。√秩和检验等级资料的比较有些数据是多分类且有序的等级资料。例如两组病人采用两种药物治疗疗效分为显效、有效、无效三个等级比较两组疗效差异时应用秩和检验两组秩和或多组秩和。等级资料的程度比较不用卡方而用秩和检验。√小结四种基本差异性方法以上是常见的差异性比较方法t检验、方差分析、卡方检验、秩和检验。这些方法并非绝对但对零基础学员来说是基本且合适的处理手段。不建议将100%的应用场景全部列出那样反而不利于学习。掌握这四种基本方法即可t检验用于两组均数比较方差分析用于多组均数比较偏态资料和等级资料用秩和检验分类数据用卡方检验或Fisher确切概率法。最后提醒要学习本推文的完全对应的课程视频请发送关键词“报名”至公众号加入高校公益免费课程群来学习吧。关于郑老师团队及公众号全国较大的医学统计服务平台专注于医学生、医护工作者学术研究统计支持郑老师团队可以提供诸多统计支持各式统计课程、临床试验设计构建预测模型与真实世界研究“双库”保发表训练营、医学数据库挖掘详情联系助教小董咨询微信号aq566665