当前位置:首页 > 百科知识 > 正文

excel标准差该用哪个(Excel标准差是哪个公式)

excel标准差该用哪个(Excel标准差是哪个公式)

什么是SD?

标准差(SD)量化可变性或分散性,并以与数据相同的单位表示。

什么是标准差?

通过几个问题,一定要理解标准差的概念。

Q1:如果数据是分布式的,如何解释SD?

如果数据是从高斯分布组中抽样的,则平均值的68%是预期值,95%的值是两个SDS的平均值。该图显示了从高斯分布组获得的250个值。阴影区覆盖了平均值的正负SD,包括约三分之二的数值。根据两个标准差的平均值画一条虚线,其中约95%的值在这些范围内。

下图显示了标准差和高斯分布之间的关系。底部概率分布代表整个组,所以部分概率分布是组的一部分。左图中,绿色(阴影)部分低于SD平均值,高于SD平均值。绿色区域占总面积的68%,因此略多于三分之二的值被添加到SD区间。图表的右侧显示大约95%的值在平均值的两个标准偏差内。

如果Q2数据不服从高斯分布,如何解释SD?

下图显示了三组数据,它们都具有相同的和SD。左侧样本大致为高斯分布。另外两个样本远离高斯分布,但具有完全相同的平均值(100)和标准差(35)。

该图表表明,如果假设数据服务来自高斯分布,则该假设是不正确的,并且当以传统方式解释平均值和SD时,平均值可能会产生误导。

SD仍然可以不用思考它不假设服从高斯分布来解释。即使数据不是从高斯分布组中采样的,斯诺定理也应该被占用:

至少75%的值必须在平均值的两个标准偏差内,至少89%的值必须在三个标准偏差内。Q3如何报告标准差?

很多人报告的平均值和标准差如下:“11510 mmhg”,在“方法”一节有一个脚注或声明,将第二个值定义为标准差。

有人(1 *,2 *)说标准差既然是量化的单值,就不应该跟加号/减号,应该按以下方式使用:“115 mmhg(SD 10)”。

*资源:

[1] Curran-Everett D和Benos D .美国生理学杂志发表的统计报告。AJP-胃肠和肝脏生理学。2004年8月1日;287(2):G307

[2] Ludbrook J .临床和实验药理学和生理学的统计介绍。《临床实验药物生理学》。2008年10月1日;35(10):1271 - 4;作者回复1274

棱镜如何计算标准偏差?

首先我们来看看SD是怎么计算的。

计算每个值与样本平均值之间的平方;将这些值相加;总和除以n-1。它叫做方差;开根,求标准差;这是一个基本的计算方法。接下来,我们会看到你可能会有一些问题。

Q1“为什么是n-1?”

为什么在n-1(不是n)的第三步?在步骤1中,计算每个值与这些值的平均值之间的差值。你不知道群体的实际平均值,只知道样本的平均值。除了罕见的总体平均,数据会更接近样本平均,数据会比实际总体平均更接近样本平均。因此,在步骤2中计算的值可以小于使用实际总体平均值(不大)时的值。为了弥补这一点,我们除了n-1,而不是n。

但是为什么要用n-1呢?如果知道样本的平均值,以及除值以外的所有值,也可以计算出最终值必须是多少。统计数据呈现N-1个自由度。

Q2“但我看到方程的断裂是N,而不是n-1?”

用N-1方程分析数据样本,希望能得到更接近一般结论的常见情况。以这种方式计算的SD(分母为N-1)是对总人口SD值的最佳猜测。

如果你只想量化一组特定数据的变化,而不是被推而得出更广泛的结论,请用n来计算分母中的SD。得到的SD就是这些具体值的SD,但是可能会低估这些数值点的SD来提取组。

科学永远是普适的,所以在分析科学数据的时候,不应该在方程的分支中使用N。我可以认为,在分母中使用n(不是n-1)的唯一例子是量化考试成绩之间的差异。但是更好的方法是显示每个分数的散点图,或者频率分布的直方图。

棱镜总是用n-1来计算SD。

Q3“计算SD需要多少个值?”

SD量化是从色散量化的,所以只有一个值。所以这两个值还不够?很多人认为SD不能只用两个值来计算。实际上,当你只有重复数据(n=2)时,也可以正确计算SD方程。

你在乎什么?这样的结果真的有效吗?

我们可以用模拟来回答这个问题。我们模拟了N=2的10,000个数据集,每个数据点都是从高斯分布中选取的。因为所有的统计测试实际上都是基于差异(SD平方),所以我将重复数据计算出的方差与真实方差进行比较。模拟数据的平均方程的平均值之差不超过1%。这意味着从重复数据计算的SD是对数据分散性的有效评估。它可能太高或太低,但它可能离真正的标清很远。

Q4“如何用Excel计算SD?”

Excel可以使用STDEV()函数从一组值中计算SD。例如,如果您想知道单元格B1-B10中的值的标准差,请在Excel中使用以下公式:

kquote >

= stdev(b1:b10)

该函数在分母中使用N - 1来计算SD。如果要在分母中使用n来计算SD(请参阅上面),请使用Excel的STDevp()函数。

Q5“SE和SEM是一回事?”

不是问题!

标准偏差(SD)与平均标准误差(SEM)之间的差异很容易混淆。主要区别是:

SD之间的差异量量量量量量化了分散值之间的差异;

SEM量化了您对整体实际平均水平的理解。它考虑了SD的价值和样本量;

SD和SEM都是同一单元 - 数据单位;

根据定义,SEM总是小于SD;

当样本变大时,SEM很小。这是有道理的,因为大型样本的平均值可能比小样本的平均值更接近真正的整体平均值。在一个巨大的样本中,即使数据非常分散,您也可以非常准确地了解平均值。

当您获得更多数据时,SD没有可预测的更改。从样本计算的SD是总体SD的最佳估计。当您收集更多数据时,您将更准确地评估整体SD。但是,您无法预测来自大型样品的SDS是否大于或小于小样本。 (严格来说,这是不正确的。这是一个方差 - SD广场 - 没有可预测的变化,但SD的变化可以忽略不计,而且它比SEM的变化小得多)

注意:对于您,您可以根据数据计算任何参数,可以计算标准错误,而不仅仅是平均值。 “标准错误”这个词有一些允许两个。上面的点是指平均值的标准误差。

|| 推荐的 [中国喜欢]

GraphPad Prism Statistics教程|娱乐间隔(3)

GraphPad Prism 9新功能详细说明

CN官方网站www.graphpad-prism.cn