拙计了,标准差该怎么算?
eifheowvd2012/09/09数学 IP:广东
1.png    2.png


如图,数学课本上就是这么说的,但是上下两个式子算出来结果明显是不同的,标准差的定义是“
各数据偏离平均数的距离的平均数”,明显是第一个式子比较符合定义啊[s:255]
来自:数理化 / 数学
7
已屏蔽 原因:{{ notice.reason }}已屏蔽
{{notice.noticeContent}}
~~空空如也
laji3865689
12年5个月前 IP:未同步
456029
对啊,就是因为绝对值不方便所以标准差改了定义。
数学这东西是不能讲究所以然的,知其当然即可
引用
评论
加载评论中,请稍候...
200字以内,仅用于支线交流,主线讨论请采用回复功能。
折叠评论
4king
12年5个月前 IP:未同步
456037
我怎么觉得第二个算起来更麻烦
引用
评论
加载评论中,请稍候...
200字以内,仅用于支线交流,主线讨论请采用回复功能。
折叠评论
js3322
12年2个月前 IP:未同步
483841
楼主的上述所谓标准差的定义是不准确的,是对标准差定义的误解。严格来说,上述两个全都不是标准差的定义。
引用
评论
加载评论中,请稍候...
200字以内,仅用于支线交流,主线讨论请采用回复功能。
折叠评论
云中子3529
7年8个月前 修改于 7年8个月前 IP:安徽
834134
讲道理的话……使用样本标准差的确是为了计算方便
方差或者绝对距离都是一个标准,这个标准越小,说明我们丧失的信息就越少(比如,方差=0,我们得知,我们的全部数据都是样本平均值,于是我们没有数据的损失)
之后就是统计的范畴,最小化这个标准

而最小化,在绝大多数人的眼中,就是求导
计算机对标准差(或者,方差)求导,轻而易举
对绝对值求导……计算机表示自己只想返回一个mmp

有了导数就可以做优化,就可以做各种花哨的计算
……BTW……才发现这个帖子好老好老

讲道理的话……正确的说法其实是这样的:
方差:找到一个\(\dot{x}\)使得\(f(\dot{x})\)最小,\(f(\dot{x})=\sum_{i=1}^n(x-\dot{x})^2\)
于是我们可以推算出\(\dot{x}\)为样本平均值,哪怕有1000000个数据,我们雇佣1000个人,每一个人处理1000次加法运算,之后你再把这1000个结果相加,而后求平均值,无论如何我们也是可以算的。
送计算机,均值只要算1000000次加法,方差无外乎多1000000次乘法,都是可以在1秒之内搞定的事情。

然后,平均距离……其实这个量给错了
仿照方差的定义,平均距离应该是:
找到一个\(\dot{x}\)使得\(f(\dot{x})\)最小,\(f(\dot{x})=\sum_{i=1}^n|x-\dot{x}|\)
于是我们得到\(\dot{x}\)……并没有显式表达,这就是为什么用方差的原因
引用
评论
1
加载评论中,请稍候...
200字以内,仅用于支线交流,主线讨论请采用回复功能。
折叠评论
acmilan
7年8个月前 修改于 7年8个月前 IP:四川
834330
绝对值就是平方的算术平方根,所以平均差在目前先进的计算机里并不存在计算麻烦的问题。
但是你要考虑到统计学是在没有目前先进的计算机的情况下发明的。使用方差和标准差的主要原因:以前算绝对值需要一堆if-else,不美观且低效;算平方根则非常麻烦,有的计算机连fpu都没有,算平方根是非常慢的,提出来只算一次更快。
另外标准差的表达式可以看成是n维空间中(样本1,样本2,...,样本n)和(平均值,平均值,...,平均值)这两个点之间直线距离除以(1,1,...,1)和(0,0,...,0)之间的直线距离,比较符合数学家的审美观。
引用
评论
加载评论中,请稍候...
200字以内,仅用于支线交流,主线讨论请采用回复功能。
折叠评论
量子隧道
7年8个月前 IP:北京
834386
引用 acmilan:
绝对值就是平方的算术平方根,所以平均差在目前先进的计算机里并不存在计算麻烦的问题。
但是你要考虑到统计学是在没有目前先进的计算机的情况下发明的。使用方差和标准差的主要原因:以前算绝对值需要一堆if-e……
是的,就是N维空间里的欧几里得距离。
引用
评论
加载评论中,请稍候...
200字以内,仅用于支线交流,主线讨论请采用回复功能。
折叠评论

想参与大家的讨论?现在就 登录 或者 注册

所属专业
上级专业
同级专业
插入公式
评论控制
加载中...
文号:{{pid}}
投诉或举报
加载中...
{{tip}}
请选择违规类型:
{{reason.type}}

空空如也

加载中...
详情
详情
推送到专栏从专栏移除
设为匿名取消匿名
查看作者
回复
只看作者
加入收藏取消收藏
收藏
取消收藏
折叠回复
置顶取消置顶
评学术分
鼓励
设为精选取消精选
管理提醒
编辑
通过审核
评论控制
退修或删除
历史版本
违规记录
投诉或举报
加入黑名单移除黑名单
查看IP
{{format('YYYY/MM/DD HH:mm:ss', toc)}}