主题:【原创】我们学过的数理化——为什么要测量多次 -- 代码ABC
记得学生年代做实验的时候,实验手册总会要求我们对同一个量进行多次测量,然后取平均值,这也许是我们在实验中做得最慢不经心的动作了。我们知道这样可以消除误差,大部分人都简单地认为多次测量后误差可以相互抵消,所以就这么做了。这又是小学水平的想法。我们在大学学过的东西经常就是在这些不经意的想当然中被当作无用的垃圾遗忘,甚至都不知道自己错过了什么。
多次测量取平均值这个手段其实隐含着概率论一个很重要的定理——中心极限定理。这条定理推出的一个简单结论就是多次测量取平均值可以提高测量的准确度,更准确地说是减少测量出现大误差的概率。很有意思的是一个小学水平都能理解的动作居然需要一个这么复杂的定理来解释。真是吃饱了撑的,
然而如果我们钻牛角尖的学生问:为什么要重复测量10次?想偷懒的工人问少测5次行不行?不服气的手下问:你怎么肯定重复测量10次比重复测量5次准确度会高,到底高多少?你能回答吗?
中心极限定理告诉我们多个独立的同分布的随机变量之和的分布趋向正态分布。而且如果我们知道这些随机变量的均值和方差,我们还可以把这些随机变量之和(也是一个随机变量)的分布转化成标准正态分布。我们的测量由于存在各种不确定的干扰总会有一定的起伏,我们可以把测量值看成是一个确定的真实值和一个随机误差之和,由于我们不知道这个随机误差的分布,所以无法用简单的概率分布确认测量值准确性的概率。但是多次测量之后这些随机误差之和(均值也一样)会趋向于正态分布,这时候我们就可以计算出测量值偏离实际值的区间以及相对的概率——统计术语叫置信区间!
也就是说我们可以说这些经过若干次数的测量之后,测量值偏离真实值5%的概率是多少,偏离10%的概率是多少。这些指标和测量次数是相关的,也就是说反过来如果我们要求测量误差在5%以内的概率是99%以上的话,根据中心极限定理我们可以计算出满足这个需求的测量次数!在这里有一个问题就是随机误差的方差我们一开始是不知道的,不过通过多次测量一个已知量后我们可以实测数据估算。
注意中心极限定理的一个前提——要求这些随机变量是独立和同分布的,一般来说同分布在进行相同测量时基本是保证的。独立的要求则一般和测量操作有关,比方说我们用螺旋测微器测量长度时,测量一次之后必须松开测微器,换个地方再测就是确保两次测量之间的独立性。而我想许多工作手册中对测量操作的需求也会包含类似的需求,所以掌握这个定理可以让我们明白一些规章制度是怎么来的,进一步的我们可以根据实际情况改变操作的方法,这样我们就有机会从一个普通的操作人员升到更高的位置。
也许大家会发现我很喜欢“秀”概率知识,的确,概率是一门很有意思的数学。更主要的是概率也许是我们在日常工作中用到的最多的数学了。事实上,在科学发达技术进步的今天人们也有许多无法解释的事情,这些无法解释的东西以前我们把它们归结为神明的意志,而现在我们把它们当作随机变量来处理,用概率知识来分析。由于我们总逃不出概率的手掌心,我也乐意继续写写概率的内容。其实有关数理化我之前还有一篇我们学过的数理化——解释潮汐
概率是个好东西,可惜我没学好,现在更是基本都还给老师了。正好借这机会补补课~~~~
你买了一个股票,只有两种可能,上涨或下跌,这就是概率。你买的股票里面涨的比跌的多,你赚钱的几率就大,反之你输钱的几率就大。
这个赚与输的比例就是概率的表现。
老股民买的股票里面可能涨的比跌的多,而新股民则反过来,这也是实际对付概率事件的不同表现。
这里说提高精度没有问题,但是应该说多次测量无法减少出现误差的概率。误差是一定会有的。只能说在统计意义上减少测量估计值和真实值的偏差。或者换种说法:减少测量偏离真值x%以上的概率。
写到提高精确度(现改成准确度)的时候,我犹豫了好一阵子,因为想起抛硬币连续出现10次正面的情况。就加了后一句,不过到底还是少说了一个字,整个意思全变了。
如果非要说有关系,那这个也只是统计中用频率估计概率的思想,而概率论本身是不研究这个的,概率论本身是假定了概率的存在,更严格的,就要用测度的语言来说了。
说到误差,各种各样的“差”,平均绝对误差、均方根误差、标准差有什么区别?如何应用?
花谢先:)