我试着把我的理解用通俗的语言表达出来。
1.为什么有统计学?就是因为我们没有办法穷尽所有的数据,只能从整体中取出部分,通过研究部分来推测整体。从部分推断整体,包含着
两个基本思想,一是带有概率性质的反证法,一是小概率事件。
2.所谓反证法是指,先建立两个命题,在假设检验中叫做假设(hypothesis),一个叫H0,表示原假设(null hypothesis),一个叫H1代表备择假设或对立假设(alternative hypothesis)。那怎么确定H0和H1呢?
思考的逻辑是:
为了检验H0是否正确,先假定它正确。
如果样本的观测值得出一个与H0应有的结果完全矛盾的结果,我们就“不能接受(拒绝)H0”,转而接受H1的假设。如果没有出现矛盾的结果,注意,这时我们不能断定“接受(不拒绝)H0",我们只能说,没有足够的证据证明H0是错误的,这时是不能肯定H0是一定正确的。这里有点绕,如果理解了这点,下面就好说了。出于以上的情况。H0,H1是不对等的,不能随意交换的。在一般情况下H0要取那个在实践中受到保护 、不证自明、要有足够的证据才能否定它的等等诸如此类的命题。我们把相等的、无差别的、等号成立的结论作为H0,将待证明的、不相等的、有差别的命题作为H1。所以在具体统计中的参数检验,H0一定是等于,H1则是大于、小于或者不相等。
用一个不是十分恰当的比喻,H0的设定就类似于审判中的无罪推定,法官审案的时候,总是先假设嫌疑人是一个无罪之人,然后看看检方的证据是否充分来推翻无罪的假设(H0),从而接受H1,判定嫌疑人有罪。如果找不到足够的证据来证明嫌疑人有罪,那只能接受H0(无罪),宣布嫌疑人清白,即使可能他真的犯了法。反之,我们不能一开始就假设一个嫌疑人有罪,那就乱了。
3.我们解释了H0的选定原则,那什么就叫“有足够的证据”,这就是统计推论的第二个原则:小概率事件。根据常识,在假定H0成立的情况下,小概率的事件几乎不会发生,如果发生了,很大的可能性就是H0的假设不成立。小概率小到多少,这就是“P值"干的活了。那有没有小概率发生了H0却是正确的误杀情况呢?当然有,这又是所谓的“α错误”和“β错误”了。这里不再罗嗦了。