统计与概率1 古典概率


统计与概率1 古典概率

概率的一个定义是一件事发生的一个情况的几率. 也可以表示成$f(\Omega, \omega, \varrho)$

古典概率研究的是比较简单的情况, 例如硬币,骰子, 扑克的排列组合. 难度其实也只是低等数学水平, 排列组合问题小学应该就有了. 从常见的问题引入很容易理解, 但是直接看公式可能反而不懂了.

概率的定义和常见错误

当我们谈概率的时候, 例如A城市今年雾霾的几率是30%. 概率的定义是什么,

概率是一件事发生的可能性大小, 但是显然会存在误差. 只有在无限次重复下才会接近, 这是现代的一个定义.

古典概率下因为研究的是硬币, 骰子投掷这类问题, 在没有其他因素下, 完全可以确定一件事情的发生几率.现代概率学研究如人获得某疾病的几率 则需要大量重复的事件来计算.

谈概率当然不能离开事, 在数学定义概率需要 事件的集合$\Omega$ 和概率函数$\rho$ . $\rho$ 给定条件得到发生的几率.

用上面的例子 事件的集合就是 A城市今年每天的天气. $\rho(天气=雾霾) = 0.3$

如果给定两个条件, 就被称为联合概率. 例如 $\rho(天气=雾霾, 日期=星期日)$ . 也就是两件事同时发生的概率.

如果将一个条件作为前提, 则是条件概率 例如$p(天气=雾霾 | 日期=星期天)$ . 也就是发生了第一件事后, 再发生第二件事的概率.

经典的一句话. 炮弹不会落到同一个弹坑 躲炮弹要到炮弹之前落到的地方. 很多人认为这是正确的, 两次也就是概率的平方可能性非常小. 计算是正确的, 但是对于躲炮弹的人 概率中这个事件的集合并不是两次落到同一个弹坑 , 而只是一次.

这句话对的原因是因为炮的后坐力

黑天鹅事件则是对经济学家的估计概率中的可能性没有小概率事件最好的讽刺

概率计算

概率计算有两种视角, 从单次事件出发和从全局出发.例如

求投掷硬币3次, 3次正面的概率.

从单次事件出发 每次正面的概率是1/2 3次 $\frac{1}{2}^3=\frac{1}{8}$

从全局出发 一次投掷硬币将增加一倍的可能事件 一共可能发生的有$2^3=8$ 因为是单次事件得 $\frac{1}{8}$

得到的结果和计算难度差不多 . 但是我们换一个经典的问题

A,B二人赌博,各出赌金 a 元,他们拥有相同的获胜概率,约定,谁先获得3场胜利,谁获得 10元的全部赌注金,但是由于某种原因,赌博无法进行,此时 A获得了 2 场胜利,B获得了 1场胜利, 那么我们应该怎么把赌注分给两人才算是公平?

从单次事件出发. 下一局A获胜的概率是1/2, 如果不获胜下一轮获胜的概率也是1/2, $\frac{1}{2}+\frac{1}{2}^2=\frac{3}{4}$

虽然这道题推导到这就结束了, 但是可以意识到如果离胜局越远 需要计算的越远.

如果从全局出发, 接下来最多可能继续赌2局, 也就是$2^2=4$ 种可能性. 如果乙要赢, 它需要的可能性只有一种. 也就是1/4 甲就是3/4

在这里可以清楚的看到这两种思路的差异.一般人在生活中会使用从自身出发的角度, 没什么问题.但是学习统计学, 应该要熟悉的使用从全局出发的角度.

概率之间的关系

如果事件中只有a和b这两个变量. 联合概率$\rho(a, b)$ 是 a和b区域的交集在全部区域的几率. 条件概率$\rho(b|a)$ 是在a区域下, b区域占a区域的几率. 显然这两个概率的差异在于分母. 分别是全部区域和a区域. 而

$a区域/p(a) = 全部区域$

$a和b区域/p(a) = 如果全都是a区域下的b区域数量$

所以

$\rho(b|a) /\rho(a) =\rho(b) $

$p(a,b)/p(a) = p(b|a)$

常用公式

如果从全局出发, 本质是排列组合问题. n个中选择m个的问题.

投掷5次硬币3次是正面的概率, 就是在5次中3次是正面的组合数除以所有可能性.

投掷N次的所有可能性非常好计算 单次可能性数量的N次方

公式有几种导出思路.

首先有排列公式 排列与所有可能性的差异在于 每次选择后单次可能性-1 假设n次 排列的是r个

​ $P(n, r) = n(n-1)(n-2)…(n-r+1) = n! / (n − r)!$

组合则是不再考虑顺序, 一个组合内的任何可能性都是一样的.所以我们知道一个组合的可能性乘以组合的排列可能性$r!​$ 等于排列公式

$C(n, r) = P(n, r) /r!$

.

期望

你预期你下次考试多少分? 预期就是期望. 当你投掷一枚骰子, 出现多少点会认为投出比较大的点数了呢.

期望的一个数学定义是 $E(X) = \int_\Omega Xd\rho $ $\Omega$ 是所有事件的集合 $Xd\rho$ 是每种事件的值$X$乘它的概率$d \rho$

例如投一次骰子

$$\operatorname{E}(X) = 1 \cdot \frac{1}{6} + 2 \cdot \frac{1}{6} + 3 \cdot \frac{1}{6} +4 \cdot \frac{1}{6} + 5 \cdot \frac{1}{6} + 6 \cdot \frac{1}{6} = \frac{1 + 2 + 3 + 4 + 5 + 6}{6} = 3.5$$