확률과 통계 정리 - 집합의 분할, 확률의 개념
해당 포스팅은 고등학생때 배웠던 확률과 통계의 내용을 복습하기 위해서 만들어졌으며 포스팅의 내용들은 유튜브의 고등학교 수학 채널 수악중독의 확률과 통계 개념정리내용을 바탕으로 작성되었습니다.
1. 집합의 분할
-
원소가 유한개인 집합을 공집합이 아니면서 서로소인 몇개의 부분집합들에 대한 합집합으로 나타낼 수 있습니다.
- 유한개의 집합 $A$, 집합 $A$의 원소 $A_i, (i=1,2,3 \cdots k)$로 $k$개의 부분집합이 존재하는 경우
- $A_i \neq \phi$
- $A_i \cap A_j = \phi$ , $(i \neq j)$, $j = 1, 2, 3, \cdots k$ 이면 $A_i$ 와 $A_j$는 서로소입니다.
- $A_1 \cup A_2 \cup A_3 \cup \cdots \cup A_k = A$
- 유한개의 집합 $A$, 집합 $A$의 원소 $A_i, (i=1,2,3 \cdots k)$로 $k$개의 부분집합이 존재하는 경우
-
원소가 유한개인 집합 $A = \{a, b, c\}$가 존재 할 때,
$\begin{matrix} \{a, b, c\} &=& \{a\} \cup \{b, c\} \\ &=& \{b\} \cup \{a,c\} \\ &=& \{c\} \cup \{a,b\} \end{matrix}$
로 표현이 가능합니다.
2. 확률의 개념
-
시행 : 1)동일한 조건, 2)여러번 반복, 3)결과가 우연에 지배되는 실험 또는 관찰
-
표본공간 : 시행의 결과들에 대한 집합
-
사건 : 표본공간의 부분집합
- 근원사건 : 원소의 개수가 1개인 사건
- 합사건, 합집합 : $A \cup B$
- 곱사건, 교집합 : $A \cap B$
- 배반사건 : $A \cap B = \phi$
- 여사건 : $A^c$
-
확률
-
수학적 확률(선험적 확률)
-
근원사건이 일어날 가능성이 모두 같은 경우 모든 경우의 수가 담긴 표본공간 $S$ 와 어떤 사건 $A$ 입니다.
이때, 사건 $A$가 일어날 확률은 $P(A) = \frac{사건의 원소 개수}{표본공간의 원소 개수} = \frac{n(A)}{n(S)}$
-
사건 $A$ 가 발생하지 않는 공사건 : $P(A) = 0$
-
사건 $A$를 포함한 표본공간에 대한 전사건 : $P(S) = 1$
-
공사건과 전사건을 고려한 사건 $A$ 에 대한 확률의 범위입니다.
$0 \leq P(A) \leq 1$
-
-
기하학적 확률
- 원소의 개수가 세기가 곤란한 연속적인 경우
- 화살을 쏴서 10점 영역에 맞을 확률 = $\frac{10점영역의 널비}{과녁의 총 넓이}$
- 원소의 개수가 세기가 곤란한 연속적인 경우
-
통계적 확률(경험적 확률 = emprical probability)
-
근원사건이 일어날 가능성이 모두 같지 않기에, 과거의 사건이 나온 횟수나 빈도를 기반으로 확률을 만드는 경우를 말합니다.
-
어떤 사건 $A$를 식별하기 위해서 실험을 $n$번 시도하여 $r$번 식별되었을 때의 확률은 $\frac{r}{n}$ 로 표현이 가능합니다.
-
통계적 확률인 $\frac{r}{n}$을 독립시행으로 수없이 많이 시도하는 경우 일정한 값에 가까워지기 때문에 수학적 확률에 근사하게 됩니다.
$P(A) = \lim_{n \rightarrow \infty} \frac{r}{n}$
-
경험적 확률은 빈도주의적 관점이라고 볼 수 있으며 새로운 베이지안 주의적 관점도 존재합니다.
- 베이지안 주의적 관점의 확률은‘주장에 대한 신뢰도’라고 봅니다.
-
-
독립시행
- 여러 반복한 결과가 서로 영향을 주지 않는 경우를 말합니다.
- 매시행시 일어날 확률이 $p$인 사건에서 $n$회의 시행중 $r$번 일어날 확률
- $P(A) = _{n}\mathrm{C}_{r}p^r(1-p)^{n-r}$
여사건의 확률
- 사건 $A$가 있을 때, $A$의 부분집합을 제외한 나머지 부분집합을 말합니다.
- $P(A) = 1 - P(A^c)$
확률의 덧셈정리
- $P(A \cup B) = P(A) + P(B) - P(A \cap B)$
3. 조건부 확률
- $B$ 라는 사건이 발생하였을 때, $A$ 라는 사건이 발생할 확률
- $P(A \lvert B) = \frac{P(A \cap B)}{P(B)}$ 단, $P(B) \neq 0$
확률의 곱셈정리
- $P(A \cap B) = P(B) \cdot P(A \lvert B)$
사건의 독립과 종속
- 한 사건 $A$ 가다른 사건 $B$ 에 영향을 주지 않는 경우 두 사건은 서로 독립관계 이기 때문에 $P(A \cap B) = P(A)P(B)$ 가 성립합니다.
- 샘플을 뽑는 방법중 복원 추출을 하는 경우 샘플이 아무리 뽑아도 뽑히는 확률이 동일하기 때문에 독립적인 사건입니다.
- 비복원 추출은 샘플을 뽑으면 다음 샘플이 뽑힐 확률에 영향을 끼치기 때문에 종속적인 사건입니다.
베이즈 정리
- 사건 $B$에 발생하였을 때, 사건 $A$가 발생할 확률을 통하여 반대로 $A$가 발생하였을 때 $B$가 발생할 확률을 구할 수 있습니다.
- $P(B \lvert A) = \frac{P(A \lvert B) P(B)}{P(A)}$
- $P(B \lvert A)$ 는 사후확률(postrior probability)로 사건 $A$가 발생하고 갱신된 후의 사건 $B$의 확률을 의미합니다.
- $P(B)$ 는 사전확률(prior probability)로 사건 $A$ 가 발생하기 전, 갱신되기 전의 사건 $B$의 확률을 말합니다.
- $P(A \lvert B)$ 는 가능도(likelihood) 라고 부릅니다.
- $P(A)$ 는 정규화 상수, 또는 증거(evidence) 라고 부릅니다.
- 베이즈 정리는 사건 $B$ (사전확률)가 발생하고 새로운 사건 및 정보인 $A$ (증거)가 발생하였을 때, 사건 $B$가 갱신되어지면서 사건 $A$가 사건 $B$에 어떻게 영향을 끼쳣는지 알 수 있습니다.
-
사전확률과 사후확률에서 사전과 사후를 나누는 기준이 되는 사건은 evidence를 의미하며 evidence를 관측하여 갱신하기 전 후의 주장에 관한 신뢰도입니다.
- 참고 사이트