독립·종속 사건과 베이즈 정리
확률 문제를 어려워하는 가장 큰 이유는 사건 사이의 관계를 제대로 구분하지 못해서입니다. 두 사건이 독립인지 종속(의존)인지에 따라 계산식이 완전히 달라지고, 이를 잘못 판단하면 결과가 틀어집니다. 여기에 조건부 확률까지 얽히면 복잡도가 급격히 높아집니다. 이때 흐름을 단순화해 주는 것이 바로 베이즈 정리입니다. 독립·종속 개념을 명확히 하고, 베이즈 정리로 정보를 업데이트하는 과정을 익히면 의학 통계·머신러닝·품질 관리 등 다양한 분야에서 문제를 해석할 수 있습니다.
아래에서는
- 독립 사건과 종속 사건의 정의
- 독립성 판별 기법과 대표 예시
- 종속 관계에서 조건부 확률 계산
- 베이즈 정리 공식 유도와 직관
- 실전 적용 사례와 실수 방지 포인트
를 차례로 살펴봅니다.
독립 사건이란?
정의
두 사건 A, B가 독립이면 한 사건의 발생 여부가 다른 사건의 발생 확률에 아무 영향도 주지 않습니다. 수식으로는
$$
P(A \cap B)=P(A)·P(B)
$$
혹은
$$
P(B \mid A)=P(B),;P(A \mid B)=P(A)
$$
로 표현됩니다.
직관
- 동전을 던질 때 앞면이 나오는 일과 주사위를 던져 3이 나오는 일은 서로 전혀 간섭하지 않습니다.
- 시험 공부를 전혀 안 한 두 과목의 ‘합격 여부’는 실제로 상관이 있을 수 있으므로 독립이 아닐 수 있습니다.
독립성 판별 3단계
- 표본공간 분리: 물리적 실험이 서로 연결돼 있는지 먼저 확인.
- 확률 곱 조건: $P(A \cap B)=P(A)·P(B)$를 직접 대입해 본다.
- 조건부 비교: $P(B \mid A)=P(B)$인지 따져 본다.
종속 사건이란?
정의
사건 A, B가 **종속(의존)**이면 한 사건이 다른 사건의 확률을 변경합니다.
$$
P(A \cap B)\neq P(A)·P(B)
$$
또는
$$
P(B \mid A)\neq P(B)
$$
대표 예시
- 뽑기 문제: 주머니에서 공을 꺼낸 뒤 다시 넣지 않고 두 번째 공을 꺼낼 때 색이 달라질 확률.
- 날씨와 교통량: 비가 오는 날(A)이면 교통 체증(B) 확률이 평소보다 커집니다.
조건부 확률로 계산
종속 사건에서는
$$
P(A \cap B)=P(A)·P(B \mid A)
$$
조건부 확률 $P(B \mid A)$를 제대로 구해야 합니다.
베이즈 정리
공식
$$
P(A \mid B)=\frac{P(B \mid A)·P(A)}{P(B)}
$$
여기서
- $P(A)$: A가 사전에 일어날 확률(사전 확률)
- $P(B \mid A)$: A가 일어났을 때 B가 일어날 확률(우도)
- $P(B)$: B가 일어날 전체 확률(정규화 상수)
- $P(A \mid B)$: B가 관측된 뒤 A가 일어났을 확률(사후 확률)
직관
- 사전 정보 $P(A)$에
- 새로운 증거가 나타날 확률 $P(B \mid A)$를 곱해
- 전체 증거 발생 확률 $P(B)$로 나눠서
- 업데이트된 확률 $P(A \mid B)$를 얻는다.
유도
조건부 확률 정의
$$
P(A \cap B)=P(A)·P(B \mid A)=P(B)·P(A \mid B)
$$
좌변을 같게 두고 정리하면 베이즈 정리가 바로 나옵니다.
실전 적용 예시
1. 의료 검사
- 유병률 $P(D)=0.01$
- 민감도 $P(+ \mid D)=0.95$
- 위양성률 $P(+ \mid \overline{D})=0.02$
양성 판정 시 실제로 질병이 있을 확률은?
$$
P(D \mid +)=\frac{0.95·0.01}{0.95·0.01+0.02·0.99}≈0.324
$$
2. 스팸 필터
메일에 ‘무료’라는 단어가 포함될 확률이
- 스팸에서 $0.40$
- 정상 메일에서 $0.05$
전체 메일 중 스팸 비율이 $0.2$라면, ‘무료’가 포함된 메일이 스팸일 확률
$$
P(S \mid 무료)=\frac{0.40·0.2}{0.40·0.2+0.05·0.8}≈0.667
$$
3. 머신러닝 모델 업데이트
베이즈 정리는 매 관측마다 모델 매개변수를 업데이트하는 베이지안 학습의 이론적 기반입니다. 관측 데이터가 적을 때도 사전 정보를 이용해 과적합을 방지하는 효과가 있습니다.
독립성과 베이즈 정리의 연결
- 독립이면 $P(B \mid A)=P(B)$. 베이즈 정리 분자·분모 모두 같은 값을 곱하므로 $P(A \mid B)=P(A)$, 즉 정보 업데이트가 필요 없습니다.
- 종속이면 관측 B가 A의 확률을 조정합니다. 이 과정이 역조건부 추론의 핵심입니다.
실수 방지 체크리스트
- 사건 구분 명확히: A, B 정의부터 분명히 적는다.
- 독립 여부 먼저 판단: 독립이면 계산이 대폭 단순화된다.
- 조건부 확률 방향 확인: $P(B \mid A)$와 $P(A \mid B)$를 헷갈리지 말 것.
- 전체 확률 $P(B)$ 계산: 베이즈 정리 분모를 빠뜨리면 결과가 1을 초과하거나 음수가 나올 수 있다.
- 여사건과 합사건 활용: 복잡하면 $P(\overline{A})$, $P(A \cup B)$ 등을 이용해 간접 계산.
결론
독립 사건은 곱셈정리를 간단하게 해 주고, 종속 사건은 조건부 확률이 필수입니다. 여기에 베이즈 정리를 적용하면 새로운 정보가 들어올 때마다 확률을 체계적으로 업데이트할 수 있습니다. 세 개념을 엮어 생각하면 복잡한 확률 모델도 단계별로 해석할 수 있으니, 다음 학습 때는 꼭 다음 순서를 기억해 보세요.
- 사건 정의와 독립성 판별
- 조건부 확률 세팅
- 베이즈 정리로 역확률 계산
이 흐름이 익숙해지면 의학 진단, 금융 리스크, 추천 시스템 등 데이터를 해석해야 하는 거의 모든 분야에서 강력한 무기가 될 것입니다.
'mathematics' 카테고리의 다른 글
확률 기본 공식 완전 정리: 덧셈정리, 곱셈정리, 조건부확률 (0) | 2025.06.05 |
---|---|
확률과 통계 경우의 수 완전 정리: 복합·배열·조합 노하우 (0) | 2025.06.03 |
기하와 벡터 증명 베스트 문제 10선 (0) | 2025.06.01 |
삼각형 중선·무게중심·외심·내심 벡터 풀이 (0) | 2025.05.29 |
원·타원·쌍곡선·포물선의 초점 기법 (0) | 2025.05.27 |