본문 바로가기
mathematics

확률과 적분 연계 (연속확률변수 기초)

by 고유함으로 2025. 4. 30.
반응형

연속확률변수 기초: 확률과 적분의 만남

확률론에서 연속확률변수(continuous random variable)는 이산확률변수와 달리, 특정한 값이 아닌 구간에 걸쳐 확률을 분포시킵니다. 이때 확률을 계산하기 위해 불가피하게 적분이 사용되며, 확률밀도함수(PDF)와 누적분포함수(CDF), 기댓값(expectation), 분산(variance) 등이 모두 적분으로 정의됩니다.

본 포스팅에서는 연속확률변수의 핵심 개념과 수식 유도 과정을 적분 관점에서 살펴보겠습니다.


확률밀도함수와 누적분포함수

확률밀도함수(PDF) 정의

연속확률변수 $X$에 대해, 확률밀도함수 $f(x)$는 다음 성질을 만족합니다.

  • $f(x)\ge0$
  • $\displaystyle \int_{-\infty}^{\infty} f(x),dx =1$

함수 $f(x)$ 자체는 확률이 아니며, 구간 $[a,b]$에서의 확률 $P(a\le X\le b)$를 구할 때 적분으로 계산합니다.
$$
P(a\le X\le b) = \int_a^b f(x),dx.
$$

누적분포함수(CDF) 정의

누적분포함수 $F(x)$는 확률변수가 $x$ 이하가 될 확률을 나타내며,
$$
F(x) = P(X \le x) = \int_{-\infty}^x f(t),dt.
$$
이로부터 다음 성질이 따라옵니다.

  • $F(-\infty)=0,\quad F(\infty)=1$
  • 단조비감소(non-decreasing) 함수
  • 만약 $f$가 연속이면,

$$
f(x) = F'(x).
$$


기댓값(Expectation)과 분산(Variance)

기댓값 정의

연속확률변수 $X$의 기댓값 $\mu = E[X]$ 는 확률밀도함수와 적분으로 정의됩니다.
$$
E[X] = \int_{-\infty}^{\infty} x,f(x),dx.
$$
이 값은 확률변수의 평균, 중심 위치를 의미합니다.

분산 정의

분산 $\sigma^2 = Var(X)$ 은 확률변수가 평균으로부터 흩어진 정도를 측정하며,
$$
Var(X) = E\bigl[(X - \mu)^2\bigr]
= \int_{-\infty}^{\infty} (x - \mu)^2,f(x),dx.
$$
계산 편의를 위해
$$
Var(X) = E[X^2] - (E[X])^2,
$$

$$
E[X^2] = \int_{-\infty}^{\infty} x^2,f(x),dx.
$$


대표적 연속분포 예제

1. 균등분포(Uniform Distribution)

구간 $[a,b]$에서 균등하게 분포하는 확률변수 $X$ 의 PDF
$$
f(x) =
\begin{cases}
\dfrac{1}{b - a}, & a \le x \le b,\
0, & \text{otherwise}.
\end{cases}
$$

  • CDF:

$$
F(x) =
\begin{cases}
0, & x < a,\
\dfrac{x-a}{b-a}, & a \le x \le b,\
1, & x > b.
\end{cases}
$$

  • 기댓값:

$$
E[X] = \int_a^b x\cdot \frac{1}{b-a},dx
= \frac{a+b}{2}.
$$

  • 분산:

$$
Var(X) = \frac{(b-a)^2}{12}.
$$

2. 정규분포(Normal Distribution)

평균 $\mu$, 분산 $\sigma^2$ 인 정규분포 $X\sim N(\mu,\sigma^2)$ 의 PDF
$$
f(x) = \frac{1}{\sqrt{2\pi\sigma^2}}
\exp!\Bigl(-\frac{(x-\mu)^2}{2\sigma^2}\Bigr).
$$

  • CDF는 닫힌형으로 적분할 수 없어, 수치적분 또는 에러 함수(erf)를 사용합니다.
  • 기댓값 $E[X]=\mu$, 분산 $Var(X)=\sigma^2$.

3. 지수분포(Exponential Distribution)

모수 $\lambda>0$ 인 지수분포 $X\sim \mathrm{Exp}(\lambda)$ 의 PDF
$$
f(x) =
\begin{cases}
\lambda e^{-\lambda x}, & x\ge0,\
0, & x<0.
\end{cases}
$$

  • CDF: $F(x)=1 - e^{-\lambda x};(x\ge0)$.
  • 기댓값: $E[X]=1/\lambda$.
  • 분산: $Var(X)=1/\lambda^2$.

적분을 활용한 확률·부등식 증명

Chebyshev 부등식

확률변수 $X$에 대해, 평균 $\mu$, 분산 $\sigma^2$ 일 때,
$$
P\bigl(|X - \mu|\ge k\sigma\bigr)
\le \frac{1}{k^2},\quad k>0.
$$
증명(적분 이용)

  1. $E\bigl[(X-\mu)^2\bigr]=\int (x-\mu)^2 f(x),dx$.
  2. 구간 ${|x-\mu|\ge k\sigma}$ 에서 $(x-\mu)^2\ge k^2\sigma^2$.
  3.  

$$
\sigma^2
= \int_{|x-\mu|<k\sigma}(x-\mu)^2 f(x),dx
+ \int_{|x-\mu|\ge k\sigma}(x-\mu)^2 f(x),dx
\ge 0 + k^2\sigma^2!\int_{|x-\mu|\ge k\sigma}f(x),dx.
$$

  1. 따라서

$$
P(|X-\mu|\ge k\sigma)
= \int_{|x-\mu|\ge k\sigma}f(x),dx
\le \frac{\sigma^2}{k^2\sigma^2}=\frac{1}{k^2}.
$$

Markov 부등식

$X\ge0$ 인 확률변수에 대해, $a>0$ 일 때
$$
P(X\ge a)\le \frac{E[X]}{a}.
$$
증명

  1. $E[X] = \int_0^a x f(x),dx + \int_a^\infty x f(x),dx$.
  2. 두 번째 적분 구간에서 $x\ge a$, 따라서

$$
E[X]\ge 0 + \int_a^\infty a f(x),dx
= a,P(X\ge a).
$$

  1. 정리하면 Markov 부등식이 도출됩니다.

결론

  • 연속확률변수의 확률계산, 기댓값, 분산 모두 적분을 통해 정의됩니다.
  • 분포별 특수함수(CDF, PDF)와 적분기법(치환, 부분적분)을 결합하여 실전 확률문제를 해결할 수 있습니다.
  • 부등식 증명에서도 적분 관점이 매우 강력한 도구가 되며, Chebyshev·Markov 부등식 등이 대표적 예입니다.

오늘 정리한 연속확률변수 기초와 적분의 연결고리를 바탕으로, 실제 통계·데이터 분석·확률모델링에서 확률과 적분의 응용 능력을 더욱 강화하시기 바랍니다.

반응형