본문 바로가기
학습/기초통계

📚 4. 확률분포의 종류 (쉽게 이해하기)

by DataJ 2025. 5. 12.

🟡 1) 베르누이 분포 (Bernoulli)

"성공 or 실패" 단 1번만 하는 실험

  • 예: 동전 던지기 (앞: 1, 뒤: 0), 시험 합격 여부 (합격: 1, 불합격: 0)
  • 결과가 딱 두 개만 있는 실험에 사용

특징

  • 확률변수 X는 1일 확률 p, 0일 확률 1-p
  • 기댓값 E(X) = p
  • 분산 Var(X) = p(1-p)

🔵 2) 이항 분포 (Binomial)

"성공 or 실패"를 n번 반복했을 때 성공한 횟수

  • 예: 동전을 10번 던져서 앞면이 몇 번 나왔는지
  • 베르누이 실험을 여러 번 반복했을 때 사용

특징

  • 성공 횟수 X ~ Bin(n, p)
  • 확률 공식:
  • 기댓값: E(X) = np
  • 분산: Var(X) = np(1-p)

🔴 3) 포아송 분포 (Poisson)

단위 시간/공간에서 사건이 몇 번 발생하는지

  • 예: 1시간에 콜센터에 전화가 몇 번 오는가, 정류장에 버스가 몇 대 도착하는가

조건

  • 독립적이며 일정한 비율로 발생해야 함

특징

  • 모수 λ = 평균 발생 횟수
  • 확률 공식:
  • 평균 = 분산 = λ

🟢 4) 균등 분포 (Uniform)

특정 구간에서 모든 값이 똑같은 확률로 나옴

  • 예: 1부터 10까지 랜덤 숫자 뽑기

특징

  • 확률밀도함수(pdf): f(x) = 1 / (b - a) (a ≤ x ≤ b)
  • 기댓값: (a + b) / 2
  • 분산: ((b - a)²) / 12

⚪ 5) 정규 분포 (Normal)

우리가 가장 많이 쓰는 종 모양의 분포

  • 예: 사람 키, 시험 점수, 몸무게
  • 평균을 중심으로 대칭적인 형태

특징

  • 기호: N(μ, σ²)
  • 평균: μ, 분산: σ²
  • 68% 확률로 평균±1σ 안에 있음
  • 95% 확률로 평균±2σ 안에 있음

🟣 6) 표준 정규 분포 (Standard Normal)

정규분포를 표준화한 것

  • 평균 = 0, 표준편차 = 1
  • z-score: → "평균에서 얼마나 떨어져 있나"를 알려줌

💡 이항분포 ≈ 정규분포?

n이 크고 p가 0.5쯤이면 → 이항분포도 정규분포로 근사 가능!


📌 요약 노트 ✏️

분포 사용 상황 대표 예시

베르누이 1번의 성공/실패 동전 던지기
이항 n번 반복 성공 횟수 시험에서 맞춘 개수
포아송 일정 시간/공간에서 발생 횟수 콜센터 전화 수
균등 모든 값이 같은 확률 랜덤 숫자 추첨
정규 대부분의 자연적 데이터 키, 체중
표준 정규 정규를 표준화한 것 z-점수 계산