본문 바로가기
학습/기초통계

📊 1. 확률과 확률변수 (기초 통계 이해)

by DataJ 2025. 5. 12.

"확률이 뭘까?" "확률변수는 왜 필요한 걸까?" 를 쉽게 이해해보자!


📌 통계학이란?

  • 여러 사건(event)을 수학적으로 분석하는 학문.
  • 미래에 일어날 일을 예측하거나 분석할 수 있게 도와줌.
  • 하지만 사건이 일어나기 전엔 아무도 모름 → 그래서 **"확률"**이라는 개념이 필요!

🎲 동전 던지기 예시로 이해하기

  • Experiment(실험): 동전을 던지는 행위
  • Sample(표본): 앞 또는 뒤
  • Sample space(표본공간): 가능한 모든 결과 = {(앞, 앞), (앞, 뒤), (뒤, 앞), (뒤, 뒤)}
  • Event(사건): 특정 조건을 만족하는 경우 (예: 앞이 1번 이상 나오는 경우)

👉 즉, 확률이란 전체 경우 중 내가 원하는 일이 일어날 비율


📐 확률 변수란?

사건을 숫자로 표현한 것!

  • 동전 앞: 1, 뒤: 0 으로 숫자로 나타내면 확률 계산이 더 쉬워짐.
  • 이렇게 사건 결과를 수치로 바꾼 것이 확률 변수 (Random Variable)

✅ 2가지 확률변수 유형

종류 설명 예시

이산 확률 변수 셀 수 있는 정수 값 동전 앞=1, 뒤=0
연속 확률 변수 실수 전체 구간 키, 몸무게 등

🎯 독립변수 vs 종속변수

구분 뜻 예시

독립변수 (x) 원인 운동 시간
종속변수 (y) 결과 체중 변화

보통 데이터 분석에서는 "x가 변하면 y가 어떻게 변할까?"를 분석함


요약 노트 ✏️

  • 확률은 불확실한 상황을 숫자로 표현하는 방법.
  • 확률변수는 그 결과를 수치로 바꿔서 분석 가능하게 함.
  • 이산/연속으로 나뉘며, 대부분의 데이터 분석은 이걸 기반으로 함.