본문 바로가기

모델학습3

EDA란? EDA(Exploratory Data Analysis)란, 모델을 만들기 전 데이터를 이해하고 준비하는 과정입니다.EDA의 목적은 다음과 같아요:데이터 품질 확인 (결측치, 이상치 등)데이터의 전반적인 분포와 패턴 이해모델링 전 사전 준비왜 중요할까?"Garbage In, Garbage Out"이라는 말처럼, 데이터가 부정확하면 아무리 좋은 모델을 써도 결과는 엉망이 됩니다.데이터 EDA 기법 정리다양한 EDA 기법들이 소개되었는데요, 하나씩 풀어볼게요.기술 통계 분석숫자 변수: 평균, 최대/최소값 등 범위 확인범주형 변수: 카테고리 수 파악머신 러닝 모델에 맞게 적절한 인코딩 필요결측치 처리비어 있는 값(null)을 찾아 처리평균값, 최빈값으로 채우거나, 해당 데이터를 삭제이상치 처리너무 크거나 작은 .. 2025. 5. 29.
8주차 7. 머신러닝에 필요한 주요 Python 패키지 소개 📦 1. Scikit-learn (사이킷런)머신러닝 알고리즘의 표준 구현 라이브러리모델 학습, 예측, 전처리, 평가 등 전 과정을 지원하는 파이썬 패키지🔹 주요 특징지도/비지도 학습을 위한 다양한 알고리즘 포함통일된 API (fit(), predict(), transform(), score())모듈형 구조로 파이프라인 구성 및 반복 실험에 강력🔹 주요 객체객체명 설명 메서드Estimator학습기fit()Predictor예측기predict()Transformer변환기transform(), fit_transform()Model성능 평가score()📌 Scikit-learn은 학습과 예측뿐 아니라, 전처리와 평가, 교차검증, 하이퍼파라미터 튜닝 등도 지원합니다.🔁 2. Pipeline (사이킷런 내 .. 2025. 5. 21.
8주차 3. 머신러닝 기초 개념 정리 📌 1. 머신러닝이란?데이터에서 패턴을 찾아 스스로 학습하고 예측하는 기술정의 요약명시적인 프로그래밍 없이 컴퓨터가 데이터를 통해 학습사람이 일일이 규칙을 정의하지 않아도 기계가 스스로 판단 기준(패턴)을 학습예측 및 의사결정 자동화에 초점고전적 정의Arthur Samuel (1959): “컴퓨터가 명시적인 프로그래밍 없이 학습하는 능력을 가지게 하는 연구 분야”Tom Mitchell (1997):어떤 작업 T, 성능 P, 경험 E에 대해 성능이 향상되면 머신러닝이 일어난 것🧩 2. 인공지능(AI), 머신러닝(ML), 딥러닝(DL)의 관계인공지능 (AI) ⊃ 머신러닝 (ML) ⊃ 딥러닝 (DL)구분 설명AI인간의 지능을 모방하는 기술 전반ML데이터를 통해 스스로 규칙을 학습하는 AI의 한 분야DL인간.. 2025. 5. 21.