본문 바로가기

학습24

SQL 고득점 Kit 완료 프로그래머스 후기 강의듣고 있는 교수님이 추천하길래 얕봤다가,, 기본기 탄탄하게 만들기 좋은 문제들이라 좋았다. 추천,,, 생각보다 데브코스 하면서 일주일정도 시간 날때마다 틈틈히 하는중인데, 괜찮은듯, ,, 2025. 6. 6.
머신러닝 핵심 정리: 정규화, SVM, 활성화 함수, 평가 지표 9. ⚠️ Overfitting(과적합) & Generalization(일반화)학습 데이터에 과하게 적합된 모델 → 새로운 데이터에 약함원인:Feature 수 과다데이터 수 부족10. 🛡 Regularization (정규화)🛡 L1 패널티 vs L2 패널티 정리 (Regularization)✅ Regularization (정규화)란?모델이 너무 복잡해서 학습 데이터에만 과하게 맞추는 경우 → 과적합 발생이를 방지하기 위해 모델의 복잡도를 줄이는 페널티를 cost function에 추가함1. 📏 L2 패널티 (Ridge Regression)Cost=Loss+λ∑wi2\text{Cost} = \text{Loss} + \lambda \sum w_i^2Cost=Loss+λ∑wi2각 가중치(weight) w.. 2025. 5. 14.
선형 회귀 및 데이터 모델링 정리 1. 📌 데이터 모델링이란?어떤 데이터에서 X와 Y의 관계를 y = f(x) 형태로 설명하려는 것.X: 독립변수 (feature) / Y: 종속변수 (label)목표: 이 관계를 잘 설명해주는 함수 f(x)를 찾는 것🧠 분류Supervised Learning: Y가 있는 경우Regression (Y가 연속값) → 선형 회귀Classification (Y가 범주형) → 로지스틱 회귀 등Unsupervised Learning: Y가 없는 경우 (ex: 군집화)2. ⚖️ 베이즈 정리 관점에서 본 모델링P(θ∣X)=P(X∣θ)P(θ)P(X)P(\theta | X) = \frac{P(X|\theta)P(\theta)}{P(X)}P(θ∣X)=P(X)P(X∣θ)P(θ)P(θ|X): 우리가 추정하고 싶은 param.. 2025. 5. 14.
Matplotlib & Seaborn 다양한 시각화 함수 정리 Pie Chart (파이 차트) — matplotlib.pyplot.pie()import matplotlib.pyplot as pltlabels = ['A', 'B', 'C']sizes = [30, 45, 25]plt.pie(sizes, labels=labels, autopct='%1.1f%%')plt.title('Pie Chart Example')plt.show()비율을 표현할 때 사용 (ex. 카테고리 비중)Line Plot (선형 그래프) — plt.plot()x = [1, 2, 3, 4]y = [10, 20, 25, 30]plt.plot(x, y, marker='o', markersize=8, linestyle='--', color='blue', alpha=0.7)plt.title('Line Pl.. 2025. 5. 14.
Pandas DataFrame 심화 정리 2 (재구성 · 병합 · 시계열) 🔄 stack() / unstack() / droplevel() 정리📌 1. stack()이란?열(column)을 행의 인덱스 레벨로 내려서 "길게" 만드는 함수즉, Wide → Long 포맷 변환# 예제 데이터df = pd.DataFrame({ 'Name': ['Alice', 'Bob'], 'Age': [30, 25], 'Gender': ['F', 'M']}, index=['a', 'b'])Name Age GenderaAlice30FbBob25M▶️ df.stack()df_stacked = df.stack()a Name Alice Age30 GenderFbNameBob Age25 GenderM→ 컬럼이 아래로 내려가고, 인덱스가 2단계로 바뀐 형태입니다 (a → a, Name, a,.. 2025. 5. 14.
Pandas DataFrame 심화 정리 1. 데이터셋 구조 확인df.head() # 상위 5개 행 출력df.tail() # 하위 5개 행 출력df.shape # (행, 열) 형태 출력 → 예: (2240, 10)df.columns # 열 이름 확인df.dtypes # 열별 데이터 타입 확인2. 함수 적용: apply()df['Age_category'] = df['Age'].apply(lambda x: 'young' if x Age Age_category25young45adult3. 값 매핑: map(), applymap()df['Gender'] = df['Gender'].map({'M': 'Male', 'F': 'Female'})Gender (Before) Gender (After.. 2025. 5. 14.
Pandas 기초 정리 1️⃣ 데이터 준비 및 구조 이해✅ 데이터셋 준비하기import pandas as pddf = pd.read_csv('sample.csv') # CSV 파일 불러오기df.head() # 상위 5개 행 출력✅ 데이터프레임 구조 가볍게 보기df.shape # (행, 열) 확인df.columns # 컬럼명 확인df.info() # 데이터 타입, 결측치 확인2️⃣ 인덱싱 및 조회✅ 행 조회 (loc, iloc, slicing)df.loc[0] # 라벨 기준 첫 번째 행df.iloc[0] # 위치 기준 첫 번째 행df[3:6] # 슬라이싱 (3 ~ 5행3️⃣ Series가 중요한 이유Series는 Panda.. 2025. 5. 14.
기타 고급 SQL 문법과 트랜잭션 2️⃣ 트랜잭션 소개 및 실습🔐 트랜잭션(Transaction)이란?여러 SQL 문장을 원자적(Atomic) 으로 실행하도록 묶는 구조주로 INSERT, UPDATE, DELETE와 함께 사용실패 시 ROLLBACK, 성공 시 COMMIT🔁 예시BEGIN; UPDATE account SET balance = balance - 100 WHERE userid = A; UPDATE account SET balance = balance + 100 WHERE userid = B;COMMIT;✅ COMMIT 모드autocommit = True: SQL 실행 즉시 커밋autocommit = False: 명시적으로 .commit() 호출 필요 (Python 등에서 설정 가능)3️⃣ 기타 고급 SQL 문법🔹 집.. 2025. 5. 14.
머신러닝 실전: Kaggle 구조부터 앙상블·Hugging Face 활용까지 6️⃣ Kaggle 구조 이해📂 기본 파일 구성train.csv: 훈련 데이터test.csv: 테스트 데이터sample_submission.csv: 제출 형식 예시📦 앙상블(Ensemble) 기법여러 모델 결합 → 평균 혹은 투표예: Random Forest, Gradient Boosting성능 향상 가능하지만 속도·자원 소모 ↑🎯 앙상블(Ensemble) 기법✅ 개념여러 개의 모델을 결합하여 하나의 강력한 예측 모델을 만드는 방법→ 단일 모델보다 더 정확하고 안정적인 예측 가능→ "집단지성" 원리와 유사✅ 왜 사용하는가?이유 설명🎯 성능 향상여러 약한 모델을 모아 강한 모델로🎯 과적합 방지다양한 예측을 평균/투표하여 일반화 향상🎯 예측 안정성데이터에 대한 편차를 줄이고 일관성 확보✅ 작동 방.. 2025. 5. 14.