데이터분석데브코스 8/이론
데이터 분석 데브코스 | 파트 1 – 데이터 분석 개요와 기본 흐름
DataJ
2025. 3. 31. 14:50
■ 데이터 분석이란?
데이터 분석은 데이터를 수집하고, 정제하고, 해석해서 의미 있는 인사이트를 도출하는 과정. 단순히 데이터 자체를 다루는 것이 아니라, 조직의 의사결정이나 문제 해결에 활용되도록 만드는 것이 핵심.
■ 데이터 분석가의 역할
- 비즈니스 문제를 데이터 문제로 바꾸는 역할
- 분석 설계, 지표 정의, 결과 시각화
- 분석 결과를 토대로 현업과 소통
■ 데이터 분석에 필요한 역량
- 통계적 사고
- SQL 등 데이터 다루는 기술
- 문제 해결력
- 현업과 소통할 수 있는 커뮤니케이션 역량
■ 데이터 문해력(Data Literacy)
데이터를 읽고, 해석하고, 설명할 수 있는 능력을 의미함. 분석가뿐 아니라 조직 구성원 전체에게 필요한 기초 역량.
■ ETL과 데이터 흐름
ETL (Extract - Transform - Load)은 데이터를 추출하고, 변환하고, 저장하는 흐름을 의미. 분석 가능한 형태로 데이터를 다듬어 저장소에 넣는 과정. ELT는 순서가 다름 (추출 → 저장 → 변환).
ETL 작업은 자동화되거나 스케줄링 도구(Airflow 등)를 통해 정기적으로 실행됨.
■ 감사 기능이란?
데이터가 어떻게 수집되고, 변경되고, 저장되었는지를 추적할 수 있도록 로그를 남기는 기능. 오류 발생 시 원인을 파악하거나 보안상 이슈 확인에 활용됨.
■ 좋은 지표의 5가지 원칙
- Accessible: 누구나 접근 가능해야 함
- Consistent: 정의와 계산 방식이 일관되어야 함
- Understandable: 쉽게 이해 가능해야 함
- Actionable: 지표가 의미 있는 행동으로 이어질 수 있어야 함
- Owned: 명확한 소유자가 존재해야 함
■ 데이터 분석 조직 구조
조직 내 데이터는 다양한 저장소를 거치며 흐름을 가짐. 데이터 레이크 -> 전처리 -> 데이터 웨어하우스 -> 분석 툴로 연결됨. 분석가는 이 흐름을 이해하고, 어디서 어떤 데이터를 쓰는지 파악할 수 있어야 함.
이 글은 강의 내용을 바탕으로 내가 직접 정리하고 느낀 것을 기록한 포스팅입니다.
수업 내용의 저작권은 해당 교육기관에 있으며, 개인적인 복습용 글입니다.