ELT vs. ETL
- 주요 차이점 : 데이터 변환 시점
| 구분 | ELT | ETL |
| 의미 | Extract, Loard, Transform 추출, 적재, 변환 |
Extract, Transform, Load 추출, 변환, 적재 |
| 데이터 변환 | 데이터 적재 이후 | 데이터 적재 이전 |
* ETL에서 변환을 한다고 하지만, 실제로 의미 있는 변환은 BI에서 다시 하는 경우가 많음
ETL 문제
- 변환 로직이 외부에 있음
- 수정 어려움
- BI에서 로직 중복 발생
- 협업 어려움
ETL 대세인 이유
- 1. 클라우드 성능이 강함 : BigQuery, Snowflake 같은 DW가 계산을 다 해줌
- 2. 데이터 빨리 볼 수 있음 : raw 바로 넣고 조회 가능
- 3. 비용 효율 : ETL 서버/툴 필요 ↓
- 4. 유연성 : 나중에 로직 바꿔도 재처리 가능
dbt
위치
- DW (Load) →. dbt. (Transform) → BI
역할
- SQL 변환 관리
- 버전 관리
- 테스트
- 자동화
[ 추가 정리 ]
PA vs. BI
| 구분 | PA | BI |
| 의미 | Product Analytics | Business Intelligence |
| 핵심 역할 |
유저 행동 분석 퍼널 분석 리텐션 / 코호트 분석 |
대시보드 리포트 KPI 모니터링 |
| 특징 | 이벤트 기반 데이터 실시간/세션 중심 프로덕트 개선 목적 |
이미 정리된 데이터 사용 SQL 몰라도 사용 가능 시각화 중심 |
| 도구 | Amplitude Mixpanel Appsflyer |
Tableau Power BI Looker |
* PA가 BI를 “대체"할 수는 있지만, “커버”하지는 못한다
ㄴ BI 에서는 내부 거래 시스템 , 결제/PG사, 정산 시스템 등에서 매출 데이터 불러온다
| 구분 | PA | BI | PA가 BI 대체 못하는 이유 |
| 데이터 범위 | 유저 행동 (이벤트) | 전사 데이터 (매출, 비용, CRM 등) | PA는 “부분 데이터”만 다룸 |
| 데이터 출처 | 앱/웹 트래킹 | 여러 시스템 통합 (DB, ERP, Ads 등) | 비즈니스 전체를 못 봄 |
| 데이터 정확도 | 트래킹 누락 / 중복 가능 | 정제 + 검증된 데이터 | 재무/의사결정에 부적합 |
| 데이터 모델 | 이벤트 기반 (flat) | Fact/Dimension 구조 | 복잡한 분석 구조 부족 |
| 목적 | 왜 유저가 행동했는지 | 회사가 어떻게 돌아가는지 | 질문 자체가 다름 |
| 활용자 | PM, 마케터 | 경영진, 전략팀 | 의사결정 레벨 차이 |
| 확장성 | 빠르지만 제한적 | 느리지만 안정적 | 규모 커질수록 한계 |
* BI 포함 데이터 흐름
[비즈니스 이벤트] 구매, 환불, 재고이동 등 발생
↓
[ERP] 비즈니스 데이터 (매출, 재고 등) 입력 및 저장
↓ ELT / ETL
[Data Warehouse] 비즈니스 데이터 raw 저장
↓
[dbt]
↓
[BI]
---
* PA 포함 데이터 흐름
[User 행동]
↓
[PA]