카테고리 없음

dbt 스터디 1일차

조구만비버 2026. 4. 1. 18:36

 

ELT vs. ETL

- 주요 차이점 : 데이터 변환 시점

구분 ELT ETL
의미 Extract, Loard, Transform
추출, 적재, 변환
Extract, Transform, Load
추출, 변환, 적재
데이터 변환 데이터 적재 이후 데이터 적재 이전

 

* ETL에서 변환을 한다고 하지만, 실제로 의미 있는 변환은 BI에서 다시 하는 경우가 많음

 

ETL 문제

- 변환 로직이 외부에 있음

- 수정 어려움

- BI에서 로직 중복 발생

- 협업 어려움 

 

ETL 대세인 이유 

- 1. 클라우드 성능이 강함 : BigQuery, Snowflake 같은 DW가 계산을 다 해줌

- 2. 데이터 빨리 볼 수 있음 : raw 바로 넣고 조회 가능

- 3. 비용 효율 : ETL 서버/툴 필요 ↓

- 4. 유연성 : 나중에 로직 바꿔도 재처리 가능

 

dbt 

위치

- DW (Load) →. dbt. (Transform) → BI

역할

- SQL 변환 관리

- 버전 관리

- 테스트 

- 자동화

 

 

[ 추가 정리 ]  
PA vs. BI  

구분 PA BI
의미 Product Analytics Business Intelligence
핵심
역할
유저 행동 분석
퍼널 분석
리텐션 / 코호트 분석
대시보드
리포트
KPI 모니터링
특징 이벤트 기반 데이터
실시간/세션 중심
프로덕트 개선 목적
이미 정리된 데이터 사용
SQL 몰라도 사용 가능
시각화 중심
도구 Amplitude
Mixpanel
Appsflyer
Tableau
Power BI
Looker

 

* PA가 BI를 “대체"할 수는 있지만, “커버”하지는 못한다

   ㄴ BI 에서는 내부 거래 시스템 , 결제/PG사, 정산 시스템 등에서 매출 데이터 불러온다 

구분 PA BI PA가 BI 대체 못하는 이유
데이터 범위 유저 행동 (이벤트) 전사 데이터 (매출, 비용, CRM 등) PA는 “부분 데이터”만 다룸
데이터 출처 앱/웹 트래킹 여러 시스템 통합 (DB, ERP, Ads 등) 비즈니스 전체를 못 봄
데이터 정확도 트래킹 누락 / 중복 가능 정제 + 검증된 데이터 재무/의사결정에 부적합
데이터 모델 이벤트 기반 (flat) Fact/Dimension 구조 복잡한 분석 구조 부족
목적 왜 유저가 행동했는지 회사가 어떻게 돌아가는지 질문 자체가 다름
활용자 PM, 마케터 경영진, 전략팀 의사결정 레벨 차이
확장성 빠르지만 제한적 느리지만 안정적 규모 커질수록 한계

 

* BI 포함 데이터 흐름

[비즈니스 이벤트] 구매, 환불, 재고이동 등 발생

   ↓

[ERP] 비즈니스 데이터 (매출, 재고 등) 입력 및 저장 
   ↓ ELT / ETL
[Data Warehouse] 비즈니스 데이터 raw 저장
   ↓
[dbt] 
   ↓ 
[BI] 

---

* PA 포함 데이터 흐름

[User 행동]
   ↓
[PA]