dev.Log
DVC? 본문
데이터·모델·실험 전체를 버저닝하는 MLOps 도구
| 구분 | Git LFS | DVC |
| 본질 | Git 보조 도구 | 데이터/모델 버전 관리 시스템 |
| 목적 | 대용량 파일 저장 | 실험 재현 & 파이프라인 관리 |
| 중심 | 파일 | 데이터 흐름 & 결과 |
- Git에는 .dvc 메타파일만 저장
- 실제 데이터/모델은 외부 스토리지(S3/NFS 등)
| 구분 | DVC | MLflow |
| 핵심 문제 | “이 결과를 다시 만들 수 있는가?” | “어떤 실험이 더 좋았는가?” |
| 중심 | 데이터·모델 파일 | 실험 메타데이터 |
| 재현성 | ⭐⭐⭐⭐⭐ | ⭐⭐ |
| 비교/시각화 | ❌ | ⭐⭐⭐⭐⭐ |
STT
- DVC:
- acoustic model 파일
- training data snapshot
- MLflow:
- WER / latency
- decoder 파라미터 비교
RAG
- DVC:
- embedding index
- chunked corpus
- MLflow:
- recall@k
- 응답 품질 점수
LLM
- DVC:
- fine-tuned weights
- LoRA adapters
- MLflow:
- perplexity
- human eval score
'인공지능' 카테고리의 다른 글
| 실시간 STT (0) | 2025.12.23 |
|---|---|
| CTC vs RNN-T vs Attention Seq2Seq (1) | 2025.12.23 |
| ONNX란 무엇인가? (0) | 2025.11.26 |
| 블랙웰(Blackwell) 아키텍처 (0) | 2025.11.26 |
| RAG 캐시 (0) | 2025.11.21 |
Comments