dev.Log

DVC? 본문

인공지능

DVC?

초코푸딩 2025. 12. 23. 10:31

데이터·모델·실험 전체를 버저닝하는 MLOps 도구

구분 Git LFS DVC
본질 Git 보조 도구 데이터/모델 버전 관리 시스템
목적 대용량 파일 저장 실험 재현 & 파이프라인 관리
중심 파일 데이터 흐름 & 결과

 

  • Git에는 .dvc 메타파일만 저장
  • 실제 데이터/모델은 외부 스토리지(S3/NFS 등)
구분  DVC MLflow
핵심 문제 “이 결과를 다시 만들 수 있는가?” “어떤 실험이 더 좋았는가?”
중심 데이터·모델 파일 실험 메타데이터
재현성 ⭐⭐⭐⭐⭐ ⭐⭐
비교/시각화 ⭐⭐⭐⭐⭐

 

 

 STT

  • DVC:
    • acoustic model 파일
    • training data snapshot
  • MLflow:
    • WER / latency
    • decoder 파라미터 비교

 RAG

  • DVC:
    • embedding index
    • chunked corpus
  • MLflow:
    • recall@k
    • 응답 품질 점수

 LLM

  • DVC:
    • fine-tuned weights
    • LoRA adapters
  • MLflow:
    • perplexity
    • human eval score

 

'인공지능' 카테고리의 다른 글

실시간 STT  (0) 2025.12.23
CTC vs RNN-T vs Attention Seq2Seq  (1) 2025.12.23
ONNX란 무엇인가?  (0) 2025.11.26
블랙웰(Blackwell) 아키텍처  (0) 2025.11.26
RAG 캐시  (0) 2025.11.21
Comments