dev.Log
블랙웰(Blackwell) 아키텍처 본문
NVIDIA가 GPT-5/6 시대를 대비해 만든 차세대 AI 가속용 GPU 아키텍처.
“초거대 모델 학습·추론을 빠르게, 전력은 더 적게, NVLink로 GPU 간 통합을 더 강하게”가 목표.
GPU가 바뀌면 반드시 소프트웨어 스택도 같이 업그레이드해야 한다.
필수로 따라 올라가는 것:
- NVIDIA 드라이버
- CUDA Toolkit
- cuDNN / TensorRT / NCCL
- PyTorch/TF 버전
- Docker base image
- 컴파일 시 GPU 아키텍처 옵션(sm_xx)
Whisper.cpp, llama.cpp, Selvy STT 서버 자체 빌드 등 모든 GPU 관련 컴파일이 영향을 받음.
- B200 쓰면 CUDA 12.x + 최신 드라이버 필요
- Whisper/LLM을 GPU 가속하려면
→ 빌드 옵션에 sm_100 (Blackwell) 추가 - 도커 이미지도 CUDA 12 기반으로 변경 필요
- TensorRT 기반 최적화 엔진 쓰면 100% 버전 올려야 함
'인공지능' 카테고리의 다른 글
| DVC? (0) | 2025.12.23 |
|---|---|
| ONNX란 무엇인가? (0) | 2025.11.26 |
| RAG 캐시 (0) | 2025.11.21 |
| 임베딩 생성과 모달 정렬의 차이 (RAG와 LLM-ASR 관점에서) (0) | 2025.07.14 |
| 모델 양자화(Quantization)란? (0) | 2025.04.22 |
Comments