dev.Log

블랙웰(Blackwell) 아키텍처 본문

인공지능

블랙웰(Blackwell) 아키텍처

초코푸딩 2025. 11. 26. 14:46

NVIDIA가 GPT-5/6 시대를 대비해 만든 차세대 AI 가속용 GPU 아키텍처.
“초거대 모델 학습·추론을 빠르게, 전력은 더 적게, NVLink로 GPU 간 통합을 더 강하게”가 목표.

GPU가 바뀌면 반드시 소프트웨어 스택도 같이 업그레이드해야 한다.

필수로 따라 올라가는 것:

  1. NVIDIA 드라이버
  2. CUDA Toolkit
  3. cuDNN / TensorRT / NCCL
  4. PyTorch/TF 버전
  5. Docker base image
  6. 컴파일 시 GPU 아키텍처 옵션(sm_xx)

 

 

Whisper.cpp, llama.cpp, Selvy STT 서버 자체 빌드 등 모든 GPU 관련 컴파일이 영향을 받음.

  • B200 쓰면 CUDA 12.x + 최신 드라이버 필요
  • Whisper/LLM을 GPU 가속하려면
    → 빌드 옵션에 sm_100 (Blackwell) 추가
  • 도커 이미지도 CUDA 12 기반으로 변경 필요
  • TensorRT 기반 최적화 엔진 쓰면 100% 버전 올려야 함

'인공지능' 카테고리의 다른 글

DVC?  (0) 2025.12.23
ONNX란 무엇인가?  (0) 2025.11.26
RAG 캐시  (0) 2025.11.21
임베딩 생성과 모달 정렬의 차이 (RAG와 LLM-ASR 관점에서)  (0) 2025.07.14
모델 양자화(Quantization)란?  (0) 2025.04.22
Comments