Point 1
딥 러닝 행렬 곱셈 및 누적 수학 작업에 전문화된 4세대 Tensor 코어는
더 많은 데이터 유형을
가속화하고 이전 세대의 Tensor 행렬 연산에 2배 이상의 처리량을 제공할 수 있도록 미세한 구조화된 희소성 기능을 지원합니다.
Ada의 새로운 4세대 Tensor 코어는 믿을 수 없을 정도로 속도가 빨라 Hopper H100 데이터센터 GPU에 처음 도입된 새로운 FP8 트랜스포머 엔진을 사용하여 1.4 Tensor-petaFLOPS까지 처리량을 최대 5배 높여 워크로드를 더욱 효율적으로 실행하도록 지원합니다.
Point 2
NVIDIA는 성능 집약적인 레이 트레이싱 워크로드를 처리하도록 특별히 설계한 GPU 내 전문 프로세싱 코어인 레이 트레이싱 코어(RT 코어)를 발명하여 실시간 레이 트레이싱을 현실로 만들었습니다. Ada의 3세대 RT 코어는 2배의
레이 트라이앵글 교차 처리량을 제공하여 RT-TFLOP 성능을 2배 이상 높입니다. 새로운 RT 코어에는 새로운 불투명도 마이크로맵(OMM) 엔진과 새로운 변위 마이크로 메쉬(DMM) 엔진도 포함되어 있습니다. OMM 엔진을 사용하면 나뭇잎, 입자 및 울타리에 자주 사용되는 알파 테스트 텍스처의 레이 트레이싱 속도가
훨씬 더 빨라집니다. DMM 엔진은 최대 20배 적은 바운딩 볼륨 계층 구조(BVH) 스토리지 공간으로 최대 10배 빠른 BVH 빌드 시간을 제공하여 기하학적으로
복잡한 장면의 실시간 레이 트레이싱을 지원합니다.
Point 3
고급 레이 트레이싱에는 장면 전체에서 수많은 광선이 수없이 다양한 재료
유형에 부딪히는 영향을
계산하여 쉐이더에 대해 갈라지는 비효율적인 순차적 워크로드를 만들어내야 합니다.
(쉐이더는 3D 장면을 렌더링하는 동안 적절한 수준의 빛, 어둠 및 색상을 계산하는 장치로 모든 최신 게임에 사용됩니다.)
쉐이더 실행 재배치(SER) 기술은 이전에 비효율적이었던 워크로드를 훨씬 더 효율적인 워크로드로 동적으로 재구성합니다.
SER은 레이 트레이싱 작업의 쉐이더 성능을
최대 3배, 인게임 프레임 레이트를 최대 25%까지 개선할 수 있습니다.
Point 4
Point 5