NVIDIA AI bringt Nemotron-3-Nano-30B auf NVFP4 mit Quantization Conscious Distillation (QAD) für effiziente Argumentationsinferenz
NVIDIA hat veröffentlicht Nemotron-Nano-3-30B-A3B-NVFP4ein Produktionskontrollpunkt, der ein 30B-Parameter-Argumentationsmodell ausführt 4-Bit-NVFP4 Format bei gleichzeitiger Beibehaltung der Genauigkeit nahe der BF16-Basislinie. Das Modell kombiniert einen Hybrid Mamba2 Transformer Expertenmischung Architektur mit a…