auf

NVIDIA AI bringt Nemotron-3-Nano-30B auf NVFP4 mit Quantization Conscious Distillation (QAD) für effiziente Argumentationsinferenz

NVIDIA hat veröffentlicht Nemotron-Nano-3-30B-A3B-NVFP4ein Produktionskontrollpunkt, der ein 30B-Parameter-Argumentationsmodell ausführt 4-Bit-NVFP4 Format bei gleichzeitiger Beibehaltung der Genauigkeit nahe der BF16-Basislinie. Das Modell kombiniert einen Hybrid Mamba2 Transformer Expertenmischung Architektur mit a…

Nous Analysis veröffentlicht NousCoder-14B: Ein wettbewerbsorientiertes Olympia-Programmiermodell, das über Reinforcement Studying auf Qwen3-14B nachtrainiert wurde

Nous Analysis hat NousCoder-14B eingeführt, ein wettbewerbsorientiertes Olympia-Programmiermodell, das auf Qwen3-14B unter Verwendung von Reinforcement Studying (RL) mit überprüfbaren Belohnungen nachtrainiert wird. Beim LiveCodeBench v6-Benchmark, der Probleme vom 01.08.2024 bis…