Microsoft stellt Maia 200 vor, einen für FP4 und FP8 optimierten KI-Inferenzbeschleuniger für Azure-Rechenzentren
Maia 200 ist Microsofts neuer hauseigener KI-Beschleuniger, der für Inferenz in Azure-Rechenzentren entwickelt wurde. Es zielt auf die Kosten der Token-Generierung für große Sprachmodelle und andere Schlussfolgerungsarbeitslasten ab, indem es…