Tencent Hunyuan veröffentlicht HPC-Ops: eine leistungsstarke LLM-Inferenzoperatorbibliothek
Tencent Hunyuan hat Open Supply HPC-Opseine produktionstaugliche Operatorbibliothek für Geräte mit großer Sprachmodell-Inferenzarchitektur. HPC-Ops konzentriert sich auf Low-Degree-CUDA-Kernel für Kernoperatoren wie Consideration, Grouped GEMM und Fused MoE und stellt sie…