Triton einen Kernel nach dem anderen lernen: Softmax
Im vorheriger Artikel dieser Serie, Operation in allen Bereichen der Informatik: Matrixmultiplikation. Es wird häufig in neuronalen Netzen verwendet, um die Aktivierung linearer Schichten zu berechnen. Aktivierungen allein sind jedoch…