Wie man LLMs trainiert, um zu „denken“ (O1 & Deepseek-R1)
Im September 2024 veröffentlichte OpenAI sein O1-Modell, das auf groß angelegte Verstärkungslernen ausgebildet wurde und ihm „fortgeschrittene Argumentationsfunktionen“ verleiht. Leider wurden die Particulars darüber, wie sie das abgerufen haben, nie…