LFM2-2.6B-Exp von Liquid AI nutzt reines Reinforcement Studying RL und dynamisches hybrides Denken, um das Verhalten kleiner Modelle zu verbessern
Liquid AI hat LFM2-2.6B-Exp eingeführt, einen experimentellen Prüfpunkt seines LFM2-2.6B-Sprachmodells, der mit reinem Verstärkungslernen auf dem bestehenden LFM2-Stack trainiert wird. Das Ziel ist einfach: Die Befolgung von Anweisungen, Wissensaufgaben und…