Die letzte Prüfung der Menschheit ist eine Ablenkung
# Einführung Die letzte Prüfung der Menschheit (HLE) ist ein Benchmark zur Messung der Argumentations- und Tiefenwissensfähigkeiten der meisten modernen KI-Systeme. Sein charakteristisches Merkmal: Die zugrunde liegende Bewertung ist auf…