für

OpenAI veröffentlicht LifeSciBench, einen 750-Aufgaben umfassenden Benchmark zur Bewertung von KI-Modellen für reale lebenswissenschaftliche Forschung mit von Experten verfassten Rubriken

Die meisten Biologie-Benchmarks stellen eng gefasste, faktenbasierte Fragen mit klaren Antworten. Wissenschaftler wägen unvollständige Beweise ab und treffen Entscheidungen. OpenAI hat LifeSciBench veröffentlicht und zielt direkt auf diese Lücke. Selbst…