OpenAI: GDPVAL-Framework-Checks KI auf realen Jobs
OpenAI hat einen neuen Bewertungsrahmen, das GDPVAL, angekündigt, um künstliche Intelligenzleistung bei wirtschaftlich wertvollen Aufgaben zu messen. Das System testet Modelle auf 1.320 realen Stellenaufgaben, um die Lücke zwischen akademischen…