Ai-Forskare-Använder Tremendous Mario Bros I Allt Större Utsträrning För-Benchmarking

En fascinerande utveckling inom ai-forskningen har nyligen uppmärksamats där forskare vid Universität von Kalifornien, San Diego Hao Ai Lab Har Genomfört Banbrytande Tester Av Artificiell Intelligens Med Hjälp Av det Klasska TV-SPELTE Tremendous Mario BROS.

DETTA Innovativa TillvägagångssätTt-Repräsentantin Betydande Steg Framåt I Utvecklingen Av Mer Sofistikerade AI-Benchmarking-Metoder.

Forskningprojektet Har Använ Sig Av ett SpecialUtvecklat Ramverk Kallat Gamingagent, Som-Möjligiggör-Integration Mellan AI-System Och Spelet Genom En Emulator. Detta tillåter forskare att Ge Ai-Agenter Grundläggande Instructioner Såsom ”om eTt Hinder Eller teende är nära, Rör dig/Hoppe Åt vämster för att undvika det“, samtidigt som de tar Emot skämdumpar fringta Ai-systemen nermerar ledan kontrollkommandal i bilden av python-kod för att styra mario Genom Spelets Utmanande Miljöer.

Gamingagent-Ramverk För Ai-Testning

Gamingagent-Ramverket Utvecklat AV Forskare Vid College of California San Diego Repräsentant Betetydande Framsteg inom ai-testning för Videospel. DETTA-Spezialisatorerade Verktyg Integrerar en Emulator För Tremendous Mario Bros. Med ett Gänssnitt Som Tillåter ai-modeller att interagera direkt Med Spelett.

De-MEST-Intellesanta Ergebnis von Från testerna Visade ATT Anthropics Claude 3.7-Prestanda Överträffade Sina Konkurrenter, Följt Närra Av Claude 3.5. Dock Uppvisade Både Google Gemini 1.5 Professional Och OpenAs GPT-4 Betydande Svårigheter Med Att Hantera Splets Krävande Miljö.

2048 AI Gameplay Jämförse

En av de mest slående beobachtungerna var att så kallade ”argumenting fashions”, som openais o1, som vanligtvis är överlägsna på Traditionella Benchmark-Tester, Hade Svårigheter Att Presta Vä I detta Sammanhang. DETTA BERODDE FRÄMST På ATT DESSA MEDELLER TAR FRERE SEKunder För Att Fatta Beslut, Vilket är katastrofalt i ett Snabbt Tempo-Spel Där Timing Är avgörande för Framgång.

DETTA FORSKNINGSPROJEKT HAR OCKSå BIDRAGIT TIME EN VIKTIG DISKUSSION OM HUR VI Bör Utvärdera ai-systems förmågor. Som Andrej Karpathy, Forskare och grundande medlem vid openai, påpekar finns det för Förmåga.

Tremendous Mario Bros Erbjuder ETT Unikt Testscenario Som överträffar Traditionella Benchmark-Metoder Genom Sin Komplexitet och Krav På Realtidsbeslut. Spelet Kombinerar Flera Utmanande Aspekter Som Gör det idealikt för Ai-Utveckling:

Komplex navigieren I Dynamiska Miljöer
Krävande Timing-Baserade Manövrar
Behov av långsiktig Strategie Planing
RealTidsbelut unter Stressiga Situationer
Balans Mellan Kort-Och Långsiktalt Tänkande

Lassen Sie die neuesten Beiträge direkt in Ihren Posteingang geliefert

Ai-Forskare-Använder Tremendous Mario Bros I Allt Större Utsträrning För-Benchmarking

Gamingagent-Ramverk För Ai-Testning

Von admin

Schreibe einen Kommentar Antworten abbrechen

Versäumt

KI-Videoüberwachung für sicherere Unternehmen

Edge Hound Evaluation 2026: Eine intelligentere Möglichkeit, die Märkte mit KI zu lesen

Mac Mini vs. Cloud VPS

So definieren Sie den Modellierungsumfang eines internen Kreditrisikomodells

About

Categories

Tags

Recent Post

KI-Videoüberwachung für sicherere Unternehmen

Edge Hound Evaluation 2026: Eine intelligentere Möglichkeit, die Märkte mit KI zu lesen

Gamingagent-Ramverk För Ai-Testning

Von admin

Ähnlicher Beitrag

Schreibe einen Kommentar Antworten abbrechen

Versäumt