En fascinerande utveckling inom ai-forskningen har nyligen uppmärksamats där forskare vid Universität von Kalifornien, San Diego Hao Ai Lab Har Genomfört Banbrytande Tester Av Artificiell Intelligens Med Hjälp Av det Klasska TV-SPELTE Tremendous Mario BROS.

DETTA Innovativa TillvägagångssätTt-Repräsentantin Betydande Steg Framåt I Utvecklingen Av Mer Sofistikerade AI-Benchmarking-Metoder.

Forskningprojektet Har Använ Sig Av ett SpecialUtvecklat Ramverk Kallat Gamingagent, Som-Möjligiggör-Integration Mellan AI-System Och Spelet Genom En Emulator. Detta tillåter forskare att Ge Ai-Agenter Grundläggande Instructioner Såsom ”om eTt Hinder Eller teende är nära, Rör dig/Hoppe Åt vämster för att undvika det“, samtidigt som de tar Emot skämdumpar fringta Ai-systemen nermerar ledan kontrollkommandal i bilden av python-kod för att styra mario Genom Spelets Utmanande Miljöer.

Gamingagent-Ramverk För Ai-Testning

Gamingagent-Ramverket Utvecklat AV Forskare Vid College of California San Diego Repräsentant Betetydande Framsteg inom ai-testning för Videospel. DETTA-Spezialisatorerade Verktyg Integrerar en Emulator För Tremendous Mario Bros. Med ett Gänssnitt Som Tillåter ai-modeller att interagera direkt Med Spelett.

De-MEST-Intellesanta Ergebnis von Från testerna Visade ATT Anthropics Claude 3.7-Prestanda Överträffade Sina Konkurrenter, Följt Närra Av Claude 3.5. Dock Uppvisade Både Google Gemini 1.5 Professional Och OpenAs GPT-4 Betydande Svårigheter Med Att Hantera Splets Krävande Miljö.

2048 AI Gameplay Jämförse

En av de mest slående beobachtungerna var att så kallade ”argumenting fashions”, som openais o1, som vanligtvis är överlägsna på Traditionella Benchmark-Tester, Hade Svårigheter Att Presta Vä I detta Sammanhang. DETTA BERODDE FRÄMST På ATT DESSA MEDELLER TAR FRERE SEKunder För Att Fatta Beslut, Vilket är katastrofalt i ett Snabbt Tempo-Spel Där Timing Är avgörande för Framgång.

DETTA FORSKNINGSPROJEKT HAR OCKSå BIDRAGIT TIME EN VIKTIG DISKUSSION OM HUR VI Bör Utvärdera ai-systems förmågor. Som Andrej Karpathy, Forskare och grundande medlem vid openai, påpekar finns det för Förmåga.

Tremendous Mario Bros Erbjuder ETT Unikt Testscenario Som överträffar Traditionella Benchmark-Metoder Genom Sin Komplexitet och Krav På Realtidsbeslut. Spelet Kombinerar Flera Utmanande Aspekter Som Gör det idealikt för Ai-Utveckling:

  • Komplex navigieren I Dynamiska Miljöer
  • Krävande Timing-Baserade Manövrar
  • Behov av långsiktig Strategie Planing
  • RealTidsbelut unter Stressiga Situationer
  • Balans Mellan Kort-Och Långsiktalt Tänkande

Lassen Sie die neuesten Beiträge direkt in Ihren Posteingang geliefert

Von admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert