Grok 3 gegen Deepseek R1: Was ist besser?

Noch vor wenigen Monaten schüttelte Deepseek die KI -Welt mit seinen Modellen V3, R1 und Janus. Und vor kurzem ist Elon Musks Grok 3 der Social gathering beigetreten! Mit der Behauptung, die intelligenteste KI der Erde zu sein, sind die Erwartungen von GROK 3 ziemlich hoch. Laut den offiziellen Benchmarks, die das XAI -Staff beim Startveranstaltung geteilt hat, scheint es ein Monstermodell zu sein, das alle seine Konkurrenten auf mehreren Benchmarks übertrifft. Aber ist es tatsächlich intestine genug für regelmäßige Aufgaben, die Sie und ich in unserem täglichen Leben tun? Lohnt es sich, 40 US -Greenback für ein X Premium+ -Konto auszugeben, um auf das Modell zuzugreifen? Sie werden die Antworten bis zum Ende dieses Artikels auf jeden Fall kennen. Beginnen wir unseren Wettbewerb und testen GROK 3 gegen Deepseek R1 an fünf verschiedenen Eingaben!

Aufgabe 1: Python -Codegenerierung

Eingabeaufforderung: “Schreiben Sie eine Python-Funktion, um ein zufälliges Labyrinth mithilfe der Tiefen-First-Suche zu generieren und sie mit Matplotlib zu visualisieren. “

Grok 3

import random
import numpy as np
import matplotlib.pyplot as plt

def generate_maze(width, top):
    """
    Generate a random maze utilizing Depth-First Search and visualize it with Matplotlib.
    
    Parameters:
    width (int): Width of the maze (variety of columns)
    top (int): Peak of the maze (variety of rows)
    """
    # Initialize the maze grid with partitions (1) and paths (0)
    maze = np.ones((top * 2 + 1, width * 2 + 1), dtype=int)
    maze(1::2, 1::2) = 0  # Set paths (odd rows/columns) to 0
    
    def carve_path(x, y):
        """
        Recursively carve paths within the maze utilizing DFS.
        """
        instructions = ((0, 2), (2, 0), (-2, 0), (0, -2))  # Down, Proper, Up, Left
        random.shuffle(instructions)
        
        for dx, dy in instructions:
            new_x, new_y = x + dx, y + dy
            if (0 <= new_x < top * 2 + 1 and 
                0 <= new_y < width * 2 + 1 and 
                maze(new_x, new_y) == 1):
                maze(new_x - dx // 2, new_y - dy // 2) = 0  # Take away wall
                maze(new_x, new_y) = 0  # Carve path
                carve_path(new_x, new_y)
    
    # Begin carving from the top-left path (1,1)
    carve_path(1, 1)
    
    # Guarantee entrance and exit are open (top-left and bottom-right paths)
    maze(0, 1) = 0  # Entrance
    maze(-1, -2) = 0  # Exit
    
    # Visualize the maze
    plt.determine(figsize=(width // 2, top // 2))
    plt.imshow(maze, cmap='binary', interpolation='nearest')
    plt.title("Random Maze Generated with DFS")
    plt.axis('off')
    plt.present()
    
    return maze

# Instance utilization
if __name__ == "__main__":
    # Generate a 10x10 maze (precise grid shall be 21x21 on account of partitions)
    maze = generate_maze(10, 10)#import csv

Deepseek R1:

import random
import matplotlib.pyplot as plt

def generate_maze(width, top):
    # Initialize the grid with partitions (1)
    grid = ((1 for _ in vary(width)) for _ in vary(top))
    
    # Place to begin
    start_x, start_y = 1, 1
    grid(start_y)(start_x) = 0
    
    # Stack for DFS
    stack = ((start_x, start_y))
    
    # Instructions: up, proper, down, left
    instructions = ((0, -2), (2, 0), (0, 2), (-2, 0))
    
    whereas stack:
        x, y = stack(-1)
        random.shuffle(instructions)
        
        for dx, dy in instructions:
            nx, ny = x + dx, y + dy
            if 0 < nx < width - 1 and 0 < ny < top - 1 and grid(ny)(nx) == 1:
                grid(ny)(nx) = 0
                grid(y + dy // 2)(x + dx // 2) = 0
                stack.append((nx, ny))
                break
        else:
            stack.pop()
    
    return grid

def plot_maze(grid):
    top = len(grid)
    width = len(grid(0))
    
    fig, ax = plt.subplots(figsize=(width, top))
    ax.set_xticks(())
    ax.set_yticks(())
    
    for y in vary(top):
        for x in vary(width):
            if grid(y)(x) == 1:
                ax.add_patch(plt.Rectangle((x, top - y - 1), 1, 1, coloration="black"))
    
    ax.set_xlim(0, width)
    ax.set_ylim(0, top)
    ax.set_aspect('equal')
    plt.gca().invert_yaxis()
    plt.present()

# Parameters
maze_width = 21  # Ought to be odd
maze_height = 21  # Ought to be odd

# Generate and plot the maze
maze = generate_maze(maze_width, maze_height)
plot_maze(maze)#import csv

Ausgabe:

GROK 3 gegen Deepseek R1- Code Generation.Webp

Beobachtung:

Die Deepseek R1-Ausgabe zeigt ein klares, intestine strukturiertes Labyrinth, das professionell erzeugt erscheint. Die scharfen und konsistenten Wände erzeugen ein ordnungsgemäß geschlossenes Labyrinth, um ein herausforderndes, aber visuell sauberes Pfadfindungserlebnis zu gewährleisten. Es hält sich an gute Labyrinth-Generationsprinzipien und macht es sowohl funktional als auch ästhetisch ansprechend.

Im Gegensatz dazu erscheint der GROK 3-Ausgang stark pixiert, mit weniger unterscheidbaren Pfaden aufgrund der dicken Schwarz-Weiß-Gitterstruktur. Das Gesamtdesign fühlt sich chaotischer an, wobei Wege, die im Vergleich zu Deepseek R1 weniger definiert sind, weniger definiert sind. Während es die Erzeugung von Tiefen-First-Suchern (DFS) verwendet, sind die visuelle Klarheit und die Benutzerfreundlichkeit erheblich minderwertig, was es zu einer weniger effektiven Labyrinthdarstellung macht.

Urteil:

Grok 3 ❌ | Deepseek R1 ✅

Aufgabe 5: Websuche

Da Deepseek R1 keine Websuche erlaubt, habe ich Deepseek -Suchoption für diese Aufgabe verwendet!

Immediate: “Was sind die neuesten Fortschritte bei der Nuclear Fusion Know-how ab 2025? Aus Ourput – Liste der Fortschritte +Quelle “

Beobachtung:

Zwischen Deepseek R1 und GROK 3 ist Deepseek R1 das bessere Modell für die Beantwortung von Forschungsanfragen wie Fortschritten in der nuklearen Fusionstechnologie. Der größte Vorteil von Deepseek R1 besteht darin, dass es direkte, klickbare Quelllinks für jede Behauptung bietet, um Transparenz und Glaubwürdigkeit zu gewährleisten. Es deckt auch eine breitere Palette von Fortschritten ab, darunter Fusion Gasoline-Technologie, non-public Investitionen, regulatorische Veränderungen und staatliche Initiativen, wodurch seine Reaktion umfassender wird. Darüber hinaus stammen seine Quellen aus maßgeblichen Plattformen wie Iter, Ukaea und dem US -DOE, was die Vertrauenswürdigkeit erheblich verbessert.

Andererseits, während GROK 3 eine bessere Erklärungstiefe liefert, ist es in der Glaubwürdigkeit zu kurz, da es keine direkten Quellverbindungen enthält. Stattdessen verweist es vage auf Information Retailers wie BBC Information oder MIT -Nachrichten ohne ordnungsgemäße Zitate. Eine große Schwäche ist die Abhängigkeit von Posts von X (Twitter), die häufig nicht überprüfte Ansprüche enthalten. Während GROK 3 diese Einschränkungen anerkennt, macht es das Fehlen von konkreten Quellen für die sachliche Forschung weniger zuverlässig.

Urteil:

Grok 3 ❌ | Deepseek R1 ✅

Aufgabe 3: Grundlegende Animation mit HTML

Immediate: „Erstellen Sie den HTML + CSS -Code für einen roten Ball, der sich kontinuierlich in einem Quadrat dreht.“

Grok 3:

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta title="viewport" content material="width=device-width, initial-scale=1.0">
    <title>Rotating Purple Ball in Sq.</title>
    <fashion>
        physique {
            margin: 0;
            padding: 0;
            top: 100vh;
            show: flex;
            justify-content: middle;
            align-items: middle;
            background-color: #f0f0f0; /* Gentle grey background for distinction */
            overflow: hidden;
        }

        .container {
            place: relative;
            width: 300px;
            top: 300px;
            background-color: #000; /* Black sq. */
            border: 2px strong #333; /* Darkish border for visibility */
        }

        .ball {
            place: absolute;
            width: 30px;
            top: 30px;
            background-color: #ff0000; /* Purple ball */
            border-radius: 50%; /* Makes it round */
            animation: rotateBall 3s linear infinite; /* Steady rotation */
            transform-origin: 150px 150px; /* Heart of the sq. (150px from left/prime) */
        }

        @keyframes rotateBall {
            0% {
                remodel: rotate(0deg) translate(120px) rotate(0deg);
            }
            100% {
                remodel: rotate(360deg) translate(120px) rotate(-360deg);
            }
        }
    </fashion>
</head>
<physique>
    <div class="container">
        <div class="ball"></div>
    </div>
</physique>
</html>

Deepseek R1:

<!DOCTYPE html>
<html>
<head>
    <fashion>
        .container {
            width: 200px;
            top: 200px;
            border: 2px strong #000;
            margin: 50px auto;
            place: relative;
            overflow: hidden;
        }

        .observe {
            width: 100%;
            top: 100%;
            animation: rotate 4s linear infinite;
            transform-origin: middle;
        }

        .ball {
            width: 20px;
            top: 20px;
            background-color: pink;
            border-radius: 50%;
            place: absolute;
            prime: 0;
            left: 50%;
            remodel: translateX(-50%);
        }

        @keyframes rotate {
            from {
                remodel: rotate(0deg);
            }
            to {
                remodel: rotate(360deg);
            }
        }
    </fashion>
</head>
<physique>
    <div class="container">
        <div class="observe">
            <div class="ball"></div>
        </div>
    </div>
</physique>
</html>

Ausgabe:

Beobachtung:

GROK 3 kämpft eindeutig, die Eingabeaufforderung zu interpretieren und die richtige Antwort zu erzeugen. Deepseek R1 brauchte ungefähr 8-10 Minuten, um zu antworten, aber seine Ausgabe ist präziser und genauer.

Urteil:

Grok 3 ❌ | Deepseek R1 ✅

Aufgabe 4: Bildanalyse

Immediate: “Analysieren Sie diese Schachbrettposition. Schlagen Sie den besten Schritt für den aktuellen Spieler (Weiß) vor, um schwarz zu checkmatern und die Argumentation zu erklären“

Grok 3:

Deepseek R1:

Beobachtung:

Sowohl Grok 3 als auch Deepseek R1 haben die Antwort falsch verstanden. GROK 3 schlug E4-E5 vor, das den König weder Checkmate liefert noch bedroht. Deepseek R1 schlug QE1#vor, aber dieser Schritt ist in der gegebenen Place unmöglich und zeigt, dass es das Board falsch interpretiert hat. Der korrekte Schritt struggle QF7#, bei dem die Königin Checkmate liefert, indem er den schwarzen König gefangen hat. GROK 3 erkannte einen sofortigen Scheckmeister nicht an, während Deepseek R1 das falsche Board -Setup übernahm, anstatt die tatsächliche Place zu analysieren.

Urteil:

Grok 3 ❌ | Deepseek R1 ❌

Aufgabe 5: Logische Argumentation

Immediate: “Lösen Sie dieses Zebra -Puzzle. Gib mir Ausgabe in einer Tabelle. “

Grok 3:

Die generierte Antwort in das Puzzle stellen:

Deepseek R1:

Die generierte Antwort in das Puzzle stellen:

Beobachtung:

Deepseek R1 brauchte erneut länger, um zu antworten, gab aber die richtige Antwort. Grok 3 konnte das Bild nicht verstehen und gab eine falsche Ausgabe.

Urteil:

Grok 3 ❌ | Deepseek R1 ✅

Grok 3 gegen Deepseek R1: Ergebnis

Python Code -Generierung	✅ Deepseek R1
Websuche	✅ Deepseek R1
Basisanimation (HTML + CSS)	✅ Deepseek R1
Bildanalyse (Schachbrett -Checkmate)	❌ Beide sind gescheitert
Logisches Denken (Zebra -Puzzle)	✅ Deepseek R1

Lesen Sie auch:

Endnote

Elon Musks Grok 3 wurde als Sport-Changer in AI gehypniert und behauptet, das intelligenteste Modell der Erde zu sein. Bei realen Checks konnte es jedoch nicht den Erwartungen gerecht werden. Bei mehreren Aufgaben kämpfte GROK 3 mit Genauigkeit, logischem Denken und komplexer Problemlösung und erzeugte häufig falsche oder schlecht strukturierte Antworten. In der Zwischenzeit hat Deepseek R1 es konsequent übertroffen und in Schlüsselbereichen wie Codegenerierung, Websuche und logischem Denken genauere, strukturierte und überprüfbare Antworten liefert.

Trotz der mutigen Marketingansprüche hat GROK 3 noch einen langen Weg vor sich, bevor es mit High -KI -Modellen konkurrieren kann. Die Tatsache, dass es grundlegende Argumentationsaufgaben nicht bestanden haben, legt nahe, dass XAI wesentliche Verbesserungen in seinem Trainingsansatz benötigt. Angesichts der Erfolgsbilanz von Musk in der schnellen Iteration und der Verbesserungen wird es jedoch interessant sein zu sehen, ob zukünftige Updates diese Lücke schließen können. Wird sich Grok 3 in das KI -Kraftpaket entwickeln, das es zu sein behauptet, oder wird es ein überprüftes Experiment bleiben? Die Zeit wird es sagen.

Bleib dran Analytics Vidhya Weblog Um GROK 3 -Updates regelmäßig zu folgen!

Hallo, ich bin Nitika, ein technisch versierter Content material-Ersteller und Vermarkter. Kreativität und neue Dinge lernen natürlich für mich. Ich habe Experience bei der Erstellung von ergebnisgesteuerten Inhaltsstrategien. Ich bin mit website positioning -Administration, Key phrase -Operationen, Webinhalten, Kommunikation, Inhaltsstrategie, Bearbeitung und Schreiben intestine vertraut.

Grok 3 gegen Deepseek R1: Was ist besser?

Aufgabe 1: Python -Codegenerierung

Aufgabe 5: Websuche

Aufgabe 3: Grundlegende Animation mit HTML

Aufgabe 4: Bildanalyse

Aufgabe 5: Logische Argumentation

Grok 3 gegen Deepseek R1: Ergebnis

Endnote

Von admin

Schreibe einen Kommentar Antworten abbrechen

Versäumt

Forscher unterrichten LLMs, um komplexe Planungsherausforderungen zu lösen | MIT Nachrichten

Optimierung der Markenregistrierung mit Datenanalysen

MLCommons veröffentlicht MLPerf Inference V5.0 Benchmark -Ergebnisse

Pyscript vs. JavaScript: Eine Schlacht der Net -Titanen

About

Categories

Tags

Recent Post

Forscher unterrichten LLMs, um komplexe Planungsherausforderungen zu lösen | MIT Nachrichten

Optimierung der Markenregistrierung mit Datenanalysen

Aufgabe 1: Python -Codegenerierung

Aufgabe 5: Websuche

Aufgabe 3: Grundlegende Animation mit HTML

Aufgabe 4: Bildanalyse

Aufgabe 5: Logische Argumentation

Grok 3 gegen Deepseek R1: Ergebnis

Endnote

Von admin

Ähnlicher Beitrag

Schreibe einen Kommentar Antworten abbrechen

Versäumt