KI schlägt Mathe-Elite – OpenAI vs Google Kopf-an-Kopf

Künstliche Intelligenz hat einen neuen Meilenstein erreicht: KI-Modelle von OpenAI und Google DeepMind erzielten Goldmedaillen-Leistungen bei der Internationalen Mathematik-Olympiade 2025. Beide Systeme übertrafen dabei die meisten menschlichen Teilnehmer deutlich. Doch während die KI-Giganten ihre mathematischen Überlegenheit demonstrieren, bleibt das Rennen zwischen ihnen weiterhin ausgeglichen.
Die Mathematik-Olympiade gilt als eine der weltweit anspruchsvollsten Wettbewerbe für Schüler und zieht jährlich die brillantesten jungen Köpfe aus aller Welt an. Dass nun Maschinen diese Elite übertreffen, markiert einen Wendepunkt in der Entwicklung künstlicher Intelligenz. OpenAIs o3-Modell und Googles erweiterte Gemini-Version lösten jeweils fünf von sechs Aufgaben korrekt und erreichten damit Punktzahlen, die für Goldmedaillen qualifizieren würden. Die Leistung übertrifft nicht nur die meisten Schüler, sondern auch Googles eigenes System aus dem Vorjahr, das lediglich eine Silbermedaille erreichte.
Besonders bemerkenswert ist der technologische Fortschritt: Während Google 2024 noch ein „formales“ System einsetzte, das menschliche Übersetzung der Probleme in maschinenlesbare Formate benötigte, konnten beide Unternehmen dieses Jahr „informelle“ Systeme präsentieren. Diese verarbeiten die Aufgaben direkt in natürlicher Sprache und generieren beweisorientierte Antworten. „Diese Goldmedaillen-Leistungen repräsentieren Durchbrüche bei KI-Reasoning-Modellen in nicht-verifizierbaren Domänen“, erklärten Forscher beider Unternehmen gegenüber TechCrunch.
Streit um die Bewertungsmethoden
Doch hinter den beeindruckenden Resultaten brodelt ein Konflikt zwischen den Konkurrenten. Google kritisiert OpenAI scharf für die Art der Ankündigung und Bewertung ihrer Ergebnisse. Thang Luong, leitender Forscher bei Google DeepMind, wirft OpenAI vor, voreilig gehandelt zu haben: „Jede Bewertung, die nicht auf den IMO-Richtlinien basiert, kann keinen Anspruch auf Goldmedaillen-Niveau erheben.“
Google arbeitete seit dem Vorjahr eng mit den IMO-Organisatoren zusammen und ließ sein System offiziell bewerten, bevor das Unternehmen am Montag seine Ergebnisse verkündete. OpenAI hingegen engagierte drei ehemalige IMO-Medaillengewinner als externe Bewerter und kündigte bereits am Samstag seine Goldmedaille an – kurz nachdem die offiziellen Schüler-Sieger bekannt gegeben worden waren. Noam Brown von OpenAI verteidigt das Vorgehen: Die IMO-Organisatoren hätten OpenAI erst nachträglich kontaktiert, nachdem das Unternehmen bereits an seinem natürlichsprachlichen System gearbeitet habe.
Der Streit mag kleinlich erscheinen, doch er spiegelt die intensive Konkurrenz in der KI-Branche wider. Beide Unternehmen kämpfen um die öffentliche Wahrnehmung der Technologieführerschaft – ein immaterieller Kampf um „Vibes“, der erhebliche Auswirkungen auf die Gewinnung von Top-Talenten haben kann. Viele KI-Forscher kommen aus dem Bereich der Wettbewerbsmathematik, weshalb Benchmarks wie die IMO besondere Bedeutung haben.
Bedeutung für die KI-Entwicklung
Die mathematischen Erfolge markieren einen wichtigen Wendepunkt für KI-Reasoning-Systeme. Während diese Modelle bei Aufgaben mit eindeutigen Antworten wie einfacher Mathematik oder Programmierung bereits gut abschneiden, kämpfen sie traditionell bei komplexeren, mehrdeutigen Problemen. Die IMO-Aufgaben erfordern jedoch kreatives mathematisches Denken und komplexe Beweisführung – Fähigkeiten, die lange als menschliche Domäne galten.
Die Tatsache, dass nur wenige Prozent der weltbesten Schüler ähnlich gute Ergebnisse wie die KI-Modelle erzielten, unterstreicht die Tragweite dieser Entwicklung. Es zeigt auch, dass das einst dominante OpenAI nun echte Konkurrenz hat. Während das Unternehmen früher einen deutlichen Vorsprung besaß, scheint das Rennen heute ausgeglichener denn je. Mit der erwarteten Veröffentlichung von GPT-5 in den kommenden Monaten will OpenAI seine Führungsposition zurückgewinnen.
Die parallelen Erfolge von OpenAI und Google bei der Mathematik-Olympiade 2025 zeigen deutlich: KI hat menschliche Expertise in einem weiteren anspruchsvollen Bereich übertroffen. Doch während die Systeme gemeinsam neue Höhen erklimmen, bleibt der Wettbewerb zwischen den Technologieriesen intensiver denn je. Die Mathematik mag objektiv sein – der Kampf um die KI-Krone ist es nicht.
