Die Veröffentlichung von DeepSeek, einem neuen KI-gestützten Chatbot aus China, hat die Technologiebranche aufgerüttelt. Innerhalb kürzester Zeit überholte die App OpenAIs ChatGPT als meistgeladene kostenlose iOS-App in den USA. Gleichzeitig verlor der Chip-Hersteller Nvidia an einem einzigen Tag fast 600 Milliarden Dollar an Marktwert – ein Rekord an der US-Börse.
Doch was macht DeepSeek so besonders?
Effizienter, günstiger, leistungsstark
DeepSeek setzt auf ein sogenanntes Large Language Model (LLM) mit beeindruckenden Denk- und Argumentationsfähigkeiten, die mit US-amerikanischen Modellen wie OpenAIs GPT-4 vergleichbar sein sollen – jedoch zu einem Bruchteil der Kosten.
Laut DeepSeek konnte diese Effizienzsteigerung durch mehrere technische Tricks erreicht werden:
- Reduzierter Rechenaufwand beim Training des Modells (R1)
- Geringerer Speicherverbrauch, was die Betriebskosten senkt
- Optimierte Nutzung von Nvidia-GPUs, trotz Exportbeschränkungen der USA
Während OpenAI über 100 Millionen Dollar für das Training von GPT-4 ausgegeben haben soll, wurde DeepSeeks Modell für unter 6 Millionen Dollar entwickelt – ein Bruchteil der Kosten. Trainiert wurde es auf rund 2.000 Nvidia H800 GPUs, einer Version der H100-Chips, die speziell für den chinesischen Markt angepasst wurde. Diese GPUs wurden vermutlich rechtzeitig vor den neuen US-Exportverboten im Oktober 2023 auf Vorrat gekauft.
Ein umweltfreundlicheres KI-Modell?
Ein weiterer potenzieller Vorteil von DeepSeek ist der geringere Energieverbrauch. Künstliche Intelligenz verbraucht enorme Mengen an Strom und Wasser, vor allem zur Kühlung der Server in Rechenzentren. Schätzungen zufolge verursacht ChatGPT monatlich über 260 Tonnen CO₂ – das entspricht 260 Transatlantikflügen.
Sollte DeepSeek tatsächlich energieeffizienter sein, könnte das nicht nur die Betriebskosten senken, sondern auch eine nachhaltigere Zukunft für KI-Technologien einläuten. Allerdings bleibt abzuwarten, ob ein günstigeres Modell nicht einfach zu mehr Nutzern führt – und damit den Gesamtverbrauch wieder steigen lässt.
Transparenz als Trumpf
Ein weiteres Unterscheidungsmerkmal von DeepSeek ist die vergleichsweise offene Struktur des Modells. Während OpenAIs GPT-4 ein Blackbox-Modell bleibt, hat DeepSeek einige seiner technischen Details – darunter die „Gewichte“ (numerische Parameter des Modells) – veröffentlicht. Forscher weltweit haben somit die Möglichkeit, den Algorithmus zu analysieren, anzupassen und weiterzuentwickeln.
Allerdings gibt es auch hier Einschränkungen: Die genauen Trainingsdaten und der zugrunde liegende Code bleiben geheim, sodass Wissenschaftler versuchen müssen, diese Lücken zu schließen.
Kleiner Herausforderer gegen „Big Tech“
Besonders bemerkenswert ist, dass DeepSeek erst 2023 gegründet wurde – und dennoch so schnell ein konkurrenzfähiges Modell auf den Markt bringen konnte. Unternehmensgründer Liang Wenfeng wird in China bereits als „KI-Held“ gefeiert.
Ähnlich wie das französische Start-up Mistral AI, das mit seinem Mixtral 8x7B-Modell für Aufsehen sorgte, nutzt DeepSeek das Prinzip der „Mixture of Experts“. Dabei handelt es sich um eine Kombination aus mehreren kleineren Modellen, die jeweils auf bestimmte Aufgaben spezialisiert sind und gemeinsam die bestmögliche Antwort generieren.
Sogar die gescheiterten Ansätze wurden von DeepSeek offengelegt – zum Beispiel Experimente mit der Monte-Carlo-Baumsuche, einer Technik zur Verbesserung der logischen Schlussfolgerungen von KI-Modellen. Solche Transparenz ist selten und könnte der Forschung wertvolle Einblicke geben.
Was bedeutet DeepSeek für die Zukunft der KI?
DeepSeek zeigt, dass nicht nur große Tech-Konzerne mit Milliardenbudgets leistungsfähige KI-Modelle entwickeln können. Künftig könnten immer mehr kosteneffiziente Modelle entstehen, die mit weniger Ressourcen auskommen und trotzdem hohe Leistung erbringen.
Donald Trump bezeichnete den Aufstieg von DeepSeek bereits als „Weckruf für die US-Tech-Branche“. Denn bislang dominierten Unternehmen wie OpenAI, Google und Meta das Feld. Doch wenn kleinere Firmen plötzlich mit innovativen und günstigen Lösungen konkurrieren können, könnte das die KI-Landschaft grundlegend verändern.
Auch für Nvidia ist dies nicht zwangsläufig eine schlechte Nachricht: Günstigere KI-Modelle könnten die Technologie noch zugänglicher machen und so die Nachfrage nach leistungsstarken Chips sogar steigern.
Fazit
DeepSeek könnte sich als Gamechanger für die KI-Branche erweisen – nicht nur durch seine Kosteneffizienz, sondern auch durch seine technischen Innovationen und den offenen Forschungsansatz. Wenn sich das Modell bewährt, könnte es den Wettbewerb auf dem KI-Markt neu definieren – und möglicherweise einen Wandel hin zu nachhaltigerer und effizienterer KI einleiten.
Die nächsten Monate werden zeigen, ob DeepSeek wirklich hält, was es verspricht – oder ob es nur ein kurzfristiges Phänomen bleibt. Eines ist jedoch sicher: Die KI-Welt wird diesen Herausforderer nicht unterschätzen