- Story
DeepSeek: Um was geht’s beim chinesischen ChatGPT?
07.02.2025 Die chinesische KI DeepSeek scheint gerade die Welt (der KI) auf den Kopf zu stellen. Sarah Dégallier Rochat von der BFH ordnet die Entwicklung aus Sicht einer humanen Digitalisierung ein.
Das Wichtigste in Kürze
- DeepSeek stellt das Narrativ der dominanten amerikanischen KIs in Frage.
- Die chinesische KI scheint weniger energieaufwendig und günstiger zu sein als die amerikanische Konkurrenz.
- DeepSeek stellt die Dominanz von KI-Chip-Hersteller Nvidia in Frage.
- DeepSeek legt seinen Quellcode teilweise offen (Open Source) und ist damit relativ transparent.
DeepSeek ist ein 2023 gegründetes chinesisches Start-up-Unternehmen, das sich auf künstliche Intelligenz spezialisiert hat. Es hat ein Modell entwickelt, dessen Leistung mit der von ChatGPT vergleichbar ist, das aber deutlich weniger Rechenleistung und Entwicklungskosten erfordert.
Ihr Modell beruht zum Teil auf einem Open-Source-Ansatz: Ein Dokument beschreibt detailliert seine Architektur und seine Parameter sind öffentlich zugänglich. Damit schafft die Anwendung eine kleine Revolution in der Welt der KI: Nur wenige Tage nach der Veröffentlichung hat DeepSeek ChatGPT bei den Downloads im App Store von Apple übertroffen.
Warum ist DeepSeek wichtig?
DeepSeek stellt die vorherrschende Erzählung rund um künstliche Intelligenz in Frage, die weitgehend von den grossen US-amerikanischen Technologieunternehmen geprägt wurde. Bisher haben diese Unternehmen massive Investitionen mit mehreren strategischen Argumenten gerechtfertigt:
- KI als geopolitische Herausforderung: Die Vorstellung, dass KI irgendwann die menschliche Intelligenz übertreffen und zu einem Werkzeug der technologischen Dominanz werden wird, treibt sofortige und massive Investitionen an. In den USA äussert sich dies in dem Bestreben, einen Vorsprung vor China zu halten, das als Rivale in einem Wettlauf gegen die Zeit bei der Entwicklung von KI wahrgenommen wird.
- Rechenleistung als Voraussetzung für Fortschritt: Gemäss diesem Narrativ würde eine leistungsfähigere KI immer mehr Rechenleistung erfordern, wobei die ökologischen Auswirkungen als unvermeidlicher Kollateralschaden betrachtet werden.
- Die Vorherrschaft der amerikanischen Big Tech: Ohne die finanziellen Ressourcen, das Fachwissen und den exklusiven Zugang zu fortschrittlichen Technologien, über die die amerikanischen Giganten verfügen, wäre es unmöglich, fortschrittliche KI-Modelle zu entwickeln.
DeepSeek stellt diese Annahmen in Frage, indem es in relativ kurzer Zeit ein Modell entwickelt hat, das so leistungsfähig ist wie die Modelle von ChatGPT, und gleichzeitig seine Architektur teilweise als Open Source zur Verfügung stellt.
Dieser Erfolg beschränkt sich nicht auf einen technologischen Durchbruch: Er rüttelt an der Vorstellung von der amerikanischen Überlegenheit in der KI und stellt die Logik des Wettbewerbs auf der Grundlage proprietärer KI-Modelle wie ChatGPT in Frage.
Inwiefern ist DeepSeek revolutionär?
DeepSeek zeigt, dass es durch die Optimierung der Algorithmen statt der Erhöhung der Rechenleistung möglich ist, ebenso effiziente Modelle zu geringeren Kosten zu entwerfen, und zwar sowohl aus wirtschaftlicher als auch aus ökologischer Sicht.
Der Markteintritt von DeepSeek fiel mit der Ankündigung der US-Regierung von Operation StarGate zusammen, einem Investitionsplan im Wert von 500 Milliarden US-Dollar in die KI. Den verfügbaren Informationen zufolge hätte das Training von DeepSeek jedoch weniger als 6 Millionen US-Dollar gekostet (im Vergleich zu 100 Millionen US-Dollar für ChatGPT) und zehnmal weniger Rechenleistung erfordert.
Das bedeutet zwar nicht das Ende des Wettlaufs um die höchste Rechenleistung, aber es wird die US-Unternehmen zwingen, mehr in die Entwicklung effizienterer Systeme zu investieren.
Dieser Durchbruch hat also direkte Auswirkungen auf die grossen amerikanischen Unternehmen:
Einerseits stellt er ihr technologisches Monopol und ihre Rechtfertigung für kolossale Investitionen in Frage, macht aber auch deutlich, dass diese Unternehmen die Entwicklung sparsamerer Algorithmen trotz der ökologischen Kosten der KI nicht zu einer Priorität gemacht haben.
Andererseits erzeugt sie einen Wettbewerbsdruck auf die Preise: Während OpenAI eine Preiserhöhung in Erwägung zog, um ihre Kosten zu decken, bietet DeepSeek eine wesentlich günstigere Alternative (20- bis 50-mal billiger), was sie dazu zwingen wird, entweder ihr Geschäftsmodell zu überdenken oder Modelle mit deutlich höherer Leistung anzubieten, um wettbewerbsfähig zu bleiben.
Wie hängen DeepSeek und die Börsenkurse grosser Tech-Unternehmen wie NVIDIA zusammen?
Der Aktienkurs von NVIDIA, dem weltweit führenden Hersteller von spezialisierten KI-Chips, fiel um 17 %, was zu einem Verlust von 593 Milliarden US-Dollar an Börsenwert führte. Dieser Rückgang lässt sich durch einen Vertrauensverlust der Anleger erklären.
Bisher galt NVIDIA nämlich als unumgänglicher Akteur für die Entwicklung der KI, insbesondere dank seiner High-End-Chips. Diese Chips sind jedoch aufgrund der US-amerikanischen Exportbeschränkungen in China nicht erhältlich.
DeepSeek ist es trotz der weniger fortschrittlichen Chips gelungen, ein leistungsstarkes Modell zu trainieren. Dies deutet darauf hin, dass Softwareinnovationen und die Optimierung von Algorithmen einen begrenzten Zugang zu fortschrittlicher Hardware ausgleichen können.
Dies ist eine gute Nachricht für die Schweiz, die ebenfalls keinen Zugang mehr zu diesen Chips hat, da sie von den USA nicht als verbündetes Land für die Entwicklung von KI anerkannt wird.
Es ist also einerseits denkbar, dass – wenn es anderen KI-Akteur*innen gelingt, leistungsfähige Modelle mit weniger Rechenleistung zu entwickeln – dies langfristig die Nachfrage nach NVIDIAs ultraleistungsfähigen Chips verringern könnte.
Man kann jedoch auch argumentieren, dass mehr Unternehmen in den Markt einsteigen können, wenn die Entwicklung von KI erschwinglicher wird und entsprechend die Nachfrage nach Chips steigen wird.
Alles in allem spiegelt der Fall von NVIDIA eher eine Marktreaktion auf die wachsende Unsicherheit wider als eine unmittelbare Infragestellung seiner dominanten Position. Die Entwicklung zeigt aber klar, dass die Zukunft der KI nicht nur auf der rohen Leistung der Chips, sondern auch auf algorithmischer Innovation beruht.
Was bedeutet DeepSeek für die Welt der KI?
Wenn die Informationen, die wir haben, korrekt sind, beweist DeepSeek, dass es möglich ist, eine Leistung zu erreichen, die mit der der fortschrittlichsten Modelle vergleichbar ist, und dabei viel weniger Energie zu verbrauchen.
Dies dürfte US-amerikanische Unternehmen dazu veranlassen, ihre Modelle zu optimieren, anstatt die Rechenleistung ständig zu erhöhen, was sich positiv auf den ökologischen Fussabdruck der KI auswirken würde.
Ausserdem fördert DeepSeek, indem es sein Modell teilweise zugänglich macht, einen offeneren und kollaborativeren Ansatz bei der Entwicklung von KI. Dies steht im Gegensatz zu dem proprietären Modell, das von Unternehmen wie OpenAI verfolgt wird und die Macht in den Händen einiger weniger dominanter Akteur*innen zentralisiert.
Letztendlich zeigt der Erfolg von DeepSeek, dass ein junges Start-up-Unternehmen mit einem relativ kleinen Team mit den US-amerikanischen KI-Giganten konkurrieren kann, was deren Monopolstellung in Frage stellt und zu einem vielfältigeren und für die Nutzer*innen kostengünstigeren Angebot führen könnte.
Zuletzt ist DeepSeek ein «chain of thoughts»-Modell wie o1 von ChatGPT. Es ist also ein Modell, das menschliches Denken simuliert, indem es Probleme in einzelne Schritte zerlegt. Das bedeutet, dass es zwar weniger Energie für die Entwicklung (Training) benötigt, aber bei der Nutzung (Inferenz) mehr Energie verbraucht als ein herkömmliches System.
Welche Folgen hat es, dass DeepSeek aus China kommt?
Es gibt zwei Hauptkonsequenzen: die Weltanschauung, die das Modell propagiert, und die Verwendung von Nutzer*innendaten.
Die Tatsache, dass DeepSeek in China entwickelt wird, hat Auswirkungen auf die Informationen, die als «akzeptabel» eingestuft werden. Jedes Modell wird angepasst, um so weit wie möglich zu gewährleisten, dass keine als anstössig eingestuften Inhalte vom System generiert werden.
Wie erwartet vermeidet DeepSeek bestimmte Themen, die für die chinesische Regierung heikel sind, wie Tian'anmen oder die Uiguren. Anstatt jedoch falsche Informationen zu liefern, antwortet das System, dass es sich nicht zu dem Thema äussern kann, was ein transparenterer Ansatz ist.
Bei weniger offensichtlichen historischen oder geopolitischen Fragen ist es hingegen wahrscheinlich, dass die Vorlage eher eine chinesische als eine amerikanische oder westliche Perspektive widerspiegelt und (absichtlich oder unabsichtlich) falsche Informationen vermittelt.
Abgesehen davon haben alle KI-Modelle Verzerrungen, auch die in den USA entwickelten, wo historische und politische Narrative auch von nationalen Sichtweisen beeinflusst werden. Da DeepSeek (teilweise) Open Source ist, haben die Nutzer*innen ausserdem die Möglichkeit, das Modell mit vielfältigeren Daten neu zu trainieren, um bestimmte Verzerrungen abzuschwächen und die vorherrschende Sicht des Systems anzupassen.
Warum ist es wichtig, dass DeepSeek Open Source ist?
Dass DeepSeek teilweise Open Source ist, hilft auch dabei, einige Bedenken hinsichtlich der Datensicherheit zu vermeiden. Tatsächlich ist es möglich, das Modell auf einem eigenen Server zu installieren und auszuführen und so zu vermeiden, dass Daten mit China geteilt werden. Die meisten Nutzer*innen werden jedoch wahrscheinlich die zur Verfügung gestellten chinesischen Server nutzen.
Möglicherweise hat sich DeepSeek gerade deshalb für Open Source entschieden, um solche Anpassungen zu ermöglichen und so die internationale Gemeinschaft über die Verwendung des Modells zu besänftigen. Andererseits stellt sich die Frage, ob dieses Werkzeug, wenn es einmal weitgehend übernommen wurde, nicht auch zu Propagandazwecken eingesetzt werden könnte.
Diese Frage stellt sich zwar auch bei amerikanischen Modellen, doch bei einem chinesischen System könnte das Risiko grösser erscheinen. Die Frage der Datennutzung ist derweil bei chinesischen und bei amerikanischen Systemen ähnlich zu beurteilen.
Was sagen Zweifler*innen zu DeepSeek?
Es ist wichtig anzumerken, dass einige Beobachter*innen der Meinung sind, dass die von DeepSeek geteilten Informationen (Trainingskosten, Anzahl der Chips, ...) nicht der Realität entsprechen und eher eine Marketingaktion widerspiegeln, um in den Weltmarkt einzutreten.
Ausserdem scheint es, dass DeepSeek auf der Basis von ChatGPT trainiert wurde, wodurch sie von der bereits von OpenAI geleisteten Arbeit profitieren konnten.
Ironischerweise beschwert sich OpenAI nun, dass ihre Inhalte gestohlen wurden, um DeepSeek zu trainieren. Dies obwohl OpenAI zugegeben hat, dass sie ihr Modell auf proprietären Inhalten ohne Genehmigung trainiert haben (siehe Beiträge von The Guardian oder Futurism).