DeepSeek sorgt derzeit international für Furore, obwohl das Unternehmen gerade einmal gut ein Jahr alt ist. Die in Hangzhou ansässige KI-Firma hat ein Modell entwickelt, das leistungsmäßig den Top-Chatbots der Branche nahekommen soll – und das offenbar zu deutlich niedrigeren Kosten als viele Konkurrenzprodukte aus dem Silicon Valley.
Was verbirgt sich hinter DeepSeek?
DeepSeek wurde 2023 von Liang Wenfeng in China gegründet, der zuvor einen KI-getriebenen Hedgefonds leitete. Das Unternehmen setzt auf Open-Source-KI-Modelle und hat mit seiner Smartphone-App innerhalb kürzester Zeit in den USA den Spitzenplatz in den iPhone-Downloadcharts erobert. Anders als ChatGPT & Co. zeigt DeepSeek vor seiner finalen Antwort eine Zusammenfassung seines Denkprozesses. Nach Angaben der Firma erbringt das Modell namens R1 eine ähnlich hohe Leistung wie das neueste Modell von OpenAI. Gleichzeitig wird jeder Interessierte ermutigt, eigene Chatbots darauf aufzubauen.
Vergleich mit OpenAI und Meta
Obwohl DeepSeek seine technischen Details nicht vollständig offengelegt hat, deuten die bisher veröffentlichten Informationen darauf hin, dass der Entwicklungs- und Trainingsaufwand um ein Vielfaches geringer ist als bei anderen Branchengrößen wie OpenAI oder Meta. Diese erhöhte Effizienz lässt Zweifel an der Notwendigkeit riesiger Investitionen in Hochleistungs-Grafikprozessoren aufkommen. Besonders in Hinblick auf US-Exportbeschränkungen für fortschrittliche Chips wirft das die Frage auf, ob diese Maßnahmen Chinas KI-Fortschritt tatsächlich verlangsamen können.
DeepSeek R1 erzielt bei mehreren bekannten Benchmarks – etwa AIME 2024 (mathematische Aufgaben), MMLU (Allgemeinwissen) und AlpacaEval 2.0 (Frage-Antwort-Bewertungen) – ähnliche oder sogar bessere Ergebnisse als vergleichbare US-Modelle. Auch auf einer KI-Bestenliste der UC Berkeley-Community liegt es weit vorn.
Warum wächst die Sorge in den USA?
Die US-Regierung hat den Export besonders leistungsfähiger Halbleiter nach China teilweise untersagt, um die technologische Entwicklung dort einzudämmen. DeepSeek zeigt jedoch, dass chinesische Ingenieure kreative Wege finden, auch mit begrenzter Hardware beeindruckende KI-Modelle zu bauen. Ob DeepSeek tatsächlich Zugriff auf die verbotenen High-End-Chips hatte, ist unklar. Fest steht aber, dass die US-Restriktionen nicht verhindern konnten, dass ein hochentwickeltes chinesisches KI-System internationale Aufmerksamkeit auf sich zieht.
Wie DeepSeek zu einem globalen Phänomen wurde
Schon 2023 erregte DeepSeek Interesse, als erste experimentelle Versionen ihres Modells veröffentlicht wurden. Im November präsentierte das Team sein Modell R1, das menschliche Denkprozesse nachahmen soll. Als dann im Januar die offizielle Chatbot-App und eine Webversion an den Start gingen, schossen die Downloadzahlen in die Höhe. Der bekannte Investor Marc Andreessen sprach sogar von einem „Sputnik-Moment“ für die KI-Branche. Aktuellen Daten zufolge wurde die App bis zum 25. Januar etwa 1,6 Millionen Mal heruntergeladen und erreichte Platz 1 in verschiedenen iPhone-App-Stores, darunter in den USA, Großbritannien, China und Australien.
Wer steckt hinter DeepSeek?
Der Gründer Liang Wenfeng, geboren 1985 in Guangdong, hat an der Zhejiang-Universität Elektrotechnik studiert. Mit einem Anfangskapital von 10 Millionen Yuan (umgerechnet rund 1,4 Millionen US-Dollar) baute er DeepSeek auf. In Interviews betont Liang, dass er weniger finanzielle Unterstützung als vielmehr Zugang zu hochwertigen Halbleitern benötigt, die von den US-Sanktionen betroffen sind. Er plädiert dafür, dass China seine eigene Infrastruktur für KI-Hardware aufbauen sollte, anstatt sich auf Nvidia und andere amerikanische Hersteller zu verlassen.
DeepSeeks Rolle im chinesischen KI-Sektor
Größere Technologiekonzerne wie Alibaba, Baidu und Tencent investieren massiv in KI, insbesondere in leistungsstarke Server und Halbleiter, um wettbewerbsfähig zu bleiben. DeepSeek nimmt – gemeinsam mit dem ebenfalls jungen Unternehmen 01.AI – eine besondere Stellung ein, weil es seine Technologie als Open Source bereitstellt. Damit möchte man möglichst viele Entwickler und Interessierte erreichen und ein großes Ökosystem aufbauen. Durch die geringeren Kosten wird der Wettbewerb im KI-Bereich weiter angeheizt, was zuletzt zu mehreren Preissenkungswellen bei großen Anbietern geführt hat.
Auswirkungen auf den weltweiten KI-Markt
Der Erfolg von DeepSeek könnte Druck auf Firmen wie OpenAI oder Meta ausüben, ihre Dienste günstiger anzubieten. Denn DeepSeek stellt in Frage, ob es wirklich Milliardeninvestitionen in riesige Rechenzentren braucht, um ein hochentwickeltes Chat-Modell zu trainieren. Nicht zuletzt deshalb schwankten die Aktienkurse in Asien: Während Investoren vermehrt nach chinesischen KI-Firmen Ausschau halten, verlieren manche Chipproduzenten an Wert, da die Nachfrage nach teuren KI-Prozessoren geringer ausfallen könnte, als ursprünglich angenommen.
Gleichzeitig bauen Entwickler weltweit bereits erste Anwendungen auf Basis von DeepSeeks Technologie. Dies könnte die Verbreitung hochentwickelter KI-Modelle beschleunigen, aber auch neue Debatten über Sicherheitsvorkehrungen, Regulierung und Ethik anfachen.
Die Schwachstellen von DeepSeek
Wie bei anderen chinesischen KI-Lösungen gibt es inhaltliche Beschränkungen. Politisch heikle Themen, etwa um das Tian’anmen-Massaker oder Fragen zu einem möglichen Einmarsch in Taiwan, werden von DeepSeek zurückgewiesen. Kritische Kommentare über das chinesische Staatsoberhaupt sind nicht möglich, während politische Persönlichkeiten außerhalb Chinas durchaus genauer diskutiert werden können.
Ein weiterer Punkt ist die Stabilität der DeepSeek-Server: Anfang Januar gab es kurzzeitig einen größeren Ausfall. Künftige Entwicklungen werden zeigen, ob das Unternehmen den steigenden Nutzerzahlen langfristig gewachsen ist.