DeepSeek-V2 erschüttert die KI-Branche: GPT-4-Leistung zu 1% der Kosten

DeepSeek-V2 erschüttert die KI-Branche: GPT-4-Leistung zu 1% der Kosten

Von
CTOL Editors
2 Minuten Lesezeit

DeepSeek-V2 erschüttert die KI-Branche: Höchste Leistung zu unglaublich niedrigen Kosten

DeepSeek-V2, ein Modell der zweiten Generation von DeepSeek AI Tech aus Hangzhou mit einer Mischung von Experten (MoE), macht mit seinem bemerkenswert niedrigen Preis und seiner wettbewerbsfähigen Leistung Schlagzeilen. Entwickelt von einer Tochtergesellschaft des Quantitative-Hedgefonds Huanfang, hat DeepSeek-V2 schnell den Spitznamen "Preisschlächterer" erhalten, da seine Leistung der von OpenAIs GPT-4 bei fast einem Hundertstel der Kosten entspricht. Mit 2.360 Milliarden Parametern und hocheffizienten Trainingsfähigkeiten stellt DeepSeek-V2 eine erhebliche Herausforderung für führende KI-Modelle weltweit dar.

Wichtige Erkenntnisse

  • Leistung und Kosten: DeepSeek-V2 bietet überlegene Leistung in chinesischen und englischen Benchmarks und konkurriert mit Spitzenmodellen wie GPT-4 und LLaMA3-70B. Seine Kosteneffizienz ist besonders disruptiv, mit einer API-Preisgestaltung von 1 RMB pro eine Million Eingabetokens und 2 RMB für Ausgabetokens, was 1% der Kosten von GPT4 entspricht.
  • Institutionelle Unterstützung: DeepSeek wird strategisch von Huanfang Quantitative unterstützt, das tief in die KI-Technologie vordringt und erhebliche Investitionen und Infrastruktur, einschließlich tausender Nvidia A100-GPUs, nutzt.
  • Marktauswirkungen: Der Start von DeepSeek-V2 wird die Marktdynamik neu definieren, indem hochwertige KI-Fähigkeiten zu deutlich niedrigeren Preisen angeboten werden, was die Dominanz größerer Technologieunternehmen bedroht und die Wettbewerbslandschaft in der KI-Technologie möglicherweise verändert.
  • Profitabilität und Expansion: Trotz niedriger Preise erzielt DeepSeek eine robuste Gewinnmarge von über 70%, was durch seine unglaubliche Trainingseffizienz und hohe Auslastung der Serverkapazitäten möglich ist.
  • Test auf CTOL-Human-F1: Unter Verwendung der offiziellen API haben wir DeepSeek V2 mit unserem eigenen proprietären Testset CTOL-Human-F1 getestet. Unsere erste Bewertung zeigt, dass DeepSeek V2 Llama 3 70B nicht übertrifft, der Abstand ist jedoch nicht groß. Wir vermuten, dass die Ursache in der Sprachdifferenz liegt: Unser Test wurde auf Englisch durchgeführt, während das DeepSeek2-Modell bei chinesischen Aufgaben alle anderen übertrifft. Wir sind jedoch sehr optimistisch, dass DeepSeek in naher Zukunft Llama 3 70B übertreffen wird.

Analyse

Der Markteintritt von DeepSeek-V2 ist nicht nur ein technologischer Fortschritt, sondern auch ein strategischer Schritt, der die Grundlagen der Wirtschaftsmodelle der KI-Branche erschüttert. Durch die Nutzung der bestehenden Infrastruktur und Forschungskapazitäten von Huanfang ist es DeepSeek gelungen, ein Produkt zu liefern, das nicht nur leistungsfähiger ist, sondern dies auch zu einem Bruchteil der Kosten tut. Die Fähigkeit dieses Modells, mit 8,1 Billionen Token zu trainieren und hervorragende Durchsatzraten zu erreichen, unterstreicht einen erheblichen Wandel hin zu einer wirtschaftlich nachhaltigeren KI-Praxis. Die Auswirkungen auf die KI-Anwendung im Geschäftsbereich, insbesondere dort, wo die Kosten ein begrenzender Faktor waren, sind tiefgreifend. Darüber hinaus steht die Branche der Großen Sprachmodelle (LLM) möglicherweise vor einer erheblichen Disruption. OpenAI riskiert, seine Führungsposition zu verlieren, wenn es die Effizienz seiner Modellauswertung nicht verbessert. In diesem hart umkämpften Sektor stellen auch die Verlangsamung der Innovation und ein Mangel an kundenorientierten Produktkenntnissen zusätzliche Bedrohungen für die Dominanz von OpenAI dar. Microsoft, ein wichtiger Cloud-Partner von OpenAI, sowie andere Wettbewerber (Amazon, Google), die stark in den allgemeinen KI-Sektor investiert haben, aber unbefriedigende Produkte lieferten, könnten erhebliche finanzielle Auswirkungen zu spüren bekommen.

Wussten Sie schon?

  • KI als Instrument für den Aktienmarkt? Entgegen den Spekulationen versichert das Management von Huanfang, dass ihre KI-Fortschritte, einschließlich DeepSeek, nicht für die Manipulation des Aktienmarktes bestimmt sind, sondern breitere, bedeutendere Anwendungen haben.
  • Massive Investitionen in KI: Seit 2019 hat Huanfang massiv in KI-Trainingsplattformen investiert, wobei die neueste, Yinghuo-2, von 10.000 Nvidia A100-GPUs unterstützt wird, was den Einsatz des Unternehmens für die Führung in der KI-Entwicklung unterstreicht.
  • Strategische Standorte: DeepSeeks Expansion umfasst ein riesiges Bürogebäude im Pekinger Bezirk Haidian, das einer Fläche von 20 Tennisplätzen entspricht, was den Umfang der Organisation veranschaulicht, mit dem KI-Innovationen vorangetrieben werden.

Das könnte Ihnen auch gefallen

Dieser Artikel wurde von unserem Benutzer gemäß den Regeln und Richtlinien für die Einreichung von Nachrichten. Das Titelbild ist computererzeugte Kunst nur zu illustrativen Zwecken; nicht indikativ für den tatsächlichen Inhalt. Wenn Sie glauben, dass dieser Artikel gegen Urheberrechte verstößt, zögern Sie bitte nicht, dies zu melden, indem Sie uns eine E-Mail senden. Ihre Wachsamkeit und Zusammenarbeit sind unschätzbar, um eine respektvolle und rechtlich konforme Community aufrechtzuerhalten.

Abonnieren Sie unseren Newsletter

Erhalten Sie das Neueste aus dem Unternehmensgeschäft und der Technologie mit exklusiven Einblicken in unsere neuen Angebote