Am 18.2024 Juni hat Pekings führendes Unternehmen für künstliche Intelligenz DeepSeek offiziell sein neuestes Sprachmodell, DeepSeeker V3, vorgestellt, das bedeutende Durchbrüche in den Bereichen Wissensverständnis, logisches Denken, Codegenerierung und lange Textverarbeitung erzielt hat. Es kündigte an, dass es ab heute kostenlos für die Öffentlichkeit zugänglich sein wird und die inklusive Entwicklung von KI-Technologie weiter fördert.
DeepSeeker V3 Core Highlights
Lange Kontextunterstützung: Das Kontextfenster kann auf 128K-Token erweitert werden, die lange Dokumente, komplexe Codebibliotheken und tiefe Analyseaufgaben präzise verarbeiten können.
Multimodale Funktionserweiterung: Hinzugefügt die Fähigkeit, Dateien wie Bilder, PDFs, Word, Excel usw. zu verstehen. Benutzer können Dokumente für interaktive Analysen direkt hochladen.
Verbesserte mathematische und kodierende Fähigkeiten: In autoritativen Auswertungen wie GSM8K und HumanEval übertreffen DeepSeeker V3 mathematische Argumentations- und Codegenerierungsfähigkeiten GPT-4 Turbo und erreichen branchenführende Niveaus.
Chinesische Optimierung ist bedeutsam: Es wird eine tiefgreifende Optimierung für den chinesischen Kontext durchgeführt, insbesondere in Szenarien wie altem Textverständnis, juristischer Dokumentenerstellung und Finanzanalyse.
DeepSeek Chat vollständig aktualisiert
In Verbindung mit der Veröffentlichung des neuen Modells wurde DeepSeeks intelligenter Assistent DeepSeek Chat synchron aktualisiert und bietet die folgenden neuen Funktionen:
Dateiparsing: Unterstützt das Hochladen von PDF, PPT, Excel und anderen Formaten. KI kann wichtige Informationen automatisch zusammenfassen, übersetzen oder extrahieren.
Online-Suche: Benutzer können den Online-Modus manuell aktivieren, um aktuelle Echtzeit-Informationen (wie Nachrichten, Aktienkurse, wissenschaftliche Forschungstrends) zu erhalten.
API Open: Entwickler können über die DeepSeek API kostengünstig auf Unternehmensanwendungen zugreifen und das zu nur einem Drittel des Preises ähnlicher Produkte.
Der CEO von DeepSeeker erklärte: "DeepSeeker V3 ist nicht nur ein technologischer Meilenstein, sondern auch eine Erfüllung unseres Engagements zur 'KI-Demokratisierung'. In Zukunft werden wir AGI (General Artificial Intelligence) weiter erforschen und dabei einen offenen und integrativen Weg verfolgen.
Auswirkungen auf die Industrie und ökologische Zusammenarbeit
Die Veröffentlichung von DeepSeeker V3 hat mehrere Unternehmen aus Bereichen wie Bildung, Finanzen und Recht zur Zusammenarbeit angezogen. Alibaba Cloud, Tencent Cloud und andere Plattformen haben angekündigt, das Modell zu integrieren, während einige Universitäten und Forschungseinrichtungen planen, es auf akademische Unterstützung und Forschungsanalyse anzuwenden.
Zukunftspläne
DeepSeek enthüllte, dass das nächste Modell der Generation, DeepSeeker V4, in die Trainingsphase eingetreten ist und sich auf Durchbrüche in der multimodalen Interaktion und komplexen Entscheidungsfähigkeiten konzentriert und voraussichtlich in 2025 veröffentlicht wird.
In Bezug auf DeepSeek
DeepSeek ist ein chinesisches Technologieunternehmen, das sich auf die Forschung und Entwicklung von AGI konzentriert und sich der Entwicklung von Weltklasse-Großmodellen verschrieben hat. Zu seinen Produkten gehören DeepSeek Chat, DeepSeek Coder und mehr.