Nous Research stellt Hermes 3 KI-Modelle vor

Nous Research stellt Hermes 3 KI-Modelle vor

Von
Kai Takahashi
3 Minuten Lesezeit

Nous Research stellt Hermes 3 KI-Modelle vor

Nous Research hat eine neue Familie von KI-Modellen namens Hermes 3 veröffentlicht, die sich durch ein hohes Maß an Kontrolle und Neutralität auszeichnen und sich von anderen Modellen abheben, die möglicherweise ethische Einschränkungen haben. Die Hermes 3-Modelle sind in drei Größen erhältlich – 8, 70 und 405 Milliarden Parameter – und basieren auf Metas Open-Source Llama 3.1. Diese Modelle sind darauf ausgelegt, Benutzerbefehle genau zu befolgen und sich an verschiedene Weltanschauungen anzupassen, wie von den Benutzern angegeben.

Die Hermes 3-Modelle glänzen bei Aufgaben wie logischem Denken, Belohnungsmodellierung und der Erstellung strukturierter Ausgaben, einschließlich XML-Tags. Darüber hinaus können sie interne Monologe für transparente Entscheidungsfindung generieren und visuelle Inhalte wie Mermaid-Diagramme erstellen. Die Modelle wurden in einem zweistufigen Prozess trainiert, der eine beaufsichtigte Feinabstimmung und eine direkte Präferenzoptimierung umfasste und in der Anfangsphase fast 400 Millionen Tokens verwendete.

In Tests erzielten die Hermes 3-Modelle gute Ergebnisse und führten unter den Open-Source-Modellen in Benchmarks wie ARC, BoolQ, HellaSwag, IFEval und Winogrande. Die Modelle wurden mit einer Mischung aus logischen Aufgaben und kreativen Anwendungen trainiert, wie Rollenspielen und Schreiben. Sie haben auch die Fähigkeit, externe Werkzeuge zu nutzen und Informationen aus Dokumenten über Retrieval Augmented Generation (RAG) abzurufen, was ihre Fähigkeit verbessert, genaue und relevante Antworten zu liefern.

Die Modelle sind auf Hugging Face verfügbar und gewinnen Anerkennung für ihre Vielseitigkeit in einer Reihe von Anwendungen, von geschäftlichen Entscheidungsprozessen bis hin zu kreativen Aufgaben. Experten betrachten Hermes 3 als bedeutenden Akteur im Bereich der KI und spiegeln einen breiteren Trend in der Branche wider, der auf Open-Source-KI-Modelle abzielt, die Flexibilität und Kosteneffizienz für Unternehmen bieten.

Wichtige Erkenntnisse

  • Nous Research veröffentlicht Hermes 3, eine Familie von KI-Sprachmodellen basierend auf Metas Llama 3.1.
  • Die Hermes 3-Modelle kommen in 8, 70 und 405 Milliarden Parametern und sind auf hohe Steuerbarkeit und neutrale Ausrichtung ausgelegt.
  • Die Modelle glänzen bei Aufgaben wie logischem Denken und strukturierten Ausgaben und erzielen Spitzenwerte in öffentlichen Benchmarks.
  • Das Training umfasste eine beaufsichtigte Feinabstimmung und direkte Präferenzoptimierung mit fast 400 Millionen Tokens.
  • Hermes 3-Modelle sind auf Hugging Face verfügbar und unterstützen externe Werkzeuge sowie den Abruf von Dokumenteninformationen.

Analyse

Die Hermes 3 KI-Modelle von Nous Research, basierend auf Metas Llama 3.1, könnten Branchen stören, die präzise KI-Interaktionen erfordern. Ihre hohe Kontrollierbarkeit und neutrale Ausrichtung verbessern Anwendungen in den Bereichen Finanzen, Gesundheitswesen und Recht. Die Verfügbarkeit auf Hugging Face erweitert ihre Zugänglichkeit und könnte den Marktanteil von Nous Research steigern. Wettbewerber könnten Innovationen beschleunigen, um mit den Fähigkeiten von Hermes 3 Schritt zu halten. Langfristig könnten diese Modelle das Verhalten von KI standardisieren und die Entwicklung ethischer KI weltweit beeinflussen.

Wussten Sie schon?

  • Hermes 3 Modelle:
  • Erklärung: Hermes 3 ist eine Serie fortschrittlicher KI-Sprachmodelle, die von Nous Research entwickelt wurde und auf der Open-Source-Architektur Llama 3.1 von Meta basiert. Diese Modelle zeichnen sich durch ein hohes Maß an Kontrollierbarkeit und Neutralität aus, was bedeutet, dass sie Benutzerbefehlen strikt folgen können, ohne dass ethische Einschränkungen bestehen, die andere KI-Modelle möglicherweise haben. Sie sind in drei Größen erhältlich – 8, 70 und 405 Milliarden Parameter – die jeweils für komplexe Aufgaben wie logisches Denken, Belohnungsmodellierung und strukturierte Ausgaben mit XML-Tags ausgelegt sind.
  • Direkte Präferenzoptimierung (DPO):
  • Erklärung: Die direkte Präferenzoptimierung ist eine Technik, die in der Entwicklung der Hermes 3-Modelle verwendet wird. Im Gegensatz zu traditionellen Methoden, die auf beaufsichtigtem Lernen gefolgt von Verstärkungslernen aus menschlichem Feedback basieren, optimiert DPO die Antworten des Modells direkt basierend auf menschlichen Präferenzen, die über ein Belohnungsmodell ausgedrückt werden. Dieser Ansatz vereinfacht den Trainingsprozess und verbessert die Fähigkeit des Modells, sich effektiver an die Benutzerabsichten anzupassen.
  • Retrieval Augmented Generation (RAG):
  • Erklärung: Retrieval Augmented Generation ist eine Technik, die die Fähigkeiten von KI-Modellen wie Hermes 3 verbessert, indem sie ihnen ermöglicht, auf externe Informationsquellen wie Dokumente oder Datenbanken zuzugreifen und diese während der Generierung von Antworten zu nutzen. Dies bedeutet, dass die Modelle genauere und kontextuell relevante Antworten geben können, indem sie relevante Informationen aus diesen externen Quellen einholen, wodurch ihre natürlichen Sprachgenerierungsfähigkeiten ergänzt werden.

Das könnte Ihnen auch gefallen

Dieser Artikel wurde von unserem Benutzer gemäß den Regeln und Richtlinien für die Einreichung von Nachrichten. Das Titelbild ist computererzeugte Kunst nur zu illustrativen Zwecken; nicht indikativ für den tatsächlichen Inhalt. Wenn Sie glauben, dass dieser Artikel gegen Urheberrechte verstößt, zögern Sie bitte nicht, dies zu melden, indem Sie uns eine E-Mail senden. Ihre Wachsamkeit und Zusammenarbeit sind unschätzbar, um eine respektvolle und rechtlich konforme Community aufrechtzuerhalten.

Abonnieren Sie unseren Newsletter

Erhalten Sie das Neueste aus dem Unternehmensgeschäft und der Technologie mit exklusiven Einblicken in unsere neuen Angebote