Zum Hauptinhalt springen

KI-Modelle

Auf der Seite für KI-Modelle konfiguriert ein Administrator die Chat-Modelle, die msg.ZenTestAI verwenden kann. Pro Mandant (Tenant) können mehrere Modelle konfiguriert werden — typischerweise ein kostengünstiges Modell für Aufgaben mit hohem Volumen (Elementidentifikation, einfache Entscheidungen), ein bildfähiges Modell für Assertions und ein leistungsstarkes Reasoning-Modell für den KI-Assistenten.

Modelle werden pro Mandant (Produkt) konfiguriert. Es gibt keine globale Modellregistrierung.

Wo die Konfiguration erfolgt

Konfigurieren Sie KI-Modelle unter Administration → Wählen Sie Ihren Mandanten → Registerkarte KI. Die Seite listet alle konfigurierten Modelle auf und ermöglicht es Ihnen, mit der +-Aktion neue Modelle hinzuzufügen.

Nach dem Speichern sind die konfigurierten Modelle an folgenden Stellen auswählbar:

  • In den Feldern für das Standardmodell unter Mandanteneinstellungen (Assertions, Elementidentifikation, Schrittidentifikation, Agenten).
  • In der schrittspezifischen Überschreibung des KI-Modells auf der Registerkarte Schritte.

Unterstützte Anbieter

msg.ZenTestAI liefert Konnektoren für sieben Anbieterplattformen mit. Wählen Sie zuerst einen Anbieter; das Formular passt sich dann an und zeigt nur die für diesen Anbieter relevanten Felder an.

AnbieterVerwendung für
OpenAIÖffentliche API von OpenAI (api.openai.com oder ein kompatibler Reverse Proxy).
Azure OpenAIOpenAI-Modelle, die als Deployments in Ihrem Azure-Abonnement gehostet werden.
AnthropicÖffentliche API von Anthropic (api.anthropic.com oder kompatibles Relay).
AWS BedrockAnthropic Claude (und andere), gehostet über AWS Bedrock.
Google GeminiÖffentliche Gemini-API von Google (generativelanguage.googleapis.com).
Google Vertex AIGemini, gehostet auf Google Cloud Vertex AI.
Azure AI StudioModelle der Llama-Familie und andere Modelle, die über Azure AI Studio-Deployments bereitgestellt werden.

Unterstützte Modelle

Jeder Anbieter stellt eine kuratierte Liste von Basismodellen bereit. Die nachstehende Liste entspricht dem aktuellen Stand zum Zeitpunkt der Erstellung dieses Dokuments – das tatsächliche Dropdown-Menü in Ihrem Mandanten spiegelt wider, was die Plattform aktuell unterstützt.

OpenAI / Azure OpenAI

BasismodellAnmerkungen
gpt-5, gpt-5.2Aktuellste GPT-5-Generation. Reasoning-fähig.
gpt-5-mini, gpt-5-nanoKostengünstigere GPT-5-Varianten. Reasoning-fähig.
gpt-4.1Reasoning-Modell der mittleren Klasse.
gpt-4.1-mini, gpt-4.1-nanoKostengünstigere 4.1-Varianten.
gpt-4oAllzweckmodell, bildfähig.
gpt-4o-miniKostengünstig, bildfähig.
gpt-o3, gpt-o3-mini, gpt-o4-miniDedizierte Reasoning-Modelle.
openai-generic / openai-reasoning-generic"Eigenes Modell" — verwenden Sie dies, wenn Sie ein OpenAI-kompatibles Modell einbinden möchten, das nicht in der kuratierten Liste steht.
azure-openai-generic / azure-openai-reasoning-genericGleiches Prinzip, jedoch für Azure-gehostete Deployments.

Anthropic / AWS Bedrock

BasismodellAnmerkungen
claude-4-6-opusAktuelles Flaggschiff Claude. Reasoning-fähig. Empfohlen für den KI-Assistenten.
claude-4-6-sonnetAktuelles Qualitätsmodell Claude. Reasoning-fähig.
claude-4-5-sonnetVorherige Sonnet-Generation. Reasoning-fähig.
claude-4-5-haikuAktuelles kostengünstiges Claude. Reasoning-fähig.
claude-3-7-sonnetÄlteres Sonnet (wird weiterhin unterstützt).
claude-3-5-sonnetBildfähig, weit verbreitet.
claude-3-haikuKostengünstig, kein Reasoning.
bedrock-generic / bedrock-reasoning-generic"Eigenes Modell" — verwenden Sie dies, um auf jedes Bedrock-gehostete Modell über dessen Anbieter-ID zu verweisen.

Dieselbe Claude-Modelle sind sowohl über Anthropic (direkte API) als auch über AWS Bedrock (verwaltet) erreichbar.

Google Gemini / Vertex AI

BasismodellAnmerkungen
gemini-3.1-proAktuelles Flaggschiff Gemini. Reasoning-fähig.
gemini-3.1-flash-liteAktuelles kostengünstiges Gemini. Reasoning-fähig.
gemini-3-pro, gemini-3-flashGemini 3.0-Familie.
gemini-2.5-proHohe Qualität, Reasoning-fähig.
gemini-2.5-flash, gemini-2.5-flash-liteSchnelle, kostengünstige Varianten.
gemini-2.0-pro, gemini-2.0-flashFrühere 2.x-Generation.
gemini-1.5-proLegacy, wird weiterhin unterstützt.
vertex-generic / vertex-reasoning-generic"Eigenes Modell" für Vertex-Deployments, die nicht in der kuratierten Liste enthalten sind.

Azure AI Studio

BasismodellAnmerkungen
llama-3-2-90b-vision-instructorBildfähiges Llama für Assertions.
azure-ai-studio-generic / azure-ai-studio-reasoning-generic"Eigenes Modell" für jedes Azure AI Studio-Deployment.
tipp

Die Einträge *-generic und *-reasoning-generic sind die unterstützte Methode, um ein Modell zu verwenden, das nicht in der kuratierten Liste enthalten ist – zum Beispiel ein brandneues Release eines Anbieters, das noch nicht namentlich hinzugefügt wurde. Wählen Sie den generischen Eintrag des richtigen Anbieters und geben Sie die tatsächliche Modell-ID des Anbieters in das Feld Deployment-Name ein. Verwenden Sie die -reasoning--Variante, wenn das zugrunde liegende Modell Reasoning / erweitertes Denken unterstützt.

Modellfähigkeiten

Einige Fähigkeiten sind für Modelle markiert:

  • Reasoning — das Modell unterstützt erweitertes Denken (Thinking). Erforderlich für den KI-Assistenten; empfohlen für die Schrittidentifikation bei komplexen Anwendungen. Alle gpt-5*, gpt-o*, Claude 4.x, Gemini 2.5+ sowie die *-reasoning-generic-Einträge sind Reasoning-fähig.
  • Vision — das Modell kann einen Screenshot interpretieren. Erforderlich für das Standard-KI-Modell für Assertions in den Mandanteneinstellungen. GPT-4o / 4o-mini, Claude 3.5+ und das Llama-3.2-90B-Vision-Instructor sind bildfähig; alle aktuellen Gemini-Modelle sind ebenfalls bildfähig.
  • Low-cost — wird zur Kennzeichnung kostengünstiger Modelle verwendet (derzeit gpt-4o-mini, claude-3-haiku, die verschiedenen Gemini *-flash-lite-Varianten). Die Plattform erzwingt keine Einschränkungen basierend auf dieser Kennzeichnung; sie dient lediglich als Hinweis für Administratoren, um sinnvolle Standardwerte auszuwählen.

Konfigurationsformular

Wenn Sie ein Modell hinzufügen oder bearbeiten, ist das Formular in vier Abschnitte unterteilt.

Basisinformationen

FeldBeschreibung
IDEin eindeutiger Name für diesen Modelleintrag innerhalb von msg.ZenTestAI. Wird überall dort verwendet, wo ein Modell ausgewählt wird; wählen Sie einen beschreibenden Namen (z. B. claude-4-6-opus-eu, gpt-5-cheap). Erforderlich.
KI-ModellanbieterDer zu verwendende Anbieter-Konnektor. Erforderlich. Bestimmt, welche Felder unten angezeigt werden.
Basis-KI-ModellDas Basismodell aus der kuratierten Liste (siehe oben). Erforderlich.

Sobald ein Modell gespeichert ist, wird neben der ID eine Schaltfläche Verbindung testen angezeigt. Ein Klick darauf ruft den konfigurierten Anbieter mit den gespeicherten Anmeldeinformationen auf und meldet entweder Erfolg oder den genauen Fehler, der vom Anbieter zurückgegeben wurde.

Authentifizierung

Der Authentifizierungsabschnitt passt sich dem Anbieter an:

AnbieterFeldAnmerkungen
OpenAIAPI-KeyIhr OpenAI API-Schlüssel.
Azure OpenAIAPI-KeyDer Schlüssel Ihrer Azure OpenAI-Ressource.
AnthropicAPI-KeyIhr Anthropic API-Schlüssel.
Google GeminiAPI-KeyEin Google AI Studio API-Schlüssel.
Azure AI StudioAPI-KeyDer Schlüssel aus dem Azure AI Studio-Deployment.
AWS BedrockCredentialsJSON mit AWS-Region und Zugriffsschlüsseln für den IAM-Principal, der Bedrock aufrufen darf.
Google Vertex AICredentialsDas JSON eines Google Cloud-Dienstkontos, das über die erforderlichen Vertex AI-Berechtigungen verfügt.

API-Schlüssel und Anmeldeinformationen werden verschlüsselt gespeichert und niemals im Klartext angezeigt.

Konfiguration

Der Konfigurationsabschnitt ist der anbieterspezifischste Teil des Formulars:

FeldErforderlich fürWas es ist
Deployment-NameAlle AnbieterDer Name des Deployments / Modells auf Anbieterseite. Für OpenAI ist dies normalerweise der Modellname (gpt-5); für Azure ist es der Deployment-Name, den Sie in Ihrem Azure-Portal erstellt haben; für AWS Bedrock die Bedrock-Modell-ID (z. B. anthropic.claude-3-5-sonnet-20241022-v2:0).
API-VersionAzure OpenAI, Azure AI Studio (und optional für Vertex AI / Gemini)Die API-Versionszeichenfolge des Anbieters (z. B. 2024-08-01-preview für Azure OpenAI).
API-Instanz-NameAzure OpenAIDer Name der Azure OpenAI-Ressource (der Teil, der in die URL {instance}.openai.azure.com gehört).
API-Basis-PfadOptional für die meisten AnbieterBenutzerdefinierte Endpunkt-URL — nützlich, wenn Sie dem Anbieter einen Reverse Proxy vorschalten oder einen regionalen Endpunkt verwenden.

Das Formular blendet Felder aus, die auf den ausgewählten Anbieter nicht zutreffen, sodass Sie nur das sehen, was Sie ausfüllen müssen.

Erweiterte Einstellungen

Der erweiterte Abschnitt ist standardmäßig eingeklappt. Er enthält:

  • Fallback-Modell — wählen Sie ein anderes konfiguriertes Modell aus, das verwendet werden soll, wenn dieses fehlschlägt (Verbindungsfehler, Ratenbegrenzung, Ausfall des Anbieters). Nützlich, wenn Sie ein kostengünstiges Primärmodell und ein qualitativ hochwertigeres Backup-Modell haben. Lassen Sie das Feld leer, wenn Sie kein Fallback wünschen.
  • Reasoning-Aufwand — wird nur angezeigt, wenn das ausgewählte Basismodell Reasoning-fähig ist. Ermöglicht es festzulegen, wie viel "Denkarbeit" das Modell pro Aufruf investiert: none, low, medium, high oder auto. Ein höherer Aufwand verbessert die Qualität bei komplexen Schritten, verbraucht aber mehr Token und ist langsamer.
  • Eingabekosten pro Million Token / Ausgabekosten pro Million Token — optional. Füllen Sie diese aus, damit Testläufe und KI-Assistenten-Sitzungen eine aussagekräftige Kostenschätzung anzeigen können. Die Zahlen sind in USD pro Million Token angegeben, passend zum Format, das Anbieter auf ihren Preisseiten veröffentlichen.

Lebenszyklus

Speichern

Beim Speichern wird das Formular validiert und die verschlüsselten Anmeldeinformationen werden gespeichert. Die Anbieterverbindung selbst wird beim Speichern nicht validiert — verwenden Sie nach dem Speichern die Funktion Verbindung testen, um sicherzustellen, dass die Anmeldeinformationen und die Konfiguration tatsächlich funktionieren.

Löschen

Modelle können jederzeit über die KI-Registerkarte gelöscht werden. Es gibt keinen Schutz, der das Löschen eines Modells verhindert, auf das aktuell verwiesen wird (als Mandantenstandard, als schrittspezifische Überschreibung oder als Standardmodell für Agenten). Wenn Sie ein Modell löschen, das in Gebrauch ist, schlagen die Tests, die darauf verweisen, zur Laufzeit mit einem "model not found"-Fehler fehl. Um sicherzugehen, ändern Sie die Referenzen zuerst auf ein anderes Modell und löschen Sie dann den Eintrag.

Umsortieren

Die Liste der Modelle kann per Drag & Drop neu sortiert werden. Dies ändert nur die Anzeigereihenfolge – es ändert nicht, welches Modell für bestimmte Funktionen der Standard ist.

Das richtige Modell für jede Aufgabe auswählen

Die Plattform verwendet verschiedene Modellstandards, die separat in den Mandanteneinstellungen konfiguriert werden. Die folgenden Empfehlungen sind Ausgangspunkte:

Aufgabe / EinstellungEmpfohlene Modellklasse
Standardmodell für ElementidentifikationEin kostengünstiges Modell mit großem Kontextfenster (gpt-4o-mini, claude-3-haiku, eine Gemini-Flash-Variante).
Standardmodell für AssertionsEin bildfähiges Modell. gpt-4o, claude-3-5-sonnet oder ein qualitativ hochwertiges Gemini.
Standardmodell für SchrittidentifikationEin qualitativ hochwertiges Reasoning-Modell — gpt-5, claude-4-6-sonnet, gemini-3-pro.
Standardmodell für den KI-AssistentenEin erstklassiges Reasoning-Modell — Claude Opus oder GPT-5+ ("Copilot"). Siehe KI-Assistent → Empfohlene Modelle.
tipp

Wenn Sie ein kostengünstiges Modell als Standard für die Elementidentifikation festlegen, skaliert der Runner bei Schritten, die es benötigen, automatisch auf ein Modell mit höherer Qualität hoch. Sie müssen den Standard nicht überdimensionieren, nur um gelegentlich schwierige Schritte zu bewältigen.

Migrationshinweise

  • Die Plattform behält ältere Modelleinträge (Claude 3.x, Gemini 1.5, GPT-4o) zur Abwärtskompatibilität bei. Bestehende Testkonfigurationen funktionieren weiterhin, aber für neue Tests sollten die oben aufgeführten Modelle der aktuellen Generation bevorzugt werden.
  • Wenn ein Anbieter ein neues Modell einführt, das noch nicht im kuratierten Dropdown-Menü enthalten ist, verwenden Sie den entsprechenden *-generic-Eintrag und geben Sie die neue Modell-ID unter Deployment-Name an.
  • Wenn Sie einen anderen Anbieter oder ein anderes Modell haben, das oben nicht behandelt wird, kontaktieren Sie uns unter hello@zentest.ai.