KI-Modelle
Auf der Seite für KI-Modelle konfiguriert ein Administrator die Chat-Modelle, die msg.ZenTestAI verwenden kann. Pro Mandant (Tenant) können mehrere Modelle konfiguriert werden — typischerweise ein kostengünstiges Modell für Aufgaben mit hohem Volumen (Elementidentifikation, einfache Entscheidungen), ein bildfähiges Modell für Assertions und ein leistungsstarkes Reasoning-Modell für den KI-Assistenten.
Modelle werden pro Mandant (Produkt) konfiguriert. Es gibt keine globale Modellregistrierung.
Wo die Konfiguration erfolgt
Konfigurieren Sie KI-Modelle unter Administration → Wählen Sie Ihren Mandanten → Registerkarte KI. Die Seite listet alle konfigurierten Modelle auf und ermöglicht es Ihnen, mit der +-Aktion neue Modelle hinzuzufügen.
Nach dem Speichern sind die konfigurierten Modelle an folgenden Stellen auswählbar:
- In den Feldern für das Standardmodell unter Mandanteneinstellungen (Assertions, Elementidentifikation, Schrittidentifikation, Agenten).
- In der schrittspezifischen Überschreibung des KI-Modells auf der Registerkarte Schritte.
Unterstützte Anbieter
msg.ZenTestAI liefert Konnektoren für sieben Anbieterplattformen mit. Wählen Sie zuerst einen Anbieter; das Formular passt sich dann an und zeigt nur die für diesen Anbieter relevanten Felder an.
| Anbieter | Verwendung für |
|---|---|
| OpenAI | Öffentliche API von OpenAI (api.openai.com oder ein kompatibler Reverse Proxy). |
| Azure OpenAI | OpenAI-Modelle, die als Deployments in Ihrem Azure-Abonnement gehostet werden. |
| Anthropic | Öffentliche API von Anthropic (api.anthropic.com oder kompatibles Relay). |
| AWS Bedrock | Anthropic Claude (und andere), gehostet über AWS Bedrock. |
| Google Gemini | Öffentliche Gemini-API von Google (generativelanguage.googleapis.com). |
| Google Vertex AI | Gemini, gehostet auf Google Cloud Vertex AI. |
| Azure AI Studio | Modelle der Llama-Familie und andere Modelle, die über Azure AI Studio-Deployments bereitgestellt werden. |
Unterstützte Modelle
Jeder Anbieter stellt eine kuratierte Liste von Basismodellen bereit. Die nachstehende Liste entspricht dem aktuellen Stand zum Zeitpunkt der Erstellung dieses Dokuments – das tatsächliche Dropdown-Menü in Ihrem Mandanten spiegelt wider, was die Plattform aktuell unterstützt.
OpenAI / Azure OpenAI
| Basismodell | Anmerkungen |
|---|---|
gpt-5, gpt-5.2 | Aktuellste GPT-5-Generation. Reasoning-fähig. |
gpt-5-mini, gpt-5-nano | Kostengünstigere GPT-5-Varianten. Reasoning-fähig. |
gpt-4.1 | Reasoning-Modell der mittleren Klasse. |
gpt-4.1-mini, gpt-4.1-nano | Kostengünstigere 4.1-Varianten. |
gpt-4o | Allzweckmodell, bildfähig. |
gpt-4o-mini | Kostengünstig, bildfähig. |
gpt-o3, gpt-o3-mini, gpt-o4-mini | Dedizierte Reasoning-Modelle. |
openai-generic / openai-reasoning-generic | "Eigenes Modell" — verwenden Sie dies, wenn Sie ein OpenAI-kompatibles Modell einbinden möchten, das nicht in der kuratierten Liste steht. |
azure-openai-generic / azure-openai-reasoning-generic | Gleiches Prinzip, jedoch für Azure-gehostete Deployments. |
Anthropic / AWS Bedrock
| Basismodell | Anmerkungen |
|---|---|
claude-4-6-opus | Aktuelles Flaggschiff Claude. Reasoning-fähig. Empfohlen für den KI-Assistenten. |
claude-4-6-sonnet | Aktuelles Qualitätsmodell Claude. Reasoning-fähig. |
claude-4-5-sonnet | Vorherige Sonnet-Generation. Reasoning-fähig. |
claude-4-5-haiku | Aktuelles kostengünstiges Claude. Reasoning-fähig. |
claude-3-7-sonnet | Älteres Sonnet (wird weiterhin unterstützt). |
claude-3-5-sonnet | Bildfähig, weit verbreitet. |
claude-3-haiku | Kostengünstig, kein Reasoning. |
bedrock-generic / bedrock-reasoning-generic | "Eigenes Modell" — verwenden Sie dies, um auf jedes Bedrock-gehostete Modell über dessen Anbieter-ID zu verweisen. |
Dieselbe Claude-Modelle sind sowohl über Anthropic (direkte API) als auch über AWS Bedrock (verwaltet) erreichbar.
Google Gemini / Vertex AI
| Basismodell | Anmerkungen |
|---|---|
gemini-3.1-pro | Aktuelles Flaggschiff Gemini. Reasoning-fähig. |
gemini-3.1-flash-lite | Aktuelles kostengünstiges Gemini. Reasoning-fähig. |
gemini-3-pro, gemini-3-flash | Gemini 3.0-Familie. |
gemini-2.5-pro | Hohe Qualität, Reasoning-fähig. |
gemini-2.5-flash, gemini-2.5-flash-lite | Schnelle, kostengünstige Varianten. |
gemini-2.0-pro, gemini-2.0-flash | Frühere 2.x-Generation. |
gemini-1.5-pro | Legacy, wird weiterhin unterstützt. |
vertex-generic / vertex-reasoning-generic | "Eigenes Modell" für Vertex-Deployments, die nicht in der kuratierten Liste enthalten sind. |
Azure AI Studio
| Basismodell | Anmerkungen |
|---|---|
llama-3-2-90b-vision-instructor | Bildfähiges Llama für Assertions. |
azure-ai-studio-generic / azure-ai-studio-reasoning-generic | "Eigenes Modell" für jedes Azure AI Studio-Deployment. |
Die Einträge *-generic und *-reasoning-generic sind die unterstützte Methode, um ein Modell zu verwenden, das nicht in der kuratierten Liste enthalten ist – zum Beispiel ein brandneues Release eines Anbieters, das noch nicht namentlich hinzugefügt wurde. Wählen Sie den generischen Eintrag des richtigen Anbieters und geben Sie die tatsächliche Modell-ID des Anbieters in das Feld Deployment-Name ein. Verwenden Sie die -reasoning--Variante, wenn das zugrunde liegende Modell Reasoning / erweitertes Denken unterstützt.
Modellfähigkeiten
Einige Fähigkeiten sind für Modelle markiert:
- Reasoning — das Modell unterstützt erweitertes Denken (Thinking). Erforderlich für den KI-Assistenten; empfohlen für die Schrittidentifikation bei komplexen Anwendungen. Alle
gpt-5*,gpt-o*, Claude 4.x, Gemini 2.5+ sowie die*-reasoning-generic-Einträge sind Reasoning-fähig. - Vision — das Modell kann einen Screenshot interpretieren. Erforderlich für das Standard-KI-Modell für Assertions in den Mandanteneinstellungen. GPT-4o / 4o-mini, Claude 3.5+ und das Llama-3.2-90B-Vision-Instructor sind bildfähig; alle aktuellen Gemini-Modelle sind ebenfalls bildfähig.
- Low-cost — wird zur Kennzeichnung kostengünstiger Modelle verwendet (derzeit
gpt-4o-mini,claude-3-haiku, die verschiedenen Gemini*-flash-lite-Varianten). Die Plattform erzwingt keine Einschränkungen basierend auf dieser Kennzeichnung; sie dient lediglich als Hinweis für Administratoren, um sinnvolle Standardwerte auszuwählen.
Konfigurationsformular
Wenn Sie ein Modell hinzufügen oder bearbeiten, ist das Formular in vier Abschnitte unterteilt.
Basisinformationen
| Feld | Beschreibung |
|---|---|
| ID | Ein eindeutiger Name für diesen Modelleintrag innerhalb von msg.ZenTestAI. Wird überall dort verwendet, wo ein Modell ausgewählt wird; wählen Sie einen beschreibenden Namen (z. B. claude-4-6-opus-eu, gpt-5-cheap). Erforderlich. |
| KI-Modellanbieter | Der zu verwendende Anbieter-Konnektor. Erforderlich. Bestimmt, welche Felder unten angezeigt werden. |
| Basis-KI-Modell | Das Basismodell aus der kuratierten Liste (siehe oben). Erforderlich. |
Sobald ein Modell gespeichert ist, wird neben der ID eine Schaltfläche Verbindung testen angezeigt. Ein Klick darauf ruft den konfigurierten Anbieter mit den gespeicherten Anmeldeinformationen auf und meldet entweder Erfolg oder den genauen Fehler, der vom Anbieter zurückgegeben wurde.
Authentifizierung
Der Authentifizierungsabschnitt passt sich dem Anbieter an:
| Anbieter | Feld | Anmerkungen |
|---|---|---|
| OpenAI | API-Key | Ihr OpenAI API-Schlüssel. |
| Azure OpenAI | API-Key | Der Schlüssel Ihrer Azure OpenAI-Ressource. |
| Anthropic | API-Key | Ihr Anthropic API-Schlüssel. |
| Google Gemini | API-Key | Ein Google AI Studio API-Schlüssel. |
| Azure AI Studio | API-Key | Der Schlüssel aus dem Azure AI Studio-Deployment. |
| AWS Bedrock | Credentials | JSON mit AWS-Region und Zugriffsschlüsseln für den IAM-Principal, der Bedrock aufrufen darf. |
| Google Vertex AI | Credentials | Das JSON eines Google Cloud-Dienstkontos, das über die erforderlichen Vertex AI-Berechtigungen verfügt. |
API-Schlüssel und Anmeldeinformationen werden verschlüsselt gespeichert und niemals im Klartext angezeigt.
Konfiguration
Der Konfigurationsabschnitt ist der anbieterspezifischste Teil des Formulars:
| Feld | Erforderlich für | Was es ist |
|---|---|---|
| Deployment-Name | Alle Anbieter | Der Name des Deployments / Modells auf Anbieterseite. Für OpenAI ist dies normalerweise der Modellname (gpt-5); für Azure ist es der Deployment-Name, den Sie in Ihrem Azure-Portal erstellt haben; für AWS Bedrock die Bedrock-Modell-ID (z. B. anthropic.claude-3-5-sonnet-20241022-v2:0). |
| API-Version | Azure OpenAI, Azure AI Studio (und optional für Vertex AI / Gemini) | Die API-Versionszeichenfolge des Anbieters (z. B. 2024-08-01-preview für Azure OpenAI). |
| API-Instanz-Name | Azure OpenAI | Der Name der Azure OpenAI-Ressource (der Teil, der in die URL {instance}.openai.azure.com gehört). |
| API-Basis-Pfad | Optional für die meisten Anbieter | Benutzerdefinierte Endpunkt-URL — nützlich, wenn Sie dem Anbieter einen Reverse Proxy vorschalten oder einen regionalen Endpunkt verwenden. |
Das Formular blendet Felder aus, die auf den ausgewählten Anbieter nicht zutreffen, sodass Sie nur das sehen, was Sie ausfüllen müssen.
Erweiterte Einstellungen
Der erweiterte Abschnitt ist standardmäßig eingeklappt. Er enthält:
- Fallback-Modell — wählen Sie ein anderes konfiguriertes Modell aus, das verwendet werden soll, wenn dieses fehlschlägt (Verbindungsfehler, Ratenbegrenzung, Ausfall des Anbieters). Nützlich, wenn Sie ein kostengünstiges Primärmodell und ein qualitativ hochwertigeres Backup-Modell haben. Lassen Sie das Feld leer, wenn Sie kein Fallback wünschen.
- Reasoning-Aufwand — wird nur angezeigt, wenn das ausgewählte Basismodell Reasoning-fähig ist. Ermöglicht es festzulegen, wie viel "Denkarbeit" das Modell pro Aufruf investiert:
none,low,medium,highoderauto. Ein höherer Aufwand verbessert die Qualität bei komplexen Schritten, verbraucht aber mehr Token und ist langsamer. - Eingabekosten pro Million Token / Ausgabekosten pro Million Token — optional. Füllen Sie diese aus, damit Testläufe und KI-Assistenten-Sitzungen eine aussagekräftige Kostenschätzung anzeigen können. Die Zahlen sind in USD pro Million Token angegeben, passend zum Format, das Anbieter auf ihren Preisseiten veröffentlichen.
Lebenszyklus
Speichern
Beim Speichern wird das Formular validiert und die verschlüsselten Anmeldeinformationen werden gespeichert. Die Anbieterverbindung selbst wird beim Speichern nicht validiert — verwenden Sie nach dem Speichern die Funktion Verbindung testen, um sicherzustellen, dass die Anmeldeinformationen und die Konfiguration tatsächlich funktionieren.
Löschen
Modelle können jederzeit über die KI-Registerkarte gelöscht werden. Es gibt keinen Schutz, der das Löschen eines Modells verhindert, auf das aktuell verwiesen wird (als Mandantenstandard, als schrittspezifische Überschreibung oder als Standardmodell für Agenten). Wenn Sie ein Modell löschen, das in Gebrauch ist, schlagen die Tests, die darauf verweisen, zur Laufzeit mit einem "model not found"-Fehler fehl. Um sicherzugehen, ändern Sie die Referenzen zuerst auf ein anderes Modell und löschen Sie dann den Eintrag.
Umsortieren
Die Liste der Modelle kann per Drag & Drop neu sortiert werden. Dies ändert nur die Anzeigereihenfolge – es ändert nicht, welches Modell für bestimmte Funktionen der Standard ist.
Das richtige Modell für jede Aufgabe auswählen
Die Plattform verwendet verschiedene Modellstandards, die separat in den Mandanteneinstellungen konfiguriert werden. Die folgenden Empfehlungen sind Ausgangspunkte:
| Aufgabe / Einstellung | Empfohlene Modellklasse |
|---|---|
| Standardmodell für Elementidentifikation | Ein kostengünstiges Modell mit großem Kontextfenster (gpt-4o-mini, claude-3-haiku, eine Gemini-Flash-Variante). |
| Standardmodell für Assertions | Ein bildfähiges Modell. gpt-4o, claude-3-5-sonnet oder ein qualitativ hochwertiges Gemini. |
| Standardmodell für Schrittidentifikation | Ein qualitativ hochwertiges Reasoning-Modell — gpt-5, claude-4-6-sonnet, gemini-3-pro. |
| Standardmodell für den KI-Assistenten | Ein erstklassiges Reasoning-Modell — Claude Opus oder GPT-5+ ("Copilot"). Siehe KI-Assistent → Empfohlene Modelle. |
Wenn Sie ein kostengünstiges Modell als Standard für die Elementidentifikation festlegen, skaliert der Runner bei Schritten, die es benötigen, automatisch auf ein Modell mit höherer Qualität hoch. Sie müssen den Standard nicht überdimensionieren, nur um gelegentlich schwierige Schritte zu bewältigen.
Migrationshinweise
- Die Plattform behält ältere Modelleinträge (Claude 3.x, Gemini 1.5, GPT-4o) zur Abwärtskompatibilität bei. Bestehende Testkonfigurationen funktionieren weiterhin, aber für neue Tests sollten die oben aufgeführten Modelle der aktuellen Generation bevorzugt werden.
- Wenn ein Anbieter ein neues Modell einführt, das noch nicht im kuratierten Dropdown-Menü enthalten ist, verwenden Sie den entsprechenden
*-generic-Eintrag und geben Sie die neue Modell-ID unter Deployment-Name an. - Wenn Sie einen anderen Anbieter oder ein anderes Modell haben, das oben nicht behandelt wird, kontaktieren Sie uns unter hello@zentest.ai.