ZelixAI ist eine Meta-Plattform — du wählst pro Bot, welches KI-Modell verwendet wird. Verfügbare Anbieter:
- Anthropic Claude — Opus 4.7, Sonnet 4.6, Haiku 4.5 (am stärksten für Tone-of-Voice)
- OpenAI GPT — GPT-5, GPT-4.1, GPT-4o (Industriestandard)
- Google Gemini — Pro, Flash (bestes Preis-pro-Token-Verhältnis)
- ★ ZelixAI Best Choice Mix — Mistral via OVH — Large, Small (vollständig EU-souverän, in NL gehostet) — unsere empfohlene Standardoption für EU-Compliance
- ★ ZelixAI Best Choice Mix — OpenRouter — 369 alternative Modelle (Llama, DeepSeek, Qwen, Mistral-open) — unser empfohlenes Routing für die größte Auswahl + das beste Preis-Leistungs-Verhältnis
- Lokales LLM-Modell — auf Ihrer eigenen Hardware oder in unserem Rechenzentrum gehostet, für Privacy-Modus und strenge Datenresidenz
Unsere "Best Choice Mix" kombiniert OVH (EU-souverän) mit OpenRouter (breiteste Auswahl) — so erhält jeder Bot automatisch das richtige Modell für die richtige Aufgabe. Manuell wechseln oder ZelixAIs Router übernehmen lassen — in 1 Klick.
Best-Choice-Routing: ZelixAI empfiehlt pro Use-Case
ZelixAI analysiert Ihren Use-Case bei der Bot-Konfiguration und empfiehlt das am besten passende Modell. Sie sind frei zu wählen — die Empfehlung ist indikativ.
| Use-Case |
Empfohlenes Modell |
Grund |
| NL Kundenservice (einfache Fragen) |
Mistral via OVH |
EU-souverän, NL-gehostet, ausgezeichnetes NL-Verständnis |
| Mehrsprachiger Kundenservice |
GPT-4o-mini |
Stärkste mehrsprachige Leistung, niedrige Kosten |
| Komplexe Q&A / rechtlich / technisch |
Claude Sonnet |
Beste Reasoning- und Tone-of-Voice-Qualität |
| Hochvolumen einfache FAQ |
Claude Haiku / Gemini Flash |
Niedrigste Kosten pro Token, schnell |
| Privacy-First / keine externen Aufrufe |
Lokales LLM |
Eigene Hardware oder unser Rechenzentrum, keine externe API |
Modell-Evaluierungs-Framework
Jedes Modell in unserem Stack wird kontinuierlich auf 5 Dimensionen benchmarkt: (1) Sprachverständnis NL/EN/DE/FR, (2) Tone-of-Voice-Beibehaltung, (3) Sachliche Genauigkeit bei Wissensdatenbank-Inhalten, (4) Verweigerungsrate bei Out-of-Scope-Fragen, (5) Latenz p95. Ergebnisse steuern unsere Best-Choice-Routing-Empfehlungen.