Welches KI-Modell passt zu Ihrem Unternehmen?
Schweiz-spezifisches KI-Benchmarking in DE/FR/IT. Wir evaluieren Modelle an regulatorischen, juristischen und finanziellen Aufgaben, die für Schweizer Unternehmen relevant sind.
Performance-Produkte
Gebaut für Schweizer Realität.
Swiss-Bench umfasst über 800 Evaluationsszenarien über 8 Dimensionen und testet Modelle auf Deutsch, Französisch und Italienisch an domänenspezifischen Aufgaben. Anders als generische Benchmarks misst Swiss-Bench, was für Schweizer Unternehmen zählt: Szenarien in den Bereichen Recht, Regulierung, Finanzen und öffentliche Verwaltung.
Die Erkenntnisse, die Sie erhalten.
„Für Schweizer Rechtstextzusammenfassungen übertrifft Claude Sonnet GPT-4o um 12% bei der faktischen Genauigkeit, aber GPT-4o verarbeitet französische Rechtstexte 8% besser.“
„Für FINMA-Regulierungs-Q&A zeigt Gemini Pro die niedrigste Halluzinationsrate (3,2%), hat aber Schwierigkeiten mit temporalem Reasoning bei Regulierungsversionsänderungen.“
„Für Versicherungsschadenbearbeitung auf Deutsch erreicht Mistral Large GPT-4o-Performance bei 40% niedrigeren API-Kosten, scheitert aber an italienischsprachigen Grenzfällen.“