Helvetic AI | Schweizer KI-Evaluation & Compliance

HELVETIC
AI

Unabhängige KI-Evaluation für Schweizer Unternehmen.

Standort Bern, Schweiz Technologie Inspect AI · Compl-AI · Swiss-Bench Leistungen Compliance, Performance, Zuverlässigkeit & Sicherheit Fokus Schweizer KMU & Konzerne

KI-Readiness prüfen Swiss-Bench ansehen

Konform?

Ist Ihre KI konform?

EU AI Act, FINMA, nDSG. Regulatorische Evidenz.

Mehr erfahren → Performant?

Das richtige Modell?

Swiss-Bench DE/FR/IT. Domänen-Benchmarks.

Mehr erfahren → Zuverlässig?

Funktioniert Ihre KI?

Halluzinationen, RAG, Produktionsstabilität.

Mehr erfahren → Sicher?

Ist Ihre KI geschützt?

Prompt Injection, Adversarial Testing, Leakage.

Mehr erfahren →

Nicht sicher, wo Sie anfangen sollen? Machen Sie unseren KI-Readiness-Check →

01 / Das Problem

KI ist längst im Einsatz, aber niemand prüft sie unabhängig.

50% der Schweizer Finanzinstitute nutzen bereits KI, 91% davon generative KI. Doch die Governance hat nicht Schritt gehalten. Nur die Hälfte hat KI in eine explizite Strategie eingebunden.

Der EU AI Act verlangt ab 2027 technische Compliance-Nachweise. KI-Modelle halluzinieren in bis zu 17% der juristischen Anfragen, Produktionssysteme versagen ohne Vorwarnung, und Prompt-Injection-Angriffe bleiben unentdeckt. Es gibt keine Schweizer Evaluationsinfrastruktur, die Konformität, Performance, Zuverlässigkeit und Sicherheit unabhängig prüft.

FINMA-Erhebung (veröffentlicht April 2025): Von ~400 befragten Finanzinstituten nutzt die Hälfte KI, die Governance-Lücke ist erheblich. Magesh et al. (Stanford, 2024): führende juristische KI-Tools halluzinieren in über 17% der Anfragen. Asai et al. (Nature, 2026): LLMs halluzinieren Zitate in 78–90% der Fälle, wenn Modelle Gesetzesartikel zitieren, erfinden sie die Referenzen in der Mehrzahl der Fälle. Der EU AI Act Digital Omnibus verschiebt Hochrisiko-Fristen auf Dezember 2027 (Annex III) bzw. August 2028 (Annex I). Wir haben Swiss-Bench entwickelt, um dies direkt zu messen. Unsere Methodik ist in unseren wissenschaftlichen Veröffentlichungen dokumentiert (Uenal, 2026a & Uenal, 2026b).

50%

der Schweizer Finanzinstitute nutzen bereits KI

91%

davon setzen generative KI ein. Governance hinkt hinterher

Dez. 2027

EU AI Act Hochrisiko-Deadline (Annex III)

5–10 Tage

vom Erstgespräch zum fertigen Evaluationsbericht

Quellen: FINMA AI-Erhebung (veröffentlicht April 2025), EU AI Act Digital Omnibus 2025

Wie schneidet unabhängige KI-Evaluation im Vergleich zu traditionellen Ansätzen ab?

	Traditionelles KI-Audit	Helvetic AI
Dauer	3–6 Monate	5–10 Tage
Kosten	CHF 100K+ (Big Four)	ab CHF 5’000
Methodik	Proprietäre Black Box	Reproduzierbar, evidenzbasiert
Basis	Meinungsbasiert	Evidenzbasiert, systematische Benchmarks
Unabhängigkeit	Vendor-Beziehungen	Keine Provisionen, kein Pay-for-Score

02 / Das System

Ein Evaluationssystem: unabhängig, reproduzierbar, Schweiz-spezifisch.

Unser Evaluationssystem beantwortet vier Fragen in einem einzigen Framework: Konform? Performant? Zuverlässig? Sicher? Der HAAS (Helvetic AI Assurance Score) bewertet jedes Modell über 8 Dimensionen, gruppiert in 4 Pfeiler. Drei Leistungsstufen skalieren von automatisierten Scores bis zu evidenzbasierten Massnahmenempfehlungen: Messung, Messung + Diagnose, Messung + Diagnose + Remediation. Aufgebaut auf Frameworks des UK AI Security Institute und der ETH Zürich, erweitert mit unserem proprietären Swiss-Bench.

HAAS-Score

8 Dimensionen in 4 Pfeilern: Konform (Safety, Compliance, Schweizer Sprachen, Dokumentation), Performant (Performance, Robustheit), Zuverlässig (Produktionszuverlässigkeit), Sicher (Adversariale Sicherheit). Jede Dimension 0–100 mit Konfidenzintervallen.

Reproduzierbare Methodik

Sie erhalten umfassende Benchmark-Ergebnisse und detaillierte Scoring-Aufschlüsselungen. Vollständig dokumentiert für unabhängige Nachvollziehbarkeit.

Unabhängigkeit

Keine kommerziellen Beziehungen zu KI-Modell-Anbietern. Keine Provisionen. Keine Vendor-Partnerschaften. Kein Pay-for-Score. Jedes Modell wird gleich evaluiert.

Souveränes KI-Labor

Open-Source- und Open-Weight-Modelle laufen auf unserer eigenen Hardware in der Schweiz in Referenzqualität und Produktionsqualität. Proprietäre Modelle werden über die APIs ihrer Anbieter evaluiert. Ihre Daten verlassen nie die Schweiz.

Souveränes KI-Labor. Open-Source- und Open-Weight-Modelle laufen auf unserer eigenen Hardware in der Schweiz. Proprietäre Modelle werden über die APIs ihrer Anbieter evaluiert. Ihre Daten verlassen nie die Schweiz. Für FINMA-regulierte Institutionen bieten wir zusätzlich Air-Gapped-Deployment auf Ihrer Infrastruktur. Alle Übergabe-Modi →

Swiss-Bench Leaderboard: Wie schneiden führende KI-Modelle bei Schweiz-spezifischen Aufgaben in DE/FR/IT ab? 9 Modelle in über 800 Szenarien, quartalsweise aktualisiert. Swiss-Bench ansehen →

Anwendungsfälle

Wie Schweizer Unternehmen Helvetic AI nutzen.

Konform

KI-Modellvalidierung für Banken

Eine Regionalbank validiert ihr Kreditrisiko-Modell gegen FINMA Guidance 08/2024, systematisch, mit HAAS-Score und Lückenanalyse für den Verwaltungsrat.

Konform

EU-AI-Act-Readiness-Assessment

Ein Versicherer lässt sein KI-basiertes Schadenmanagement gegen EU-AI-Act-Anforderungen prüfen: Lückenanalyse und Massnahmen-Roadmap vor der Dezember-2027-Frist.

Performant

Modellauswahl mit Daten statt Meinungen

Ein Unternehmen evaluiert 5 KI-Modelle für Schweizer Rechtstexte. Reproduzierbare Benchmarks zeigen, welches Modell Verwaltungsdeutsch, Französisch und Italienisch beherrscht.

Performant

Full SOTA Sweep für Spitalgruppe

Eine Spitalgruppe vergleicht 30+ Modelle für klinische Dokumentation in DE/FR/IT. Vollständige Rankingtabelle mit TCO-Analyse und Schweizer Sprachqualität.

Zuverlässig

RAG-System-Zuverlässigkeit

Ein Finanzdienstleister prüft seinen internen KI-Assistenten: Wie oft halluziniert das System bei Schweizer Regulierungsfragen? Wie degradiert ist die Retrieval-Qualität bei wachsenden Dokumentenbeständen?

Zuverlässig

KI-Assistent im Produktionseinsatz

Ein Technologieunternehmen testet seinen Kundensupport-Bot vor dem Go-Live: Kontextmanagement unter Last, strukturierte Ausgabe-Compliance, Verhalten bei fehlenden Informationen. Go/No-Go-Entscheidung mit Evidenz.

Sicher

Prompt Injection Testing

Ein SOC-Team testet sein KI-gestütztes Bedrohungserkennungssystem gegen Multi-Step-Angriffsketten und adversariellen Inputs. MITRE ATT&CK Mapping für KI-spezifische Angriffsvektoren.

Sicher

Data Leakage Assessment

Ein Pharmaunternehmen prüft, ob sein KI-System sensible Patientendaten in Ausgaben preisgibt. Systematische Tests gegen Datenexfiltration und Jailbreak-Resistenz.

Kostenlose Ressourcen

Starten Sie mit kostenlosen Ressourcen

Bestenliste

Swiss-Bench

9 Frontier-Modelle auf Schweizer Regulierungsaufgaben in DE/FR/IT. Vierteljährlich aktualisiert.

Bestenliste ansehen → Bericht

Quartalsbericht

EU AI Act Compliance-Scores und Swiss-Bench-Ergebnisse. Kostenloser Download.

Bericht anfordern → Assessment

KI-Readiness-Check

10 Fragen über 4 Dimensionen. Sofortige Empfehlung.

Check starten →

03 / So funktioniert es

Vom Erstgespräch zum Evaluationsbericht.

Unser Prozess minimiert Ihren Aufwand und maximiert die Klarheit. Volle Methodik ansehen →

Scoping

Wir definieren gemeinsam Evaluationsziele, Modelle und Benchmarks. Keine Vorbereitung nötig.

1 Stunde

Konfiguration

Wir konfigurieren die Evaluations-Pipeline für Ihre Modelle, Daten und Compliance-Anforderungen.

2–4 Stunden

Evaluation

Das System benchmarkt systematisch: HAAS-Score, Schweizer Sprachqualität, EU AI Act Compliance, domänenspezifische Szenarien.

3–8 Arbeitstage

Übergabe

Sie erhalten den Evaluationsbericht mit HAAS-Scores, Lückenanalyse, Empfehlungen und einer ausführlichen Ergebnispräsentation.

Berichtslieferung

04 / Gründer

Dr. Fatih Uenal

Ich baue KI-Systeme für regulierte Schweizer Unternehmen und kenne die Governance-Lücke aus erster Hand. Laut Studien nutzen über 80% der Mitarbeitenden KI-Tools ohne IT-Genehmigung (JumpCloud, 2026). Die grossen Beratungen ignorieren KMU, die Tools sind zu teuer, und die Regulierung wird strenger.

Helvetic AI schliesst diese Lücke mit unabhängiger Evaluation, Schweizer Infrastruktur und dem Prinzip, dass KI sicher eingesetzt werden kann, wenn man die richtige Evidenz hat. Autor: Swiss-Bench Research Papers (2026a, 2026b).

Forschung Ph.D. Political Science (HU Berlin), Postdoc Harvard & Cambridge
Technologie MSc Computer Science (CU Boulder, ongoing), HarvardX Data Science
Cyber Security CAS Cyber Security Defence & Response (HSLU), Postgraduate Cyber Defence (Kommando Cyber)
Praxis KI-Governance & Automation, Cyber Security bei kritischer Infrastruktur

05 / Kontakt

Bereit für eine unabhängige Evaluation?

Vier Fragen an Ihre KI: Konform? Performant? Zuverlässig? Sicher? Starten Sie mit einem AI Risk Check oder wählen Sie direkt die Frage, die Sie am meisten beschäftigt.

Assurance Basic ab CHF 5’000 · Assurance Plus ab CHF 12’000 · Assurance Komplett ab CHF 20’000 · Alle Leistungen

System-Fundament & Compliance

UK AI Security Institute ETH Zürich / INSAIT Swiss-Bench nDSG EU AI Act FINMA Schweizer Unternehmen

Evaluations-Framework: UK AI Security Institute · Compliance-Framework: ETH Zürich / INSAIT · Swiss-Bench: eigene Schweizer Sprachbenchmarks