Häufig gestellte Fragen

Alles, was Sie über Helvetic AI, unsere Methodik und unsere Produkte wissen müssen.

Was ist Helvetic AI?
Helvetic AI ist ein unabhängiges Schweizer KI-Evaluationslabor. Unser Evaluationssystem beantwortet vier Fragen zu Ihrer KI: Konform? Performant? Zuverlässig? Sicher? Jede Evaluation liefert einen HAAS-Score über 8 Dimensionen in 4 Pfeilern. Drei Service-Stufen skalieren von automatisierten Scores bis zu evidenzbasierten Massnahmenempfehlungen: Measurement, Measurement + Diagnostic, Measurement + Diagnostic + Remediation.
Verlassen meine Daten die Schweiz?
Nein. Sie wählen aus 5 Handoff-Modi: Benchmark-Intelligence (Standard, keine Daten nötig), API-Key, Docker auf Ihrer Infrastruktur, dedizierte Hardware vor Ort oder Anonymisierung vorab. In keinem Modus verlassen Ihre Daten die Schweiz.
Was kostet der Einstieg?
Drei Service-Stufen pro Pfeiler: Assurance Basic ab CHF 5’000, Assurance Plus ab CHF 12’000, Assurance Komplett ab CHF 20’000. Eine KI-Risikoklassifizierung ist ab CHF 3’000 als eigenständiger Einstiegspunkt verfügbar. Alle Produkte auf unserer Leistungsseite.
Wie lange dauert eine Evaluation?
Assurance Basic (z.B. EU AI Act Quick Check) dauert ca. 1 Woche. Assurance Plus (z.B. EU AI Act Full Assessment) dauert 2–3 Wochen. Assurance Komplett (z.B. FINMA Alignment Check) dauert 3–4 Wochen. Eine KI-Risikoklassifizierung dauert ca. 1 Woche.
Brauche ich IT-Ressourcen?
Minimal. Im Standard-Modus (Benchmark-Intelligence) brauchen Sie nichts. Wir haben die Benchmark-Daten bereits. Für Custom-Evaluationen stellen Sie einen API-Key bereit. Der gesamte Prozess ist darauf ausgelegt, Ihren Aufwand zu minimieren.
Was ist der HAAS-Score?
Der Helvetic AI Assurance Score (HAAS) ist unser zusammengesetztes Scoring-Framework über 8 Dimensionen in 4 Pfeilern: Konform (Safety, Compliance, Schweizer Sprachen, Dokumentation), Performant (Performance, Robustheit), Zuverlässig (Produktionszuverlässigkeit) und Sicher (Adversariale Sicherheit). Jede Dimension wird 0–100 bewertet mit Konfidenzintervallen. Details auf unserer Methodik-Seite.
Welche Evaluations-Frameworks verwenden Sie?
Unser Evaluationssystem basiert auf drei institutionell verankerten Frameworks: dem Evaluations-Framework des UK AI Security Institute (geführt vom britischen Ministerium für Wissenschaft und Technologie), der EU AI Act Compliance-Benchmark-Suite von ETH Zürich und INSAIT (29 Benchmarks, abgebildet auf EU AI Act-Prinzipien), sowie Swiss-Bench, unsere proprietäre Schweizer Benchmark-Suite für deutsch-, französisch- und italienischsprachige Anforderungen.
Was ist Swiss-Bench?
Swiss-Bench ist unsere proprietäre Benchmark-Suite mit über 800 Evaluationsszenarien über 8 Dimensionen, die Modelle auf Deutsch, Französisch, Italienisch und Englisch an domänenspezifischen Aufgaben testet. Wir veröffentlichen Ergebnisse vierteljährlich als öffentliches Leaderboard.
Was erhalte ich konkret?
Die Ergebnisse skalieren mit der gewählten Stufe. Assurance Basic: automatisierte HAAS-Scores, Ampel-Dashboards und Benchmark-Ergebnisse. Assurance Plus: zusätzlich Experteninterpretation, Lückenanalyse und Massnahmenpriorisierung. Assurance Komplett: zusätzlich evidenzbasierte Massnahmenempfehlungen, Control-Mapping und Umsetzungsanleitung. Jede Stufe enthält Methodik-Dokumentation zur unabhängigen Nachvollziehbarkeit und einen Findings-Call.
Wie unterscheiden Sie sich von Beratungsunternehmen?
Wir sind ein technisches Audit-Labor, kein Beratungsunternehmen. Unser System liefert systematische, reproduzierbare Ergebnisse. Keine manuellen Bewertungen oder subjektiven Meinungen. Einstieg ab CHF 5’000 vs. CHF 100’000+ bei Big Four. Jeder Test ist wiederholbar.
Sind Sie wirklich unabhängig?
Ja. Keine kommerziellen Beziehungen zu KI-Modell-Anbietern. Keine Provisionen, keine Vendor-Partnerschaften, kein Pay-for-Score. Jedes Modell wird mit demselben System und derselben Methodik evaluiert.
Was verlangt FINMA bei KI-Modellen?
FINMA Guidance 08/2024 definiert 5 Aufsichtskategorien für KI: Governance, Betriebsrisiko, Auslagerung, Datenqualität und Erklärbarkeit. Unsere FINMA Alignment Check evaluiert gegen alle Kategorien mit umfassenden FINMA-spezifischen Evaluationsszenarien.
Was sind KI-Halluzinationen?
KI-Halluzinationen treten auf, wenn ein Modell plausibel klingende, aber faktisch falsche Informationen generiert: erfundene Gerichtsurteile, nicht existierende Regulierungen, falsche Finanzdaten. Magesh et al. (Stanford, 2024): führende juristische KI-Tools halluzinieren in über 17% der Anfragen. Wir messen Halluzinationsraten quantitativ als Teil des HAAS-Scores.
Wer steckt hinter Helvetic AI?
Helvetic AI wurde von Fatih Uenal, PhD gegründet, mit dem Ziel, unabhängige KI-Evaluation für Schweizer Unternehmen zugänglich zu machen. Hintergrund: PhD (HU Berlin), Postdoc Harvard & Cambridge, MSc Computer Science (CU Boulder), MITx Statistics & Data Science. Sitz in Bern, Schweiz.
Ist Ihre Methodik peer-reviewed?
Unsere Methodik basiert auf über 100 peer-reviewed Publikationen aus Venues wie Nature, NeurIPS, ICLR, ICML, ACL und NAACL. Unsere Swiss-Bench-Methodik ist in zwei wissenschaftlichen Veröffentlichungen dokumentiert: Uenal, 2026a und Uenal, 2026b.

Noch Fragen?