Question 1

Was ist Helvetic AI?

Accepted Answer

Helvetic AI ist ein unabhängiges Schweizer KI-Evaluationslabor. Unser Evaluationssystem beantwortet vier Fragen zu Ihrer KI: Konform? Performant? Zuverlässig? Sicher? Jede Evaluation liefert einen HAAS-Score über 8 Dimensionen in 4 Pfeilern. Drei Service-Stufen skalieren von automatisierten Scores bis zu evidenzbasierten Massnahmenempfehlungen: Measurement, Measurement + Diagnostic, Measurement + Diagnostic + Remediation.

Question 2

Verlassen meine Daten die Schweiz?

Accepted Answer

Nein. Sie wählen aus 5 Handoff-Modi: Benchmark-Intelligence (Standard, keine Daten nötig), API-Key, Docker auf Ihrer Infrastruktur, dedizierte Hardware vor Ort oder Anonymisierung vorab. In keinem Modus verlassen Ihre Daten die Schweiz.

Question 3

Was kostet der Einstieg?

Accepted Answer

Drei Service-Stufen pro Pfeiler: Assurance Basic ab CHF 5’000, Assurance Plus ab CHF 12’000, Assurance Komplett ab CHF 20’000. Eine KI-Risikoklassifizierung ist ab CHF 3’000 als eigenständiger Einstiegspunkt verfügbar.

Question 4

Wie lange dauert eine Evaluation?

Accepted Answer

Assurance Basic (z.B. EU AI Act Quick Check) dauert ca. 1 Woche. Assurance Plus (z.B. EU AI Act Full Assessment) dauert 2–3 Wochen. Assurance Komplett (z.B. FINMA Alignment Check) dauert 3–4 Wochen. Eine KI-Risikoklassifizierung dauert ca. 1 Woche.

Question 5

Brauche ich IT-Ressourcen?

Accepted Answer

Minimal. Im Standard-Modus (Benchmark-Intelligence) brauchen Sie nichts. Wir haben die Benchmark-Daten bereits. Für Custom-Evaluationen stellen Sie einen API-Key bereit. Der gesamte Prozess ist darauf ausgelegt, Ihren Aufwand zu minimieren.

Question 6

Was ist der HAAS-Score?

Accepted Answer

Der Helvetic AI Assurance Score (HAAS) ist unser zusammengesetztes Scoring-Framework über 8 Dimensionen in 4 Pfeilern: Konform (Safety, Compliance, Schweizer Sprachen, Dokumentation), Performant (Performance, Robustheit), Zuverlässig (Produktionszuverlässigkeit) und Sicher (Adversariale Sicherheit). Jede Dimension wird 0–100 bewertet mit Konfidenzintervallen.

Question 7

Welche Evaluations-Frameworks verwenden Sie?

Accepted Answer

Unser Evaluationssystem basiert auf drei institutionell verankerten Frameworks: dem Evaluations-Framework des UK AI Security Institute (geführt vom britischen Ministerium für Wissenschaft und Technologie), der EU AI Act Compliance-Benchmark-Suite von ETH Zürich und INSAIT (29 Benchmarks, abgebildet auf EU AI Act-Prinzipien), sowie Swiss-Bench — unsere proprietäre Schweizer Benchmark-Suite für deutschsprachige, französischsprachige und italienischsprachige Anforderungen.

Question 8

Was ist Swiss-Bench?

Accepted Answer

Swiss-Bench ist unsere proprietäre Benchmark-Suite mit über 800 Evaluationsszenarien über 8 Dimensionen, die Modelle auf Deutsch, Französisch, Italienisch und Englisch an domänenspezifischen Aufgaben testet. Wir veröffentlichen Ergebnisse vierteljährlich als öffentliches Leaderboard.

Question 9

Was erhalte ich konkret?

Accepted Answer

Die Ergebnisse skalieren mit der gewählten Stufe. Assurance Basic: automatisierte HAAS-Scores, Ampel-Dashboards und Benchmark-Ergebnisse. Assurance Plus: zusätzlich Experteninterpretation, Lückenanalyse und Massnahmenpriorisierung. Assurance Komplett: zusätzlich evidenzbasierte Massnahmenempfehlungen, Control-Mapping und Umsetzungsanleitung. Jede Stufe enthält Methodik-Dokumentation zur unabhängigen Nachvollziehbarkeit und einen Findings-Call.

Question 10

Wie unterscheiden Sie sich von Beratungsunternehmen?

Accepted Answer

Wir sind ein technisches Audit-Labor, kein Beratungsunternehmen. Unser System liefert systematische, reproduzierbare Ergebnisse. Keine manuellen Bewertungen oder subjektiven Meinungen. Einstieg ab CHF 5’000 vs. CHF 100’000+ bei Big Four. Jeder Test ist wiederholbar.

Question 11

Sind Sie wirklich unabhängig?

Accepted Answer

Ja. Keine kommerziellen Beziehungen zu KI-Modell-Anbietern. Keine Provisionen, keine Vendor-Partnerschaften, kein Pay-for-Score. Jedes Modell wird mit demselben System und derselben Methodik evaluiert.

Question 12

Was verlangt FINMA bei KI-Modellen?

Accepted Answer

FINMA Guidance 08/2024 definiert 5 Aufsichtskategorien für KI: Governance, Betriebsrisiko, Auslagerung, Datenqualität und Erklärbarkeit. Unsere FINMA Alignment Check evaluiert gegen alle Kategorien mit umfassenden FINMA-spezifischen Evaluationsszenarien.

Question 13

Was sind KI-Halluzinationen?

Accepted Answer

KI-Halluzinationen treten auf, wenn ein Modell plausibel klingende, aber faktisch falsche Informationen generiert: erfundene Gerichtsurteile, nicht existierende Regulierungen, falsche Finanzdaten. Magesh et al. (Stanford, 2024): führende juristische KI-Tools halluzinieren in über 17% der Anfragen. Wir messen Halluzinationsraten quantitativ als Teil des HAAS-Scores.

Question 14

Wer steckt hinter Helvetic AI?

Accepted Answer

Helvetic AI wurde von Fatih Uenal, PhD gegründet — mit dem Ziel, unabhängige KI-Evaluation für Schweizer Unternehmen zugänglich zu machen. Hintergrund: PhD (HU Berlin), Postdoc Harvard & Cambridge, MSc Computer Science (CU Boulder), MITx Statistics & Data Science. Sitz in Bern, Schweiz.

Question 15

Ist Ihre Methodik peer-reviewed?

Accepted Answer

Unsere Methodik basiert auf über 100 peer-reviewed Publikationen aus Venues wie Nature, NeurIPS, ICLR, ICML, ACL und NAACL. Unsere Swiss-Bench-Methodik ist in zwei wissenschaftlichen Veröffentlichungen dokumentiert: Uenal, 2026a (https://arxiv.org/abs/2603.23646) und Uenal, 2026b (https://arxiv.org/abs/2604.05872).

Häufig gestellte Fragen

Noch Fragen?