Question 1

Was ist Helvetic AI?

Accepted Answer

Helvetic AI ist ein unabhängiges Schweizer KI-Evaluationslabor, das KI-Modelle systematisch prüft: für Performance, EU AI Act Compliance, FINMA-Validierung und Schweizer Sprachanforderungen. Jede Evaluation liefert einen HAAS-Score über 6 Dimensionen.

Question 2

Verlassen meine Daten die Schweiz?

Accepted Answer

Nein. Sie wählen aus 5 Handoff-Modi: Benchmark-Intelligence (Standard, keine Daten nötig), API-Key, Docker auf Ihrer Infrastruktur, dedizierte Hardware vor Ort oder Anonymisierung vorab. In keinem Modus verlassen Ihre Daten die Schweiz.

Question 3

Was kostet der Einstieg?

Accepted Answer

Der günstigste Einstieg ist eine KI-Risikoklassifizierung ab CHF 3’000. Für eine vollständige KI-Modell-Evaluation mit Benchmark-Ergebnissen beginnen Preise ab CHF 8’000.

Question 4

Wie lange dauert eine Evaluation?

Accepted Answer

Eine KI-Modell-Evaluation dauert 5–10 Arbeitstage je nach Umfang. Eine Risikoklassifizierung dauert ca. 1 Woche. Eine FINMA-Validierung dauert 2–4 Wochen.

Question 5

Brauche ich IT-Ressourcen?

Accepted Answer

Minimal. Im Standard-Modus (Benchmark-Intelligence) brauchen Sie nichts. Wir haben die Benchmark-Daten bereits. Für Custom-Evaluationen stellen Sie einen API-Key bereit. Der gesamte Prozess ist darauf ausgelegt, Ihren Aufwand zu minimieren.

Question 6

Was ist der HAAS-Score?

Accepted Answer

Der Helvetic AI Assurance Score (HAAS) ist unser zusammengesetztes Scoring-Framework über 6 Dimensionen: Leistung, Robustheit, Sicherheit, Konformität, Schweizer Sprache und Dokumentation. Jede Dimension wird 0–100 bewertet mit Konfidenzintervallen.

Question 7

Welche Evaluations-Frameworks verwenden Sie?

Accepted Answer

Unser Evaluationssystem basiert auf drei institutionell verankerten Frameworks: dem Evaluations-Framework des UK AI Security Institute (geführt vom britischen Ministerium für Wissenschaft und Technologie), der EU AI Act Compliance-Benchmark-Suite von ETH Zürich und INSAIT (29 Benchmarks, abgebildet auf EU AI Act-Prinzipien), sowie Swiss-Bench — unsere proprietäre Schweizer Benchmark-Suite für deutschsprachige, französischsprachige und italienischsprachige Anforderungen.

Question 8

Was ist Swiss-Bench?

Accepted Answer

Swiss-Bench ist unsere proprietäre Benchmark-Suite mit 395 Evaluationsszenarien, die Modelle auf Deutsch, Französisch und Italienisch an domänenspezifischen Aufgaben testet. Wir veröffentlichen Ergebnisse vierteljährlich als öffentliches Leaderboard.

Question 9

Was erhalte ich konkret?

Accepted Answer

(1) Einen standardisierten Evaluationsbericht mit HAAS-Scores, Lückenanalyse und Empfehlungen. (2) Detaillierte Benchmark-Ergebnisse, Scoring-Aufschlüsselungen und Methodik-Dokumentation zur unabhängigen Verifizierung (Konfiguration, Seed-Werte, Datensätze). Sie können jeden Test selbst wiederholen. (3) Einen Findings-Call zur Ergebnisinterpretation.

Question 10

Wie unterscheiden Sie sich von Beratungsunternehmen?

Accepted Answer

Wir sind ein technisches Audit-Labor, kein Beratungsunternehmen. Unser System liefert systematische, reproduzierbare Ergebnisse. Keine manuellen Bewertungen oder subjektiven Meinungen. Einstieg ab CHF 3’000 vs. CHF 100’000+ bei Big Four. Jeder Test ist wiederholbar.

Question 11

Sind Sie wirklich unabhängig?

Accepted Answer

Ja. Keine kommerziellen Beziehungen zu KI-Modell-Anbietern. Keine Provisionen, keine Vendor-Partnerschaften, kein Pay-for-Score. Jedes Modell wird mit demselben System und derselben Methodik evaluiert.

Question 12

Was verlangt FINMA bei KI-Modellen?

Accepted Answer

FINMA Guidance 08/2024 definiert 5 Aufsichtskategorien für KI: Governance, Betriebsrisiko, Auslagerung, Datenqualität und Erklärbarkeit. Unsere FINMA-Validierung evaluiert gegen alle Kategorien mit umfassenden FINMA-spezifischen Evaluationsszenarien.

Question 13

Was sind KI-Halluzinationen?

Accepted Answer

KI-Halluzinationen treten auf, wenn ein Modell plausibel klingende, aber faktisch falsche Informationen generiert: erfundene Gerichtsurteile, nicht existierende Regulierungen, falsche Finanzdaten. Magesh et al. (Stanford, 2024): führende juristische KI-Tools halluzinieren in über 17% der Anfragen. Wir messen Halluzinationsraten quantitativ als Teil des HAAS-Scores.

Question 14

Wer steckt hinter Helvetic AI?

Accepted Answer

Helvetic AI wurde von Fatih Uenal, PhD gegründet — mit dem Ziel, unabhängige KI-Evaluation für Schweizer Unternehmen zugänglich zu machen. Hintergrund: PhD (HU Berlin), Postdoc Harvard & Cambridge, MSc Computer Science (CU Boulder), MITx Statistics & Data Science. Sitz in Bern, Schweiz.

Question 15

Ist Ihre Methodik peer-reviewed?

Accepted Answer

Unsere Methodik basiert auf über 100 peer-reviewed Publikationen aus Venues wie Nature, NeurIPS, ICLR, ICML, ACL und NAACL. Unser Swiss-Bench-Methodik-Paper ist auf ArXiv veröffentlicht: https://arxiv.org/abs/2603.23646

Häufig gestellte Fragen

Noch Fragen?