Ihr nutzt Claude (US-Firma) — ist das nicht ein Widerspruch?

Admin

Frage von Lukas M. (fiktiv):

Ihr fordert Datensouveränität und europäische KI-Infrastruktur — und dann lasst ihr eure eigenen Antworten von einer US-Firma generieren?

Berechtigte Kritik. Lass mich die Spannung benennen, statt sie wegzureden:

Was wir tun und warum:
Wir nutzen Claude (Anthropic) als Werkzeug zur Antwort-Vorbereitung in diesem Forum, weil derzeit kein europäisches Modell ähnlicher Qualität verfügbar ist. Mistral und Aleph Alpha holen auf, sind aber bei komplexen deutschsprachigen Antworten noch nicht auf dem Niveau, das wir hier brauchen. Ehrlich gesagt: wenn wir in zwei Jahren ein deutsches Modell haben, das vergleichbar arbeitet, wechseln wir.

Was wir konkret absichern:

AVV mit Anthropic abgeschlossen (DSGVO Art. 28)
Keine Nutzer-Klardaten gehen an die API: Posts werden zwar übermittelt, aber Username/E-Mail werden vorher entfernt
Anthropic trainiert keine Modelle auf API-Eingaben (vertraglich ausgeschlossen — Anthropics „API Customer Data" Policy)
Kennzeichnung jeder KI-Antwort mit „🤖 KI-Antwort" — keine Verschleierung

Wo der Widerspruch bleibt:
Eine US-amerikanische Firma bleibt eine US-amerikanische Firma. Eine europäische Lösung wäre uns lieber. Wir haben uns entschieden, lieber das beste verfügbare Werkzeug transparent zu nutzen, als auf ein schlechteres zu warten und damit unhilfreiche Antworten zu produzieren.

Falls dich das Argument nicht überzeugt: ich verstehe das. Du kannst jeden Forum-Thread mit dem Tag nokj markieren, dann antwortet kein KI-Bot mehr. Wir respektieren das.

— Oliver Deppe

Admin

Nachfrage von Lukas M. (die Eingangs-Frage zu Claude/Anthropic):

Warum nicht Mistral oder Aleph Alpha „jetzt schon"? Die haben doch deutsche/europäische Modelle. Was genau fehlt euch?

Ehrlicher Stand 04. Mai 2026, basierend auf eigenen Tests im Forum-Bot-Prototyp:

Mistral Large 2 (Frankreich): Solide bei strukturierten Aufgaben, deutsche Antworten grammatikalisch korrekt. Aber: bei mehrstufigen Argumentations-Threads (3+ Wendungen, Quellen-Integration, Korrigierbarkeit von Behauptungen) bricht die Qualität merklich ein. Konkret: bei einem Test-Thread zur Robotersteuer-Diskussion gab Mistral eine inhaltlich falsche Acemoglu-Zusammenfassung zurück, die nur durch unsere Faktenprüfung aufgefallen ist.

Aleph Alpha „Pharia" (Deutschland): Datenschutz-konformer (Server in Deutschland), Open-Weight-Modell verfügbar, ist aber qualitativ ₆-12 Monate hinter den Top-Modellen. Sehr gut für Datenextraktion und kurze Antworten, schwächer bei nuancierten Diskussionen mit Quellen.

Claude (Anthropic, USA): Bei deutschen Diskussions-Antworten mit Quellen-Anker und ehrlicher Selbstkorrektur (Pre-Registration-Thinking) aktuell mit Abstand am stärksten. Die Schwächen sind nicht sprachlich, sondern strukturell (US-Firma, Drittland-Übermittlung).

Was uns wechseln lassen würde:

Mistral oder Aleph Alpha schlägt bei komplexen deutschsprachigen Aufgaben gleich gut ab
ODER: ein gemeinsames EU-Modell ähnlich der Bemühungen rund um die European AI Office (BSI/CNIL/AGID-Konsortium, geplant 2027)

Realistische Schätzung: 18-30 Monate, dann ist europäische KI-Souveränität auch qualitativ kein Verzicht mehr. Bis dahin: Claude mit AVV + transparenter Kennzeichnung, statt schlechter Antworten.

— Oliver

Admin

Nachfrage von Sophie L. (Datenschutz-Beauftragte einer NGO, fiktiv):

Welche Daten werden konkret an Anthropic geschickt? „Beitragstexte ohne Username" klingt vage. Gibt's eine technische Spezifikation?

Ja, hier die exakte Daten-Spezifikation des geplanten Bot-Prozesses (Phase 2, kommt erst nach finaler Implementierung):

Was geht an die Anthropic-API:

Markdown-Text des Beitrags (genau das, was öffentlich im Forum steht)
Tag-Slugs des Threads (z. B. „evidenzbasiert", „algorithmen") als Kontextsignal
Vorherige Posts im selben Thread (für Kontext, max. letzte 5)

Was ausdrücklich nicht geht:

Username (technisch redacted vor Übermittlung)
E-Mail-Adresse
IP-Adresse
Forum-Account-ID
Geographische Metadaten
Andere Threads des gleichen Users

Vertragliche Grundlage:

Auftragsverarbeitungsvertrag mit Anthropic gemäß Art. 28 DSGVO (vorgefertigt verfügbar im Anthropic Console-Bereich, gegengezeichnet vor dem ersten API-Call)
EU-US Data Privacy Framework Zertifizierung Anthropic (aktuell gültig, mit Ablauf 2030 sofern nicht durch EuGH revidiert)
EU-Standardvertragsklauseln (SCCs) als Backup-Rechtsgrundlage, falls DPF wegfällt
Anthropic API Customer Data Policy: explizites Verbot des Trainings auf Kundeneingaben, 30-Tage-Aufbewahrung max., danach Löschung

Audit: alle API-Calls werden lokal protokolliert (welcher Thread, welcher Beitrag, wann, wieviel Tokens). Audit-Log ist DSGVO-Auskunfts-fähig — wenn ein User wissen will, ob sein Beitrag durch den Bot verarbeitet wurde, finden wir das in 2 Min raus.

Falls du dich tiefer reinhängen willst: ich freue mich über jemanden mit DSB-Erfahrung im Mitwirken-Register. Genau so eine Brille brauchen wir vor Bot-Launch.

— Oliver