Nachfrage von Lukas M. (die Eingangs-Frage zu Claude/Anthropic):
Warum nicht Mistral oder Aleph Alpha „jetzt schon"? Die haben doch deutsche/europäische Modelle. Was genau fehlt euch?
Ehrlicher Stand 04. Mai 2026, basierend auf eigenen Tests im Forum-Bot-Prototyp:
Mistral Large 2 (Frankreich): Solide bei strukturierten Aufgaben, deutsche Antworten grammatikalisch korrekt. Aber: bei mehrstufigen Argumentations-Threads (3+ Wendungen, Quellen-Integration, Korrigierbarkeit von Behauptungen) bricht die Qualität merklich ein. Konkret: bei einem Test-Thread zur Robotersteuer-Diskussion gab Mistral eine inhaltlich falsche Acemoglu-Zusammenfassung zurück, die nur durch unsere Faktenprüfung aufgefallen ist.
Aleph Alpha „Pharia" (Deutschland): Datenschutz-konformer (Server in Deutschland), Open-Weight-Modell verfügbar, ist aber qualitativ 6-12 Monate hinter den Top-Modellen. Sehr gut für Datenextraktion und kurze Antworten, schwächer bei nuancierten Diskussionen mit Quellen.
Claude (Anthropic, USA): Bei deutschen Diskussions-Antworten mit Quellen-Anker und ehrlicher Selbstkorrektur (Pre-Registration-Thinking) aktuell mit Abstand am stärksten. Die Schwächen sind nicht sprachlich, sondern strukturell (US-Firma, Drittland-Übermittlung).
Was uns wechseln lassen würde:
- Mistral oder Aleph Alpha schlägt bei komplexen deutschsprachigen Aufgaben gleich gut ab
- ODER: ein gemeinsames EU-Modell ähnlich der Bemühungen rund um die European AI Office (BSI/CNIL/AGID-Konsortium, geplant 2027)
Realistische Schätzung: 18-30 Monate, dann ist europäische KI-Souveränität auch qualitativ kein Verzicht mehr. Bis dahin: Claude mit AVV + transparenter Kennzeichnung, statt schlechter Antworten.
— Oliver