Zum Inhalt springen
← Alle Leistungen

Die meisten KI-Coding-Piloten scheitern. Wir wissen warum.

Nicht am Tool — an der Infrastruktur drumherum. Wir helfen Teams, die Feedbackschleifen, Praktiken und CI/CD-Grundlagen aufzubauen, die KI-gestütztes Engineering tatsächlich zum Laufen bringen.

KI-Coding-Tools können Ihr Team erheblich schneller machen — oder teuren technischen Schulden produzieren. Der Unterschied liegt nicht im Tool, sondern im Drumherum: Feedback-Loops, die schnell genug sind, damit das Modell auf Kurs bleibt. CI/CD-Pipelines, die mit dem erhöhten Code-Churn umgehen. Review-Prozesse, die menschliches Urteil behalten, während sie KI-Geschwindigkeit nutzen.

Wir entwickeln seit Jahren Produktionssoftware mit Claude Code und OpenAI Codex — unter anderem Kunnus, unser eigenes Compliance-SaaS. Wir kennen den Unterschied zwischen KI-unterstütztem Engineering und "AI Slop", weil wir beides gesehen haben — und wissen, welche Praktiken den Unterschied machen.

Claude CodeOpenAI CodexCursorTDDLLM-HooksAgentisches CodingFeedback-Loop Engineering

Warum die meisten KI-Piloten stagnieren

  • CI/CD ist zu langsam — ein 20-Minuten-Build zerstört den Feedback-Loop, den KI-Coding braucht.

  • Kein Review-Prozess für KI-generierten Code — ohne menschliche Qualitäts-Gates entsteht subtiler, aber teurer technischer Schulden.

  • Tooling ohne Kontext — Copilot-Lizenzen kaufen ist nicht dasselbe wie KI-unterstütztes Engineering aufbauen.

  • Fehlende Validierungsschleifen — ohne TDD, Linting-Hooks und automatisierte Checks produziert KI selbstbewussten, aber falschen Code.

Für regulierte Industrien in Deutschland

Wir kennen die EU-KI-Verordnung, DSGVO-Implikationen von KI-Coding-Tools und BSI-Richtlinien. Wir helfen Ihnen, Workflows und Tooling zu wählen, das in Ihrem Compliance-Umfeld funktioniert — inklusive Datenresidenz-Anforderungen, wenn Quellcode an US-Cloud-APIs gesendet wird.

01 2–3 Wochen

AI Engineering Readiness Audit

Bevor KI-Tools helfen können, muss die Grundlage stimmen. Wir analysieren Ihre CI/CD-Geschwindigkeit, Platform-Reife, Security-Scanning, IaC-Posture und Team-Workflows.

Ergebnis: Priorisierter Readiness-Report mit konkreten Toolempfehlungen für Ihren Stack, Reifegrad und Compliance-Anforderungen.

02 1–2 Tage

LLM-Workflow-Workshop

Praxisworkshop mit Ihrem echten Stack, nicht mit generischen Demos. Effektives Prompten, Feedback-Loop-Design, Code-Review mit KI, agentische Coding-Patterns.

Ergebnis: Ihr Team beherrscht Pre-Commit-Hooks, LLM-Hooks und TDD-Integration — die Grundlagen, die Output-Qualität sicherstellen.

03 Fortlaufend

AI-Assisted Engineering Embedding

Wir arbeiten direkt mit Ihrem Team und etablieren die Praktiken, das Tooling und die CI/CD-Infrastruktur, die KI-Coding-Tools tatsächlich zum Laufen bringen.

Ergebnis: Mehrstufige Review-Zyklen, Qualitäts-Gates und Plattform-Grundlagen für skalierte KI-Adoption in Ihrer Organisation.

Wie wir Kunnus gebaut haben

Von einem Vibe-codierten Prototyp zur Produktions-SaaS — mit KI-gestütztem Engineering, durchgehend Mensch im Loop.

01 Entdeckung Nov 2024

Schnell validieren, bevor man baut

In wenigen Tagen entstand ein Vibe-codierter Prototyp, den wir sofort mit Herstellern teilten. Entscheidende Erkenntnis: CRA-Compliance in der Fertigung ist fundamental anders als Software-Compliance. Viele Komponenten kommen von Drittanbietern ohne Quellcode. Teams sind Engineering-Profis, keine Software-Entwickler.

Ohne dieses frühe Feedback hätten wir monatelang auf falschen Annahmen aufgebaut.

02 Rapid Iteration Nov–Dez 2024

Monolith für Velocity, Mensch im Loop

Next.js-Monolith für maximale Geschwindigkeit. TDD von Tag 1. Pre-Commit-Hooks mit Tests, Linting, Formatter. LLM-Hooks für automatisches Feedback bei jedem Commit. Mehr menschliches Steering und Refactoring zu Beginn — als das Modell den Kontext noch aufbaute.

Feedback-Loops vor Velocity. Die Hooks stellten sicher, dass jeder KI-generierte Commit die Tests bestand, bevor er im Repo landete.

03 Architektur-Migration Jan–Feb 2025

Rust-Backend: Desired State validieren

Refactoring zu Next.js-Frontend und Rust-Backend für Performance und Ressourceneffizienz. Anfangs fehlte das alte Backend im Feedback-Loop zur Korrektheitsprüfung — also mussten wir mehr nachbessern. Rust + pedantic Clippy + Compiler + TDD geben heute sehr hohe Konfidenz.

Den gewünschten Zielzustand immer in den Validierungs-Loop einbauen. Ohne Referenzpunkt generiert KI selbstbewussten, aber subtil falschen Code.

04 Qualitäts-Loops Fortlaufend

Fokussierte Review-Zyklen pro PR

Jeder PR durchläuft mehrere Claude-Review-Zyklen — jeweils mit einem Fokusbereich: Wartbarkeit, Testbarkeit, Security, Performance. Jeder Zyklus produziert konkrete Refactoring-Aufgaben. Der Mensch entscheidet und implementiert.

Fokussierte Einzelpässe liefern bessere Ergebnisse als eine einzelne umfassende Review. Ergebnis: produktionsreifer Code, der trotz KI-Unterstützung hohe Standards hält.

Was unsere Kunden wissen wollen.

Wie starten wir mit KI-Coding-Tools, ohne technische Schulden aufzubauen?

Der Schlüssel sind schnelle Feedback-Loops von Tag 1: TDD, Pre-Commit-Hooks und automatisierte Linting-Checks fangen Fehler ab, bevor sie ins Repository gelangen. Wir helfen Teams, diese Grundlagen vor der Tool-Einführung zu etablieren, damit KI-generierter Code denselben Qualitätsstandards unterliegt wie handgeschriebener Code.

Welche CI/CD-Voraussetzungen brauchen wir für KI-gestütztes Engineering?

Ihre Pipeline muss schnell genug sein, um den Feedback-Loop nicht zu brechen — idealerweise unter 5 Minuten für den vollständigen Build. Zusätzlich brauchen Sie automatisierte Security-Scans, Testabdeckungs-Gates und reproduzierbare Builds. Wir prüfen das in unserem Readiness Audit und geben konkrete Empfehlungen für Ihren Stack.

Ist KI-generierter Code DSGVO-konform und wie gehen wir mit Datenresidenz um?

Das hängt davon ab, welche Daten an die KI-API gesendet werden. Quellcode, der personenbezogene Daten oder Geschäftsgeheimnisse enthält, erfordert besondere Sorgfalt. Wir helfen Ihnen, Workflows zu konfigurieren, die sensiblen Code lokal halten, und beraten zu EU-konformen Hosting-Optionen für LLM-APIs.

Was unterscheidet AI-Assisted Engineering von einfach Copilot-Lizenzen zu kaufen?

Copilot ist ein Autovervollständigungs-Tool — AI-Assisted Engineering ist eine Arbeitsweise. Der Unterschied liegt in strukturierten Review-Prozessen, Validierungs-Loops und der Integration in Ihre bestehende Qualitätssicherung. Ohne diese Praktiken produzieren KI-Tools Code, der kompiliert, aber langfristig teuer wird.

Wie messen wir den ROI von KI-Coding-Tools in unserem Engineering-Team?

Vergessen Sie Lines-of-Code-Metriken — die sind irreführend. Wir messen Cycle Time (Idee bis Production), Defect-Escape-Rate und Developer-Zufriedenheit. Typischerweise sehen Teams nach 8–12 Wochen mit etablierten Praktiken eine 30–50% kürzere Cycle Time bei gleichbleibender oder besserer Codequalität.

Bereit, KI-Engineering richtig aufzubauen?

Ein kostenloses Gespräch darüber, wo Sie stehen und was als Nächstes sinnvoll wäre. Kein Hardsell — nur ehrliche Einschätzung.