Eine neue Umfrage von Udacity, inzwischen Teil von Accenture, sorgt für Gesprächsstoff: 90 % der Arbeitnehmer:innen nutzen KI am Arbeitsplatz – aber das Vertrauen in die Ergebnisse ist extrem gering.
Was bedeutet das für Unternehmen, die Produktivität und die Zukunft von KI-gestützten Tools? Und welche Anwendungen haben sich laut Daten von RAMP und einer aktuellen A16Z-Studie wirklich bewährt?
Die Udacity-Studie mit 2.000 Befragten zeigt:
90 % haben schon KI-Tools in der Arbeit eingesetzt.
50 % sagen, dass ihr Arbeitgeber nicht für die Tools zahlt.
42 % berichten, dass ihre Firma keine klaren KI-Nutzungsrichtlinien hat.
72 % der Manager zahlen Tools sogar aus eigener Tasche.
👉 Das Ergebnis: Viele nutzen KI zwar, fühlen sich aber nicht unterstützt.
Das größte Problem: Vertrauen.
3 von 4 Beschäftigten brechen Aufgaben mit KI-Tools ab, weil die Ergebnisse zu ungenau sind.
45 % trauen den Ergebnissen von Kolleg:innen nicht, wenn diese KI genutzt haben.
36 % wünschen sich sogar, dass KI ganz aus Deliverables verschwindet.
Interessant ist, dass dieses Misstrauen auch in den Marktdaten von RAMP sichtbar wird.
RAMP wertet monatlich Milliarden an Geschäftsausgaben aus.
Unter den am schnellsten wachsenden SaaS-Anbietern finden sich zwei Firmen, die genau auf das Problem „Vertrauen“ setzen:
Braintrust – eine Plattform, die KI-Modelle auf Halluzinationen, Fehler und Verzerrungen überwacht.
Augment Code – ein Coding-Tool für Enterprise-Umgebungen, das speziell auf Verlässlichkeit bei großen Code-Basen ausgelegt ist.
Das zeigt: KI allein reicht nicht. Erst mit Kontroll- und Monitoring-Layern wird sie wirklich nutzbar für Unternehmen.
Ein spannender Punkt kommt aus einer neuen Studie von Andreessen Horowitz (A16Z): Nicht jedes Tool hält, was es verspricht.
Die Analyst:innen haben KI-Tools in typischen Office-Use-Cases getestet und bewertet. Hier die wichtigsten Erkenntnisse:
Gamma (vertikales Tool): Am besten bei Design & Editierbarkeit.
GenSpark (horizontal): Stärker bei Content-Qualität & Prompt-Genauigkeit.
👉 Empfehlung: Wer schnelle, visuell saubere Slides braucht → Gamma. Wer auf inhaltliche Tiefe achtet → GenSpark.
Alle Tools: Hohe Rechen-Genauigkeit.
Shortcut AI (vertikal): Gut bei Formatierung & Analyse.
Manis (horizontal): Stark bei Datenauszug.
Fixer: Einziger Kandidat, der in allen Kategorien solide abschnitt (z. B. Entwürfe, Kontext, Kalenderintegration).
Comet & Manis: Schnell, präzise, mit guten Tabellen & Analysen.
Dia: Deutlich schwächer bei Tiefe & Quellenangaben.
Granola & Notion: Lieferten am besten ab.
ChatGPT Record Mode: Fiel klar durch – vier von fünf Kategorien im roten Bereich.
A16Z unterscheidet zwischen:
Horizontale Tools: Breite Einsatzmöglichkeiten (z. B. GenSpark, Manis, Operator).
Vertikale Tools: Spezialisierung auf konkrete Aufgaben (z. B. Gamma, Shortcut AI, Fixer).
Aktuell gilt:
Vertikale Tools sind oft stärker in der Tiefe.
Horizontale Tools sind flexibler, aber die Konkurrenz ist brutal.
Langfristig erwartet A16Z eine Konvergenz: Spezialisierte Tools dehnen sich aus, Generalisten fokussieren sich stärker auf konkrete Use-Cases.
Die wichtigsten Learnings:
Alle nutzen KI – aber Vertrauen ist das Nadelöhr. Ohne verlässliche Ergebnisse bleiben Tools Spielereien.
Monitoring & Infrastruktur-Lösungen boomen. Braintrust & Augment Code zeigen: Die Nachfrage nach „Trust-Layern“ ist riesig.
Kein Tool ist überlegen. Es gibt Stärken und Schwächen – die beste Strategie ist aktuell Experimentieren & Kombinieren.
👉 Für Unternehmen bedeutet das: Statt auf ein KI-Tool zu wetten, ist es klüger, ein Portfolio an Tools aufzubauen und deren Stärken gezielt einzusetzen.
KI am Arbeitsplatz ist Realität. Doch bevor sie zum echten Produktivitätsbooster wird, muss das Vertrauen wachsen – durch bessere Ergebnisse, klarere Policies und begleitende Infrastruktur.
Wir stehen am Anfang einer Lernphase, in der das Motto gilt:
„Probieren, vergleichen, optimieren – aber nicht blind vertrauen.“
👉 Mehr Einblicke zu den besten KI-Tools für Arbeit & Business findest du regelmäßig im AI TRIBE Newsletter.