Der Einsatz von KI-Management-Systemen in Einkauf und Logistik ist mit der Erwartung verbunden, Entscheidungen auf Basis von Werten zu treffen. Können KI-Tools diesem Anspruch gerecht werden?
Einkäufer stehen regelmäßig vor dem Problem, eine sachlich fundierte und betriebswirtschaftlich tragfähige Auswahlentscheidung zwischen Produktalternativen zu treffen. Das Produkt soll ein attraktives Preis-Leistungsverhältnis aufweisen, die Akzeptanz der Nutzer finden, Sicherheit für Patienten und Mitarbeiter bieten, positive Gemeindeeffekte erzeugen, eine hohe Verfügbarkeit über eine resiliente Lieferkette garantieren und ökologische Anforderungen erfüllen.
Oft fehlen faktenbasierte entscheidungsrelevante Informationen über Produktfunktionalität, Robustheit, Handhabungskomfort und Auswirkungen des Produktgebrauchs im klinischen Betrieb. Auch der Zugriff auf klinische und epidemiologische Fakten wie z.B. Inzidenzen für das Risiko von Folgeeingriffen oder Auswirkungen auf die CO2-Bilanz erweist sich als zu zeitaufwendig im Tagesgeschäft des Einkäufers.
Der Einsatz von KI-Management-Systemen in Einkauf und Logistik ist mit der Erwartung verbunden, Produktauswahl-Entscheidungen zu qualifizieren und wertorientiert zu fundieren. Lebenszyklus-Kosten, Nachhaltigkeitseffekte, Nutzeneffekte für Mitarbeiter, Patientenrisiken, aber auch klinische und epidemiologische Auswirkungen sollen idealerweise in das Entscheidungskalkül einfließen.

Werkzeug, nicht Taktgeber. KI ist keine universelle Allzweckwaffe. Einkäufer ohne breite Fachkompetenz bleiben auch mit KI-Unterstützung erfolglos.
Rolle des Einkäufers im KI-basierten Entscheidungsprozess
Die Auswahl eines Medizinprodukts, unabhängig davon, ob es sich um ein „Bagatelle-Produkt“ (z.B. OP-Handschuhe, persönliche Schutzausrüstung), ein „Physician Preferred Item“ oder eine High-end-Technologie (z.B. PFA-Katheter, Thoragic Branched Endoprosthesis) handelt, ist in vielen Fällen mit einem Entscheidungsprozess unter Unsicherheit verbunden. Benötigt werden nicht nur Informationen über Preise und Finanzkonditionen; viel wichtiger sind valide Daten zu Betriebskosten und Betriebsbereitschaftskosten, CO2-Abdruck und Entsorgungsaufwand, zu Handhabungsvorteilen für das Personal und Anwendungsrisiken für den Patienten sowie Folgewirkungen in der Gemeinde (Solidargemeinschaft).
Wünschenswert ist zudem eine Bewertung dieser Informationen unter den Gesichtspunkten der klinischen Evidenz, z.B. unter Rückgriff auf Erfahrungsberichte anderer Anwender, und über Konsequenzen des Einsatzes eines bestimmten Medizinprodukts im Hinblick auf Patientenrisiken.
Im Sinne einer „Wertorientierten Beschaffungspolitik“ (siehe Abbildung 1) ist neben den genannten Kriterien zusätzlich die Erfassung von Informationen zur epidemiologischen Evidenz im Hinblick auf Rezidiv-Risiken und Risiko-Inzidenzen alternativer Medizinprodukte (z.B. SM-Inzidenz und SA-Risiko bei Herzklappen) von Bedeutung für die Auswahlentscheidung, aber auch Angaben zu Emissionsbelastungen sowie zur Resilienz der Lieferkette eines Produkts spielen eine Rolle. Mit dem Ziel, diese Vielfalt an Informationen systematisch zu erfassen und in ein Entscheidungskalkül zu überführen, gewinnen KI-Management-Systeme in Einkauf und Logistik an Bedeutung.
Die Nutzung von KI-Tools/KI-Agenten verändert die Arbeitsweise des Einkäufers und bewirkt Veränderungen im Hinblick auf dessen Anforderungsprofil sowie sein Rollenverständnis.
Denn Nutzen und Effektivität eines KI-Tools hängen wesentlich davon ab, dass der Einkäufer es gelernt hat, an die KI die der Problemstellung angemessenen Kontextinformationen zu geben und eine zielführende Fragesequenz, sogenannte PROMPTS, zu entwickeln. Wichtig ist weiterhin, dass der Einkäufer als „Human-in-the-Loop“ (HITL) sich nicht 1:1 auf die Empfehlungen eines KI-Tools verlässt, sondern diese Empfehlungen auf Stringenz überprüft und gegebenenfalls durch Prüffragen, Vertiefungsfragen oder Angabe von entscheidungsrelevanten und validen Quellenhinweisen nachjustiert (siehe Abbildung 1 unten).
Auch ist zu beachten, dass ein KI-Tool von sich aus weitergehende Aspekte einbringt, die zu Beginn des Suchprozesses gar nicht auf der Entscheidungsagenda des Einkäufers standen. So erhält man als Einkäufer bei der KI-basierten Abfrage nach dem optimalen OP-Handschuh nicht nur Informationen über Tragekomfort, Materialrobustheit, CO2-Bilanz und Entsorgungsaufwand, sondern auch Hinweise auf latex-assoziierte Allergie-Risiken, die für Patienten und OP-Personal durch den Gebrauch von Latex-Handschuhen ausgehen und welche Folgekosten damit einhergehen.
Bei der KI-Abfrage zum Vergleich der Wirtschaftlichkeit von klinischen Einweg- gegenüber Mehrweg-Textilien werden neben Kostenvergleichen auch ausführliche Angaben über den Ressourcenverbrauch pro OP-Kittel sowie die Abfallbilanz und die CO2-Belastung der beiden Alternativen zur Verfügung gestellt. Damit erweitert sich der Katalog der Entscheidungskriterien insbesondere um klinische, epidemiologische und ökologische Indikatoren, die im ursprünglich angelegten Einkaufsverfahren keine oder eine untergeordnete Rolle gespielt haben.
Im Sinne einer fachlich fundierten und ganzheitlichen Entscheidungsfindung mögen diese Zusatzinformationen wünschenswert sein; sie bergen aber die Gefahr, dass die Final-Entscheidung durch nicht entscheidungsrelevante Sachverhalte verwässert wird. So wurde in einer Fallstudie der KI-basierte Produktvergleich dreier Typen von OP-Handschuhen durch den herstellerseitig kommunizierten AQL-Level (Accepted Quality Level = erlaubte Ausschussquote) beeinflusst: Das Produkt mit dem niedrigsten AQL-Level wurde vom KI-Tool empfohlen. Aber alle Vergleichsprodukte unterschritten den vorgegebenen Minimum-Level der Industrienorm deutlich, sodass dieses Kriterium keine Entscheidungsrelevanz hat. Dies ist eine typische Informationslage, in der der Sachverstand des HITL gefordert ist, um bei dem KI-Agenten einen Lerneffekt durch Rückkopplung auszulösen.

Maligne Nachrichten und KI-Halluzinationen
Ein weiteres Erkenntnisproblem in Verbindung mit KI-gestützten Analysen ist darin zu sehen, dass die Algorithmen, nach denen ein KI-Modell lernt, in der Regel nicht transparent sind. Der „Kluger Hans-Effekt“ (oder Wunderpferd-Effekt) im maschinellen Lernen beschreibt das Phänomen, dass eine Methode zwar zum richtigen Ergebnis führt, aber aus irrelevanten Informationen und/oder unzuverlässigen Quellen gespeist wird. Diesen Zusammenhang demonstriert eine Studie, bei der die eingesetzte KI zur Erkennung von Infektionen in den Röntgenbildern von Lungen die handschriftlichen Notizen an den Bildrändern als Quelle nutzte statt die medizinischen Bildinhalte.
Von besonderer Bedeutung ist das Phänomen der „KI-Halluzinationen“. Solche zu Fehlentscheidungen führenden Falschinformationen entstehen durch „Wissenslücken“ des KI-Agenten, die dieser aufzufüllen versucht durch Wahrscheinlichkeitsannahmen, Interpretationen, kreative Ergänzungen („Whisper-Phänomen“) und die Nutzung von Algorithmen zur Mustererkennung als Ersatz für das Fehlen belegbarer Fakten. Als gewichtige Ursache für KI-Halluzinationen gelten unpräzise formulierte, mehrdeutige Prompts.
Weiterhin können sogenannte maligne Nachrichten die KI-generierten Empfehlungen in die falsche Richtung lenken. Es handelt sich dabei um Informationen, die der KI-Agent unreflektiert aus ideologisch geprägten Quellen ableitet. Wenn z.B. ein KI-Modell dominant auf die Theorien und Werturteile bestimmter Denkschulen zurückgreift und die kritische Auseinandersetzung mit den Normen anderer Denkschulen meidet (weil es mit diesen Daten vorsätzlich, aus Unkenntnis oder aus Nachlässigkeit nicht gefüttert wird), kann es im Einzelfall zu erheblichen Minderungen des Informationswerts einer KI-gestützten Modellauswertung kommen.
Beispielhaft kann dieser Effekt an der Frage demonstriert werden, durch welche Maßnahmen in einer Volkswirtschaft Arbeitslosigkeit erfolgreich bekämpft werden kann. Versorgt man das KI-Modell primär mit Theorien und Werturteilen der keynesianischen Schule, konzentrieren sich die Problemlösungsempfehlungen vorzugswürdig auf nachfrageorientierte Interventionen. Auch der Lernalgorithmus dieses KI-Modells orientiert sich dann an dieser Schule und führt dazu, dass eine Verfeinerung der Lösungsvorschläge auf die Intensivierung staatlicher Einflussnahmen zielt.
Auch das „Sycophancy Phenomenon“ muss durch den KI-Nutzer beachtet und kontrolliert werden. Es beschreibt die Tendenz von KI-Tools, ihren Nutzern ungeprüft zuzustimmen, wenn z.B. über einen PROMPT verlangt wird, dass tendenziöse Berichte oder ideologische Ansichten als Quelle berücksichtigt werden sollen. Das „Sycophancy Phenomenon“ wirft auch eine grundlegende ethische Frage im Umgang mit KI-Tools auf: Dürfen wir alles, was wir können, und was passiert, wenn KI-Algorithmen ideologisch trainiert werden? So erfüllen gezielte Hinweise auf die Verwendung von Daten aus Quellen, die der Meinung des KI-Anwenders (oder präziser ausgedrückt: seinen Vorurteilen) entsprechen, den Tatbestand der Manipulation und dies steht einer objektiven KI-Anwendung entgegen. So wird der Black-Box-Charakter eines KI-Tools durch alle diese genannten Phänomene verstärkt und stellt eine Stolperfalle für den Anwender dar.
Wichtig ist daher, einem KI-Tool den Zugang zu validen Datenbanken mit evidenzbasierten Informationen zu ermöglichen, z.B. durch „Retrieval Augmented Generation“ (RAG).
Erkenntnisse
KI ist kein Job-Killer für Einkäufer. Entscheidungsprozesse werden im Beschaffungsmanagement durch KI-Tools vereinfacht, sie sind ohne Fachkompetenz aber nicht zu erledigen. KI ist auch keine universelle Allzweckwaffe, die den Einkäufer ohne breite Fachkompetenz erfolgreich arbeiten lässt, sondern ein Sparringspartner, kein absoluter Ratgeber. Und KI ist so effektiv, wie der sie benutzende Einkäufer als Fachmann in der Lage ist, KI-Empfehlungen einer kritischen Würdigung zu unterziehen.
Das heißt: Urteilsvermögen und Problemlösungsfähigkeit von Experten („Hinterkopfwissen“) bilden in Kombination mit maschineller Intelligenz die Grundlage für hybride Intelligenz: Der „Mensch in der Schleife“ verhilft dem KI-Modell zu höherer Leistungskapazität durch Anleitungen, Feedback, Kontexteingaben und entscheidungsrelevante Hinweise auf Datenquellen mit evidenz-basierten Daten.
KI bietet die Chance, komplexe Produktauswahlentscheidungen im Beschaffungsmanagement verstärkt an den Prinzipien des „Value-Based Health Care“ zu orientieren. Voraussetzung ist ein „Reinforcement Learning“ (bestärkendes Lernen): Der KI-Agent lernt durch Interaktion mit der Modellumgebung und durch Versuch-und-Irrtum-Erfahrungen. Entscheidend für die Qualität dieser Lerneffekte ist das Feedback durch den HITL.
Autor:innen:
Dr. med. Anna K.S. von Eiff, MBA
Fachärztin für Innere Medizin (Münster)
Univ.-Prof. Dr. Dr. Wilfried von Eiff
Centrum für Krankenhaus-Management (Universität Münster) und Center for Health Care Management and Regulation (HHL Leipzig Graduate School of Management)
Kontakt: von.eiff@uni-muenster.de
