Die Fähigkeit generativer Künstlicher Intelligenz (Gen-KI), über die Nutzung leistungsfähiger Large-Language-Modelle (LLMs) menschliche Sprache zu verstehen, komplexe Fragen zu beantworten, Programmcode zu schreiben oder Wissen zusammenzufassen, bietet neue Möglichkeiten für die Automatisierung von Geschäftsprozessen. Die zunehmende Multimodalität der LLMs beim Generieren und Interpretieren von Audio-, Bild- und Videodaten eröffnet dabei auch vielversprechende Anwendungsgebiete jenseits von reinen textbasierten Aufgaben.