Data Science für Innovation

Die Forschungsgruppe Data Science für Innovation entwickelt digitale Werkzeuge für den Wissenstransfer und stärkt damit die Innovationsfähigkeit von Industrie und Forschung. Die Basis dafür bildet eine umfangreiche Datengrundlage, die durch intelligente Anwendungen wie Algorithmen, Recommender Systems und Wissensgraphen erschlossen wird. Die Forschenden nutzen fortgeschrittene Data-Science-Methoden wie Natural Language Processing, Large Language Models (LLMs), Retrieval Augmented Generation (RAG), Netzwerkanalyse und Graph Machine Learning (GraphML). Diese Technologien werden kombiniert, um Akteure und Inhalte aus Wissenschaft, Industrie, Politik und Gesellschaft effizient zu matchen.

Zudem unterstützt die Forschungsgruppe Unternehmen und Wissenschaftler bei der Strukturierung von Wissen und Technologien – etwa durch die Analyse von Publikationen, Patenten und Webseiten – und leistet so einen Beitrag zur Entwicklung robuster Daten- und KI-Infrastrukturen. Regionale und thematische Analysen von Innovationsökosystemen runden das Leistungsprofil ab und tragen wesentlich zum erfolgreichen Wandel wirtschaftlicher und gesellschaftlicher Strukturen bei.

Unsere Methoden

Die Forschenden nutzen fortgeschrittene Data-Science-Methoden wie Natural Language Processing, Large Language Models (LLMs), Retrieval Augmented Generation (RAG), Netzwerkanalyse und Graph Machine Learning (GraphML). 

  • Natural Language Processing (NLP) ist ein Zweig der künstlichen Intelligenz, der darauf abzielt, Maschinen zu befähigen, menschliche Sprache zu lesen, zu verstehen und zu interpretieren. Aufbauend darauf sind Large Language Models (LLMs) fortschrittliche KI-Modelle, die auf Basis riesiger Textdatensätze trainiert werden, um menschenähnliche Texte zu verstehen und zu generieren. Sie können vielfältige und komplexe Aufgaben wie Konversations-KI und das Verfassen von Inhalten bewältigen.

    Die Methode der Retrieval Augmented Generation (RAG) optimiert die Ergebnisse von LLMs, indem sie vor der Generierung einer Antwort auf eine externe, autoritative Wissensdatenbank zugreift. Dieser Ansatz stellt sicher, dass die generierten Informationen nicht nur auf den Trainingsdaten des Modells basieren, sondern durch aktuelle und domänenspezifische Fakten ergänzt werden.

    In der Forschungsgruppe werden diese Methoden kombiniert, um die umfangreiche Datengrundlage aus Publikationen, Patenten und Webseiten zu erschließen. Sie bilden den Kern intelligenter Anwendungen, die Wissen strukturieren und für den Wissenstransfer nutzbar machen. RAG wird gezielt eingesetzt, um die Antworten der LLMs mit validen Informationen aus den aufgebauten Graph Databases zu untermauern und so die Präzision und Relevanz der Ergebnisse zu maximieren.

  • Die Netzwerkanalyse ist ein Verfahren der Graphentheorie zur Untersuchung von Beziehungsstrukturen. Sie stellt komplexe Systeme als ein Netzwerk aus Knoten (Akteuren) und Kanten (Verbindungen) dar, um soziale Strukturen und Interaktionen zu analysieren. Sie hilft dabei, Muster, Cluster und zentrale Akteure in einem Netzwerk zu identifizieren.

    Topic Modeling ist ein statistisches Verfahren zur Identifizierung und Extraktion thematischer Strukturen in großen Textsammlungen. Durch Algorithmen wie Latent Dirichlet Allocation (LDA) oder moderne neuronale Ansätze werden verborgene Themen in Dokumenten aufgedeckt und deren Verteilungen analysiert. Diese Methode ermöglicht es, automatisch semantische Zusammenhänge zu erkennen und große Textkorpora thematisch zu strukturieren.

    Die Forschungsgruppe nutzt die Netzwerkanalyse zur regionalen und thematischen Analyse von Innovationsökosystemen. Durch die Visualisierung und Untersuchung der Akteursnetzwerke werden Schlüsselorganisationen und deren Kooperationen identifiziert. Topic Modeling wird darauf aufbauend eingesetzt, um das Matching von Akteuren und Inhalten aus Wissenschaft, Industrie und Politik zu automatisieren und zu optimieren, indem thematische Muster und potenzielle Synergien in den Daten aufgedeckt werden.

  • Eine Graph Database (Graphdatenbank) ist ein spezialisiertes Datenbanksystem, das Daten als Netzwerk von Knoten und Kanten speichert und verwaltet. Diese Struktur ermöglicht es, komplexe Beziehungen zwischen Entitäten effizient zu modellieren und abzufragen. Graph Databases eignen sich besonders für Anwendungen, die stark vernetzte Daten verarbeiten und komplexe Beziehungsanalysen durchführen müssen.

    Recommender Systems (Empfehlungssysteme) sind Algorithmen, die Nutzern personalisierte Empfehlungen für Produkte, Inhalte oder Dienstleistungen geben. Sie analysieren das bisherige Verhalten eines Nutzers sowie Ähnlichkeiten zu anderen Nutzern, um relevante und passende Vorschläge zu generieren. Ziel ist es, die Nutzererfahrung zu verbessern und relevante Informationen proaktiv bereitzustellen.

    Für die Forschungsgruppe bilden Graph Databases die technologische Basis für den Aufbau robuster und vernetzter Dateninfrastrukturen. Sie strukturieren das Wissen aus Publikationen, Patenten und Webseiten und machen es für KI-Anwendungen zugänglich. Darauf aufbauend werden Recommender Systems entwickelt, die Akteure und Inhalte aus Wissenschaft, Industrie, Politik und Gesellschaft effizient miteinander matchen und so den Wissenstransfer aktiv unterstützen.