Data Mining und Big Data Analytics: semantische Suche, Prognose und Entscheidungsunterstützung mit künstlichen neuronalen Netzen

Research output: ThesisDoctoral thesis

Authors

  • Christoph Gleue
View graph of relations

Details

Original languageGerman
QualificationDoctor rerum politicarum
Awarding Institution
Supervised by
Date of Award15 May 2019
Place of PublicationHannover
Publication statusPublished - 2019

Abstract

This cumulative dissertation summarizes and critically reflects on a total of six scientific publications in which I was involved as an author. The overall objective of this thesis is the analysis and discussion of the question of how traditional, historically grown workflows and business processes can be optimized using methods and technologies from the broad fields of data mining, big data analytics, and data science. It is of particular interest how this can be accomplished successfully, beyond the large "lighthouse projects" in industry and research but in small and medium-sized projects in science and in the private sector. All publications are based on two independent research projects: (1) Semantic Similarity Analysis in the Literature Research Process: This section presents the development, demonstration and benchmarking of a novel tool for semantic literature research based on Latent Semantic Indexing (LSI). The "Tool for Semantic Indexing and Similarity Queries" (TSISQ) enables scientists, regardless of their field of research, to quickly and easily identify semantically similar research papers. In addition, the structure and architecture of the system are presented, hints for its practical application are given, and the efficiency and quality improvements that can be achieved through the use of TSISQ in the literature research process are pointed out. (2) Decision Support for the automotive industry: This section describes the results and findings of a cooperation project with a large German car manufacturer, in which a comprehensive decision support system was designed and implemented. The most important core functionality of this system is the forecast of market and residual values for used vehicles using Artificial Neural Networks. In addition to the presentation of the findings in the field of long-term forecasts, our results regarding internal (influenceable by the manufacturer) and external (macroeconomic) influencing factors on vehicle residual values are shown and critically discussed.

Cite this

Download
@phdthesis{6c84dcadb3fc480bb7e749eaff01f3cc,
title = "Data Mining und Big Data Analytics: semantische Suche, Prognose und Entscheidungsunterst{\"u}tzung mit k{\"u}nstlichen neuronalen Netzen",
abstract = "Diese kumulative Dissertation ist eine Zusammenfassung und kritische Reflexion von insgesamt sechs wissenschaftlichen Publikationen, an denen ich als Autor beteiligt war. Das {\"u}bergeordnete Ziel dieser Arbeit ist die Analyse und Diskussion der Frage, wie abseits der gro{\ss}en „Leuchtturmprojekte“ in Industrie und Forschung auch in kleineren und mittleren Projekten in Wissenschaft und Privatwirtschaft mit Methoden und Technologien aus dem weiten Feld des Data Mining, Big Data Analytics und Data Science althergebrachte Arbeitsabl{\"a}ufe und Gesch{\"a}ftsprozesse erfolgreich optimiert werden k{\"o}nnen. Alle Ver{\"o}ffentlichungen basieren auf zwei voneinander unabh{\"a}ngigen Forschungsprojekten: (1) Semantische {\"A}hnlichkeitsanalyse im Literaturrechercheprozess: In diesem Abschnitt werden Entwicklung, Demonstration und Benchmark eines neuartigen Werkzeugs zur semantischen Literaturrecherche basierend auf Latent Semantic Indexing (LSI) vorgestellt. Das „Tool for Semantic Indexing and Similarity Queries“ (TSISQ) erm{\"o}glicht Wissenschaftlern, unabh{\"a}ngig von ihrem Forschungsgebiet, die schnelle und einfache Identifikation von semantisch {\"a}hnlichen Forschungsarbeiten. Es werden zudem Aufbau und Architektur des Systems pr{\"a}sentiert, Hinweise f{\"u}r dessen praktische Anwendung gegeben und die Effizienz- und Qualit{\"a}tsverbesserungen aufgezeigt, die durch den Einsatz von TSISQ im Literaturrechercheprozess erzielt werden k{\"o}nnen. (2) Entscheidungsunterst{\"u}tzung f{\"u}r die Automobilindustrie: Dieser Abschnitt beschreibt die Ergebnisse und Erkenntnisse eines Kooperationsprojektes mit einem gro{\ss}en deutschen Automobilhersteller, wobei ein umfangreiches Entscheidungs-unterst{\"u}tzungssystem (EUS) konzipiert und implementiert wurde. Die wichtigste Kernfunktionalit{\"a}t dieses Systems stellt dabei die bedarfsgerechte Prognose von Markt- und Restwerten f{\"u}r Gebrauchtfahrzeuge mit K{\"u}nstlichen Neuronalen Netzen (KNN) dar. Neben der Vorstellung der Erkenntnisse im Bereich der Langfristprognosen werden auch unsere Ergebnisse bzgl. interner (vom Hersteller beeinflussbarer) und externer (makro{\"o}konomischer) Einflussfaktoren auf Fahrzeugrestwerte pr{\"a}sentiert.",
keywords = "Semantisches Web, Management-Informationssystem, Informationsverhalten, Neuronale Netze, Big Data, Data Warehouse, Data Mining",
author = "Christoph Gleue",
year = "2019",
doi = "10.15488/4953",
language = "Deutsch",
school = "Gottfried Wilhelm Leibniz Universit{\"a}t Hannover",

}

Download

TY - BOOK

T1 - Data Mining und Big Data Analytics

T2 - semantische Suche, Prognose und Entscheidungsunterstützung mit künstlichen neuronalen Netzen

AU - Gleue, Christoph

PY - 2019

Y1 - 2019

N2 - Diese kumulative Dissertation ist eine Zusammenfassung und kritische Reflexion von insgesamt sechs wissenschaftlichen Publikationen, an denen ich als Autor beteiligt war. Das übergeordnete Ziel dieser Arbeit ist die Analyse und Diskussion der Frage, wie abseits der großen „Leuchtturmprojekte“ in Industrie und Forschung auch in kleineren und mittleren Projekten in Wissenschaft und Privatwirtschaft mit Methoden und Technologien aus dem weiten Feld des Data Mining, Big Data Analytics und Data Science althergebrachte Arbeitsabläufe und Geschäftsprozesse erfolgreich optimiert werden können. Alle Veröffentlichungen basieren auf zwei voneinander unabhängigen Forschungsprojekten: (1) Semantische Ähnlichkeitsanalyse im Literaturrechercheprozess: In diesem Abschnitt werden Entwicklung, Demonstration und Benchmark eines neuartigen Werkzeugs zur semantischen Literaturrecherche basierend auf Latent Semantic Indexing (LSI) vorgestellt. Das „Tool for Semantic Indexing and Similarity Queries“ (TSISQ) ermöglicht Wissenschaftlern, unabhängig von ihrem Forschungsgebiet, die schnelle und einfache Identifikation von semantisch ähnlichen Forschungsarbeiten. Es werden zudem Aufbau und Architektur des Systems präsentiert, Hinweise für dessen praktische Anwendung gegeben und die Effizienz- und Qualitätsverbesserungen aufgezeigt, die durch den Einsatz von TSISQ im Literaturrechercheprozess erzielt werden können. (2) Entscheidungsunterstützung für die Automobilindustrie: Dieser Abschnitt beschreibt die Ergebnisse und Erkenntnisse eines Kooperationsprojektes mit einem großen deutschen Automobilhersteller, wobei ein umfangreiches Entscheidungs-unterstützungssystem (EUS) konzipiert und implementiert wurde. Die wichtigste Kernfunktionalität dieses Systems stellt dabei die bedarfsgerechte Prognose von Markt- und Restwerten für Gebrauchtfahrzeuge mit Künstlichen Neuronalen Netzen (KNN) dar. Neben der Vorstellung der Erkenntnisse im Bereich der Langfristprognosen werden auch unsere Ergebnisse bzgl. interner (vom Hersteller beeinflussbarer) und externer (makroökonomischer) Einflussfaktoren auf Fahrzeugrestwerte präsentiert.

AB - Diese kumulative Dissertation ist eine Zusammenfassung und kritische Reflexion von insgesamt sechs wissenschaftlichen Publikationen, an denen ich als Autor beteiligt war. Das übergeordnete Ziel dieser Arbeit ist die Analyse und Diskussion der Frage, wie abseits der großen „Leuchtturmprojekte“ in Industrie und Forschung auch in kleineren und mittleren Projekten in Wissenschaft und Privatwirtschaft mit Methoden und Technologien aus dem weiten Feld des Data Mining, Big Data Analytics und Data Science althergebrachte Arbeitsabläufe und Geschäftsprozesse erfolgreich optimiert werden können. Alle Veröffentlichungen basieren auf zwei voneinander unabhängigen Forschungsprojekten: (1) Semantische Ähnlichkeitsanalyse im Literaturrechercheprozess: In diesem Abschnitt werden Entwicklung, Demonstration und Benchmark eines neuartigen Werkzeugs zur semantischen Literaturrecherche basierend auf Latent Semantic Indexing (LSI) vorgestellt. Das „Tool for Semantic Indexing and Similarity Queries“ (TSISQ) ermöglicht Wissenschaftlern, unabhängig von ihrem Forschungsgebiet, die schnelle und einfache Identifikation von semantisch ähnlichen Forschungsarbeiten. Es werden zudem Aufbau und Architektur des Systems präsentiert, Hinweise für dessen praktische Anwendung gegeben und die Effizienz- und Qualitätsverbesserungen aufgezeigt, die durch den Einsatz von TSISQ im Literaturrechercheprozess erzielt werden können. (2) Entscheidungsunterstützung für die Automobilindustrie: Dieser Abschnitt beschreibt die Ergebnisse und Erkenntnisse eines Kooperationsprojektes mit einem großen deutschen Automobilhersteller, wobei ein umfangreiches Entscheidungs-unterstützungssystem (EUS) konzipiert und implementiert wurde. Die wichtigste Kernfunktionalität dieses Systems stellt dabei die bedarfsgerechte Prognose von Markt- und Restwerten für Gebrauchtfahrzeuge mit Künstlichen Neuronalen Netzen (KNN) dar. Neben der Vorstellung der Erkenntnisse im Bereich der Langfristprognosen werden auch unsere Ergebnisse bzgl. interner (vom Hersteller beeinflussbarer) und externer (makroökonomischer) Einflussfaktoren auf Fahrzeugrestwerte präsentiert.

KW - Semantisches Web

KW - Management-Informationssystem

KW - Informationsverhalten

KW - Neuronale Netze

KW - Big Data

KW - Data Warehouse

KW - Data Mining

U2 - 10.15488/4953

DO - 10.15488/4953

M3 - Dissertation

CY - Hannover

ER -

By the same author(s)