KNIME, der „Konstanz Information Miner“, ist eine freie Software für die interaktive Datenanalyse. Die Low-Code-Entwicklungsplattform KNIME ermöglicht durch das modulare knotenbasierte Konzept die Integration zahlreicher Verfahren des maschinellen Lernens und des Data-Mining. Die graphische Benutzeroberfläche ermöglicht das einfache und schnelle Aneinandersetzen von Modulen für die Datenvorverarbeitung (ETL: Extraction, Transformation, Loading), der Modellierung und Analyse und der Visualisierung.

KNIME

KNIME - The Open Analytics Platform

Beispiel Arbeitsablauf
Basisdaten

Hauptentwickler KNIME AG
Erscheinungsjahr Januar 2004
Aktuelle Version 5.3[1]
(10. Juli 2024)
Betriebssystem Linux, Macintosh, Windows
Programmier­sprache Java
Kategorie Datenanalyse
Lizenz GPL (Freie Software)
deutschsprachig nein
knime.org

Geschichte

Bearbeiten

Die Entwicklung von KNIME begann im Frühjahr 2004 eine Gruppe von Software-Entwicklern unter der Leitung von Michael Berthold an der Universität Konstanz mit der Konzeption der Plattform. Der Schwerpunkt der Entwicklung lag von vorneherein auf einer professionellen Software-Architektur, die skalierbar und hochgradig modular sein musste. Mitte 2006 erschien die erste öffentliche Version als Konstanz Information Miner.[2] Seit Juni 2008 ermöglicht eine in Zürich ansässige Firma (KNIME AG) auch die Bereitstellung von professioneller technischer Unterstützung und Beratungsdiensten für die KNIME-Plattform. So stieg 2018 der Eigenkapitalgeber Invus mit ein.[3]

Anwendung

Bearbeiten

KNIME ist seit etwa 2006 im Bereich der pharmazeutischen Forschung im Einsatz.[4] KNIME wird aber auch in anderen Bereichen wie Kundenpflege (CRM), Business Intelligence und Finanzdatenanalyse eingesetzt.[5]

Technologie

Bearbeiten

KNIME wird in Java unter Verwendung des Eclipse RCP Frameworks entwickelt und bereitgestellt. Module anderer können leicht als zusätzliche Plugins integriert werden. KNIMEs Core-Version enthält einige hundert Module für die Datenintegration (File I/O, Datenbankoperatoren mit Unterstützung aller gängigen Datenbanken), Datentransformationen (Filter, Konverter, Combiner) sowie die gebräuchlichsten Methoden der Datenanalyse und -visualisierung. Weitere Eigenschaften von KNIME:

  • KNIMEs Core-Architektur erlaubt die Verarbeitung von großen Datenmengen, die nur durch den vorhandenen Festplattenplatz eingeschränkt sind (die meisten anderen quelloffenen Datenanalyse-Projekte arbeiten arbeitsspeicherbasiert und limitieren dadurch die verarbeitbaren Datenmengen erheblich). Beispiele sind die Analyse von 300 Millionen Adressdaten, 20 Millionen Zellbildern und 10 Millionen molekularen Strukturen.
  • Zusätzliche Plugins ermöglichen die Einbindung von Methoden für Text Mining[6] und Image Mining sowie die Zeitserienanalyse.
  • Einbindungen für zahlreiche andere Open-Source-Verfahren existieren, u. a. die Verfahren von WEKA, das statistische R-Projekt sowie LibSVM[2], JFreeChart, CDK[7] und ImageJ.[8]

Rezeption

Bearbeiten

KNIME schneidet in Vergleichen von quelloffenen Data-Mining-Systemen überdurchschnittlich gut ab und hebt sich insbesondere durch seine Benutzerfreundlichkeit heraus.[9]

Literatur

Bearbeiten
Bearbeiten

Einzelnachweise

Bearbeiten
  1. www.knime.com. (abgerufen am 19. September 2024).
  2. a b Alexander Fillbrunn, Martin Horn: Maschinelles Lernen mit Knime in der Praxis. In: Linux-Magazin 10/2018. Abgerufen am 22. April 2023 (deutsch).
  3. Szilvana Spett: Amerikanischer Eigenkapitalgeber investiert in KNIME. S-GE, 30. Januar 2018, abgerufen am 22. April 2023.
  4. Abhishek Tiwaria and Arvind K.T. Sekhar: Workflow based framework for life science informatics, Computational Biology and Chemistry, Volume 31, Issues 5–6, Pages 305–319, doi:10.1016/j.compbiolchem.2007.08.009, Elsevier, October 2007.
  5. Datenbank-Mosaik Data Mining oder die Kunst, sich aus Millionen Datensätzen ein Bild zu machen, c’t 20/2006, S. 164ff, Heise Verlag.
  6. Ricardo A. Dorr, Juan J. Casal, Roxana Toriano: Text Mining of Biomedical Articles Using the Konstanz Information Miner (KNIME) Platform: Hemolytic Uremic Syndrome as a Case Study. In: Healthcare Informatics Research. Band 28, Nr. 3, 2022, S. 276–283, doi:10.4258/hir.2022.28.3.276.
  7. Michael R. Berthold, Nicolas Cebron, Fabian Dill, Thomas R. Gabriel, Tobias Kötter, Thorsten Meinl, Peter Ohl, Kilian Thiel, Bernd Wiswedel: KNIME - the Konstanz information miner: version 2.0 and beyond. In: ACM SIGKDD Explorations Newsletter. Band 11, Nr. 1, 2009, ISSN 1931-0145, S. 26–31, doi:10.1145/1656274.1656280.
  8. Christian Dietz, Curtis T. Rueden, Stefan Helfrich, Ellen T. A. Dobson, Martin Horn, Jan Eglinger, Edward L. Evans, Dalton T. McLean, Tatiana Novitskaya, William A. Ricke, Nathan M. Sherer, Andries Zijlstra, Michael R. Berthold, Kevin W. Eliceiri: Integration of the ImageJ Ecosystem in KNIME Analytics Platform. In: Frontiers in Computer Science. Band 2, 2020, ISSN 2624-9898, doi:10.3389/fcomp.2020.00008/full.
  9. Xiaojun Chen, Yunming Ye, Graham Williams and Xiaofei Xu: A Survey of Open Source Data Mining Systems, Lecture Notes in Computer Science, vol. 4819, pp. 3–14, doi:10.1007/978-3-540-77018-3_2, Springer-Verlag, 2009.