News

Dienstag, 31. Januar 2012 | News

Pentaho stellt Big-Data-Projekt Open Source

(Link zum Artikel: http://www.it-republik.de/jaxenter/news/061636)
  • Teilen
  • kommentieren
  • empfehlen
  • Bookmark and Share

Pentaho hat im Zuge der Veröffentlichung des Datenintegrations-Werkzeugs Kettle 4.3 die enthaltenen Big-Data-Funktionalitäten Open Source zur Verfügung gestellt. Das gesamte Pentaho-Kettle-Projekt, das auch unter dem Namen "Pentaho Data Integration Community Edition" firmiert, soll zudem unter der Apache-2.0-Lizenz weiterentwickelt werden.

Die Big-Data-Funktionalitäten umfassen Dateninput und -output, Datenmanipulation und -Berichte unter Verwendung der Hadoop- und NoSQL-Datenspeicher Cassandra, Hadoop HDFS, Hadoop MapReduce, Hadapt, Hive, Hbase und MongoDB. Pentaho Kettle bietet darüber hinaus Funktionen zur Arbeit mit Hadoop-Jobs, Amazon EMR, Pentaho MapReduce, Hadoop Copy Files und Pig-Scripts. Mit dem Projekt ist es möglich, ETL-Transformationen außerhalb und innerhalb eines Hadoop-Clusters auszuführen.

Weiterführende Informationen stehen unter http://community.pentaho.com/BigData zur Verfügung. Zur ersten Annäherung empfehlen sich auch die verschiedenen Video-Tutorials auf der Projektseite.

(hs)

Anzeige

Kommentare


Folgende Links könnten Sie auch interessieren

zurück zum Seitenanfang