Der Open Source Business Intelligence Day 2010 ist nun auch schon eine Woche vorbei. Zeit, ein kleines Fazit zu ziehen.
Die Lokation, das Hambacher Schloss, war sehr nett. Als Veranstaltungsort für Tagungen ist es durchaus zu empfehlen. Leider spielte das Wetter nicht so mit, so dass der Zuweg sehr vereist und glatt war. Der Regen und grauer Himmel taten ihr Übriges.
Die Vorträge waren allesamt gelungen. Für micht am interessantesten waren vor allem die Vorträge zu den ETL Lösungen von Talend und das Reporting von Jaspersoft. Den Produkten sehen zwar im Vergleich zu den kommerziellen Anbietern wie Informatica noch nicht so "rund" aus, aber die scheinen eine vergleichbare Leistungsfähigkeit zu besitzen. Vom Gefühl her würde ich behaupten, Informatica hat mehr spezielle Transformationslogiken eingebaut, aber bei Talend kann man daher komplett in den Flow eingreifen und zur Not eigene Transformationslogiken in Java und Perl programmieren. Es wäre zu untersuchen, wie performant Talend im Vergleich zu den etablierten Anbietern wie Informatica, DataStage oder Ab Initio ist. Das wäre mal ein Projekt, was mich interessieren würde. Einige ausgewählte Transformationslogiken und dazu Massendaten von mehreren hundert Millionen Datensätzen...
Man sieht Talend (und auch Pentaho, was ich nur ganz kurz sehen konnte) noch ihren Ursprung an (Talend basiert auch auf dem Eclipse Framework) und so sieht man überall den Einfluss von Java. Für Java Entwickler könnte es genau deshalb sehr interessant sein. Informatica scheint eine besser integrierte Lösung zu sein, wo alles unter einer einheitlicheren Oberfläche vorhanden ist. Nun kenne ich Informatica ziemlich gut und bei Talend muß ich mich auf die kurze Demo beschränken, aber beide scheinen gleich mächtig zu sein. Und wenn man Informatica kann, dann kann man glaub ich auch schnell mit Talend und Pentaho arbeiten.
Auch die Reporting Lösung von Talend und Jaspersoft sehen recht vielversprechend aus, wobei ich auch hier das Gefühl habe, mit Cognos schneller komplexe Reports hinstellen zu können. Da muß bei den Open Source Alternativen noch viel von Hand und manuell gemacht werden.
Aber am spannendsten fand ich die Vorträge zu Rapidminer bzw. der neuen Storage Engine von [url=http://www.ingres.com[/url] Ingres, VectorWise. Vereinfacht gesprochen, werden dabei die Daten nicht zeilenorientiert gespeichert, sondern nach Spalten. Durch Ausnutzung von Komprimierung und diversen Fähigkeiten moderner Prozessoren kann man so extrem schnelle Auswertungen auf Massendaten durchführen. Bei solchen Analysen aggregiert man typischerweise die Daten stark und arbeitet mit Summen, Maximum, Durchschnitt, etc. Und genau hierbei haben Spaltenorientierte Storage Engines einen Vorteil und können diese Analysen viel schneller liefern (man sprach von einem Faktor 50). Leider scheint das Ganze aber für normale transaktionsorientierte Prozesse nicht geeignet zu sein. Das ist auf jeden Fall ein spannendes Thema, das sich dort entwickelt.
Im Großen und Ganzen kann die Veranstaltung als gelungen bezeichnet werden. Ich habe viel gelernt. Auch, dass OpenSource nicht kostenlos bedeutet. Aber von irgendwas wollen die Menschen, die hinter diesen Firmen stehen halt auch leben.
Entries tagged as rapid-i
Related tags
Thursday, 16. December 2010
OSBI 2010: Fazit
Wednesday, 24. November 2010
Open Source Business Intelligence Day 2010
Am 8.12 findet der disjährige Open Source Business Intelligence Day statt. Das wird von meinem Arbeitgeber organisiert und da werde ich diesmal auch dabei sein. Es verspricht ein spannendes Programm zu werden. Mich interessiert vor allem, wie sich die OpenSource Lösungen im Vergleich zu den etablierten, kommerziellen Lösungen ausnehmen, die ich bisher hauptsächlich kenne. Ich bin gespannt.
(Page 1 of 1, totaling 2 entries)
