Big Data on Sascha Dittmann https://draft.sascha-dittmann.de/tags/big-data/ Recent content in Big Data on Sascha Dittmann Hugo de-de Mon, 22 Dec 2014 00:01:00 +0100 Apache HBase mit Microsoft Azure HDInsight (Teil 2) https://draft.sascha-dittmann.de/posts/apache-hbase-mit-microsoft-azure-hdinsight-teil-2/ Mon, 22 Dec 2014 00:01:00 +0100 https://draft.sascha-dittmann.de/posts/apache-hbase-mit-microsoft-azure-hdinsight-teil-2/ <p>Nachdem ich bei meinem letzten Blog-Post über <a href="https://draft.sascha-dittmann.de/posts/apache-hbase-mit-microsoft-azure-hdinsight/">Apache HBase mit Microsoft Azure HDInsight</a> eine grobe Einführung in das Thema gegeben habe, möchte ich diesmal auf ein paar Grundlegende Konzepte eingehen&hellip;</p> <h2 id="aufbau-der-hbase-tabellen">Aufbau der HBase-Tabellen</h2> <p>Bei HBase-Tabellen sind die Spalten ein zentrales Element:</p> <ul> <li>Eine Spalte kann eine oder mehrere Zellen enthalten</li> <li>Eine oder mehrere Spalten setzten sich zu einer Zeile zusammen</li> <li>Eine oder mehrere Zeilen bilden eine Tabelle</li> </ul> <p>Jede Zeile hat einen eindeutigen Schlüssel (Row Key), wodurch sie über die API angesprochen werden kann (Dies ist ähnlich dem Primärschlüssel in einem RDBMS).</p> Apache HBase mit Microsoft Azure HDInsight (Teil 1) https://draft.sascha-dittmann.de/posts/apache-hbase-mit-microsoft-azure-hdinsight/ Tue, 16 Dec 2014 00:01:00 +0100 https://draft.sascha-dittmann.de/posts/apache-hbase-mit-microsoft-azure-hdinsight/ <p>Durch ein aktuelles Projekt, beschäftige ich mich intensiver mit <a href="http://hbase.apache.org/">Apache HBase</a>, was eine hervorragenden Gelegenheit bietet meinem Blog mal wieder etwas Leben einzuhauchen&hellip;</p> <h2 id="was-ist-apache-hbase">Was ist Apache HBase</h2> <p>Wir leben in einem Zeitalter, indem wir alle über das Internet verbunden sind und die Erwartungshaltung haben, dass Informationen (die wir suchen) überall und sofort zur Verfügung stehen.</p> <p>Aus diesem Grund haben sich Unternehmen darauf spezialisiert, uns zielgerichtet mit Informationen beliefern zu können.</p> <p>Plattformen wie Hadoop bzw. HDInsight stellen dafür nötige Softwarebasis zur Verfügung.</p> Big Data am SQLSaturday #230 - Rheinland 2013 https://draft.sascha-dittmann.de/posts/big-data-am-sqlsaturday-230-rheinland-2013/ Mon, 10 Jun 2013 13:17:00 +0100 https://draft.sascha-dittmann.de/posts/big-data-am-sqlsaturday-230-rheinland-2013/ <p>Nach dem großen Erfolg des ersten SQL Saturday in Deutschland (September 2012), findet am 13. Juli 2013 erneut diese kostenfreie Community-Veranstaltung statt.</p> <p>Nach München geht es diesmal zur <a href="http://www.fh-bonn-rhein-sieg.de/">Hochschule Bonn-Rhein-Sieg</a> nach Sankt Augustin.</p> <h2 id="was-ist-ein-sql-saturday">Was ist ein SQL Saturday</h2> <p>Der SQLSaturday ist eine kostenlose 1-Tages Konferenz für SQL Server Professionals und alle, die mehr über den Microsoft SQL Server erfahren wollen.</p> <p>Ursprünglich aus den USA kommend, wurden mittlerweile unter der Schirmherrschaft der PASS Global weit über 150 SQLSaturdays auf fast allen Kontinenten veranstaltet.</p> Apache Hadoop für Windows Azure - MapReduce mit C# https://draft.sascha-dittmann.de/posts/apache-hadoop-fuer-windows-azure-mapreduce-mit-csharp/ Fri, 27 Apr 2012 08:33:00 +0100 https://draft.sascha-dittmann.de/posts/apache-hadoop-fuer-windows-azure-mapreduce-mit-csharp/ <p>Nachdem ich in meinem Blog Post &ldquo;<a href="https://draft.sascha-dittmann.de/posts/apache-hadoop-fuer-windows-azure-mapreduce-mit-javascript/">Apache Hadoop für Windows Azure - MapReduce mit JavaScript</a>&rdquo; einen <a href="http://de.wikipedia.org/wiki/MapReduce">MapReduce</a>-Algorithmus mit JavaScript vorgestellt hatte, möchte ich diesmal das Ganze mit Microsoft Bordmitteln umsetzen.</p> <p>Auch hier kommt wieder die Developer Preview der <a href="http://www.hadooponazure.com/">Apache Hadoop-based Services for Windows Azure</a> zum Einsatz.</p> <h2 id="hadoop-streaming">Hadoop Streaming</h2> <p>MapReduce-Algorithmen lassen sich, dank der Streaming-Funktionalität des Apache Hadoop Frameworks, in jeder Programmiersprache umsetzen, die auf dem zu Grunde liegenden Betriebssystem ausführbar ist.</p> <p>Hadoop Streaming wurde standardmäßig für Text-Datenströme ausgelegt, obwohl in der Version 0.21.0 auch Binärströme implementiert wurden.</p> Apache Hadoop für Windows Azure - MapReduce mit JavaScript https://draft.sascha-dittmann.de/posts/apache-hadoop-fuer-windows-azure-mapreduce-mit-javascript/ Tue, 14 Feb 2012 07:56:00 +0100 https://draft.sascha-dittmann.de/posts/apache-hadoop-fuer-windows-azure-mapreduce-mit-javascript/ <p>Meine Reise mit der Developer Preview des neuen Cloud Speicherdienstes &ldquo;<a href="http://www.hadooponazure.com/">Apache™ Hadoop™-based Services for Windows Azure</a>&rdquo; geht weiter:</p> <p>Diesmal stehen die Interaktive Konsole und ein einfacher <a href="http://de.wikipedia.org/wiki/MapReduce">MapReduce</a>-Algorithmus mit JavaScript auf dem Plan.</p> <p>Im letzten Blog Post &ldquo;<a href="https://draft.sascha-dittmann.de/posts/apache-hadoop-dienste-fuer-windows-azure-developer-preview/">Apache Hadoop Dienste für Windows Azure (Developer Preview)</a>&rdquo; hatte ich von der Erstellung eines eigenen Hadoop Clusters berichtet.<br> Nachdem dieses dann einsatzbereit war, wollte ich mich auf den Weg zu ein wenig Quellcode machen.</p> <p>Doch eine grundlegende Frage beschäftigte mich:</p> Apache Hadoop Dienste für Windows Azure (Developer Preview) https://draft.sascha-dittmann.de/posts/apache-hadoop-dienste-fuer-windows-azure-developer-preview/ Tue, 07 Feb 2012 07:26:00 +0100 https://draft.sascha-dittmann.de/posts/apache-hadoop-dienste-fuer-windows-azure-developer-preview/ <p>Eine weitere <a href="http://de.wikipedia.org/wiki/NoSQL">NoSQL</a> Implementierung für die Windows Azure Plattform kündigt sich an:</p> <p>Zum bisherigen Key-Value-Pair Speicher, dem <a href="https://draft.sascha-dittmann.de/posts/erste-schritte-mit-windows-azure-der-table-storage/">Windows Azure Table Storage</a>, wird in Zukunft ein weiterer Speicher für große Datenmengen (<a href="http://de.wikipedia.org/wiki/Big_Data">Big Data</a>, <a href="http://de.wikipedia.org/wiki/Petabyte">Petabyte</a>-Bereich) hinzukommen.</p> <p>Dieser Speicherdienst baut auf dem <a href="http://hadoop.apache.org">Apache™ Hadoop™</a> Framework auf.</p> <p>Diese Meldung erreichte mich Ende Letzten Jahres und erweckte mein Interesse.</p> <p>Doch was ist eigentlich Hadoop?</p> <h2 id="apache-hadoop">Apache™ Hadoop™</h2> <p><a href="http://hadoop.apache.org">Apache™ Hadoop™</a> ist ein freies, in Java geschriebenes Framework für skalierbare, verteilt arbeitende Software. Es basiert auf dem bekannten <a href="http://de.wikipedia.org/wiki/MapReduce">MapReduce</a>-Algorithmus von Google Inc., sowie auf Vorschlägen des <a href="http://de.wikipedia.org/wiki/Google_File_System">Google-Dateisystems</a>. Hadoop wurde ursprünglich durch den Lucene-Erfinder <em>Doug Cutting</em> initiiert.</p>