Big Data und ETL sind Familie



In diesem Blog werden wir die Beziehung zwischen Big Data und ETL sehen. Talend ist das Tool, das häufig für die Verbindung von Big Data und ETL verwendet wird.

Big Data wurde in letzter Zeit wirklich genug gehypt, so wie die Fachleute, die mit dem Wissen darüber kommen. Es ist nicht immer einfach, Ihre Grundkenntnisse nicht zu nutzen und vom Nullpunkt aus zu beginnen. Die Verwendung Ihrer quadratischen Schnitte und die Anpassung an die Türsteher werden jedoch Wunder für Sie bewirken. Bingo, wir sprechen über das Erlernen von Big Data mithilfe der ETL-Technologie.





ETL-Entwickler, die Datentransformations-Workflows entwerfen, können sehr gut Tools verwenden und die Workflows in Hadoop-Jobs übersetzen. Hadoop ist ein Open-Source-Framework, das häufig zur Verarbeitung von BigData mit dem MapReduce-Programm verwendet wird (eine weitere Open-Source-Technologie, mit der große Datenmengen in Hadoop verarbeitet werden können). In den meisten Fällen kann es schwierig sein, qualifizierte Ressourcen in Big Data zu finden.

Sortierung in C ++ zusammenführen

Wenn ein ETL-Entwickler die IP-Adressen finden muss, die mehr als eine Million Anfragen auf der Website der Bank gestellt haben, muss er einen MapReduce-Job schreiben, der die in Hadoop gespeicherten Weblogdaten verarbeitet . Mit dem Fortschritt in der ETL-Technologie kann ein Jobentwickler jedoch die Standard-ETL-Entwurfstools verwenden, um einen ETL-Fluss zu erstellen, der Daten aus mehreren Quellen in Hadoop (Dateien, Hive, HBase) lesen, zusammenfügen, aggregieren, filtern und transformieren kann um eine Antwort auf die Abfrage zu IP-Adressen zu finden.



Talend ist das einzige Tool für die grafische Benutzeroberfläche, das in der Lage ist, einen ETL-Job in einen MapReduce-Job zu „übersetzen“. Auf diese Weise wird der Talend ETL-Job als MapReduce-Job auf Hadoop ausgeführt und die Big-Data-Arbeit in wenigen Minuten erledigt. Dies ist eine Schlüsselinnovation, die dazu beiträgt, Eintrittsbarrieren in die Big Data-Technologie abzubauen, und es ETL-Jobentwicklern (Anfängern und Fortgeschrittenen) ermöglicht, das Auslagern von Data Warehouse in größerem Umfang durchzuführen.

Das Leben in Big Data City ist mit Talend viel einfacher

Eine grafische Abstraktionsschicht über Hadoop-Anwendungen - dies erleichtert das Leben in der Big Data-Welt erheblich.



Was Talend zu sagen hat: „Im Einklang mit unserer Geschichte als Innovator und Marktführer bei der Integration von Open Source-Daten ist Talend der erste Anbieter, der eine reine Open Source-Lösung anbietet, die dies ermöglicht Big Data Integration . Talend Open Studio für Big Data bietet eine benutzerfreundliche grafische Entwicklungsumgebung für leistungsstarke Hadoop-Anwendungen Big Data Management zugänglich für mehr Unternehmen und mehr Entwickler als je zuvor.

Mit seinem Eclipse-basierten grafischen Arbeitsbereich ermöglicht Talend Open Studio für Big Data Entwicklern und Datenwissenschaftlern, Hadoop-Lade- und Verarbeitungstechnologien wie HDFS, HBase, Hive und Pig zu nutzen, ohne schreiben zu müssen Hadoop-Anwendung Code. Durch einfaches Auswählen grafischer Komponenten aus einer Palette, Anordnen und Konfigurieren können Sie Hadoop-Jobs erstellen. Beispielsweise:

  1. Laden Sie Daten in HDFS (Hadoop Distributed File System)
  2. Verwenden Hadoop Schwein Daten in HDFS transformieren
  3. Laden Sie Daten in eine Hadoop Hive basiertes Data Warehouse
  4. Führen Sie ELT-Aggregationen (Extrahieren, Laden, Transformieren) in Hive durch
  5. Hebelwirkung Sqoop relationale Datenbanken und Hadoop zu integrieren

Hadoop-Anwendungen, nahtlos innerhalb von Minuten mit Talend integriert.

wie man hover in css benutzt

Damit Hadoop-Anwendungen für Ihr Unternehmen wirklich zugänglich sind, müssen sie reibungslos in Ihren gesamten Datenfluss integriert werden. Talend Open Studio für Big Data ist das ideale Tool zur Integration von Hadoop-Anwendungen in Ihre breitere Datenarchitektur. Talend bietet mehr integrierte Connector-Komponenten als jede andere verfügbare Datenintegrationslösung mit mehr als 800 Anschlüsse Dies erleichtert das Lesen oder Schreiben in wichtige Dateiformate, Datenbanken oder verpackte Unternehmensanwendungen. In Talend Open Studio für Big Data können Sie beispielsweise konfigurierbare Drag & Drop-Komponenten verwenden, um Datenintegrationsflüsse zu erstellen, mit denen Daten aus begrenzten Protokolldateien in Hadoop Hive verschoben, Vorgänge in Hive ausgeführt und Daten aus Hive in eine MySQL-Datenbank extrahiert werden (oder Oracle, Sybase, SQL Server usw.).

Möchten Sie sehen, wie einfach es sein kann, mit hochmodernen Hadoop-Anwendungen zu arbeiten?

Kein Warten - Talend Open Studio für Big Data ist eine Open Source-Software, die kostenlos heruntergeladen und unter einer Apache-Lizenz verwendet werden kann.

In der Stadt reden

Talend war einVisionär im Magic Quadrant für DatenintegrationstoolsSeit 2009. Vor kurzem haben sie sich auch als Pioniere im Bereich Datenqualität und MDM sowie als Zutaten für die Zubereitung eines fantastischen Big-Data-Gerichts herausgestellt.

Sie behaupten: „Die Integration von Big Data erhöht die Leistung und Skalierbarkeit in Ihrem Unternehmen um 45 Prozent.“

Nur mit Talend 5.5 (und höher) können Entwickler leistungsstarken Hadoop-Code generieren, ohne ein Experte für MapReduce oder Pig sein zu müssen.

Vor einigen Monaten hieß es in einem Artikel von Talend: „Die Einführung von Hadoop nimmt rasant zu und große und kleine Unternehmen haben Schwierigkeiten, genügend sachkundige Hadoop-Entwickler zu finden, um diese wachsende Nachfrage zu befriedigen.“ Nur mit Talend 5.5 kann jeder Datenintegrationsentwickler eine visuelle Entwicklungsumgebung verwenden, um nativen, leistungsstarken und hoch skalierbaren Hadoop-Code zu generieren. Dadurch wird ein großer Pool an Entwicklungsressourcen freigeschaltet, die jetzt zu Big-Data-Projekten beitragen können. Darüber hinaus bleibt Talend auf dem neuesten Stand der Neuentwicklungen in Hadoop, mit denen Big-Data-Analyseprojekte Kundeninteraktionen in Echtzeit ermöglichen.

Talend for Big Data kann zum Verständnis von Unternehmen beitragen, indem Datensätze aus heterogenen Quellsystemen wie Drittanbietern, APIs und Feeds für soziale Netzwerke gesammelt und diese Daten in ein visuelles Bild der End-to-End-Customer-Journey umgewandelt werden.

Sei es in der Bankenbranche, in der Pharmaindustrie, im E-Commerce oder in der Versicherungsbranche - Talend kann Daten in jeder Größenordnung mit einer einfachen Mischung integrieren. Hadoop erweist sich als die modernste Technologie, um die Anforderungen von Gegenwart und Zukunft zu erfüllen.

Anwendungsfälle auf der ganzen Welt

Von der Marketingkampagne über den Kundenservice in der Bankenbranche bis hin zur Aufdeckung von Betrug ist Big Data allgegenwärtig.

PHP konvertiert Objekt in Array

Mit mehr als 800 Konnektoren allein in ihrer Open-Source-Edition behauptet es, die größte am weitesten unterstützte Plattform zu sein, um eine Verbindung zu irgendetwas herzustellen und alles abzurufen.

Angesichts des sich ändernden Musters und der Ausrichtung auf NoSQL, Open Source, Hadoop wäre die Wahl des Lernens von Big Data und ETL-Stil mit Talend die logischste Entscheidung für jeden, der sich mit Daten in irgendeiner Form und zu jeder Zeit befasst.

Zusammenfassend sind ETL-Tools alles andere als passé. Sie sind von zentraler Bedeutung für das Big Data-Ökosystem und spielen eine entscheidende Rolle bei der Ermöglichung der Datenanalyse.

Aus diesem Grund sagt Talend: 'Null bis Big Data ohne Codierung in weniger als 10 Minuten'.

Hast du eine Frage an uns? Erwähnen Sie sie im Kommentarbereich und wir werden uns bei Ihnen melden.

Zusammenhängende Posts: