Data Mining und Data Science mit MongoDB und Apache Spark
Classroom Schulung | Deutsch | Anspruch
Schulungsdauer: 2 Tage
Ziele
In diesem Kurs lernen Sie MongoDB als Datenspeicher unter Spark zu betreiben, typische Data Mining und Data Science Workflows umzusetzen und dabei die Perfomancevorteile von MongoDB zu nutzen.
Zielgruppe
- Data Mining Spezialisten
- Data Science Spezialisten
Voraussetzungen
- Datenbank-Grundwissen
- Datenanalyse-Grundwissen
- Kenntnisse im Bereich Data Mining und/oder Data Science
- Kenntnisse der Programmiersprachen Scala, Python, Java, R
Agenda
Grundlagen
- Spark
- MongoDB
- MongoDB Spark Connector
Hands-On: Testumgebung
- MongoDB Installation
- Spark Installation
- Spark Connector
- Installation
- Konfiguration
MongoDB Performance und Indexierung
- Erstellen von Indexen
- Arten von Indexen
- Performanceoptimierung durch Indexierung
- Aggregation Framework und Aggregation Pipelines
Spark Connector und Scala
- In MongoDB schreiben
- Von MongoDB lesen
- Filter und Aggregationen
- Datasets und SQL
- Spark Streaming
Spark Connector und Java
- In MongoDB schreiben
- Von MongoDB lesen
- Aggregationen
- Datasets und SQL
Spark Connector und Python
- In MongoDB schreiben
- Von MongoDB lesen
- Aggregationen
- Filter und SQL
Spark Connector und R
- In MongoDB schreiben
- Von MongoDB lesen
- Aggregationen
- Filter und SQL
Über den Dozenten
Administrator
Ziele
In diesem Kurs lernen Sie MongoDB als Datenspeicher unter Spark zu betreiben, typische Data Mining und Data Science Workflows umzusetzen und dabei die Perfomancevorteile von MongoDB zu nutzen.
Zielgruppe
- Data Mining Spezialisten
- Data Science Spezialisten
Voraussetzungen
- Datenbank-Grundwissen
- Datenanalyse-Grundwissen
- Kenntnisse im Bereich Data Mining und/oder Data Science
- Kenntnisse der Programmiersprachen Scala, Python, Java, R
Agenda
Grundlagen
- Spark
- MongoDB
- MongoDB Spark Connector
Hands-On: Testumgebung
- MongoDB Installation
- Spark Installation
- Spark Connector
- Installation
- Konfiguration
MongoDB Performance und Indexierung
- Erstellen von Indexen
- Arten von Indexen
- Performanceoptimierung durch Indexierung
- Aggregation Framework und Aggregation Pipelines
Spark Connector und Scala
- In MongoDB schreiben
- Von MongoDB lesen
- Filter und Aggregationen
- Datasets und SQL
- Spark Streaming
Spark Connector und Java
- In MongoDB schreiben
- Von MongoDB lesen
- Aggregationen
- Datasets und SQL
Spark Connector und Python
- In MongoDB schreiben
- Von MongoDB lesen
- Aggregationen
- Filter und SQL
Spark Connector und R
- In MongoDB schreiben
- Von MongoDB lesen
- Aggregationen
- Filter und SQL