Fortgeschrittene Vorverarbeitung von Daten für das Data Mining mit RapidMiner

Seminarinformationen

Seminar-Ziel

Diese Schulung ist eine Einführung in die Grundlagen der Datenvorverarbeitung sowie in die Vorverarbeitung mit der Data Mining Software RapidMiner. In der Schulung werden folgende Themen behandelt: Die Entdeckung und Entfernung von Ausreißern (Outlier Detection), die Datenbereinigung (Data Cleansing), die Auswahl guter Merkmale (Feature Selection), die Konstruktion neuer, latenter Variablen (Feature Construction und Extraction) und zahlreiche weitere automatisierte Methoden zu Optimierung der Data Mining Ergebnisse. Durch die Vielzahl der praktischen Übungen können die Teilnehmer ihr erworbenes Wissen auf eigene Data Mining Probleme anwenden und diese effizient und erfolgreich lösen.

Teilnehmer Zielgruppe

Administratoren, Analysten, Anwender und Entwickler

Kurs Voraussetzungen

RapidMiner und Data Mining-Grundkenntnisse.

Seminardauer

  • 2 Tage
  • 09:00 Uhr bis 17:00 Uhr

Schulungsunterlagen

  • nach Absprache

Seminar-Inhalt / Agenda

  1. Einführung in die wesentlichen Vorverarbeitungsmethoden wie Normalisierungen, Standardisierungen, Joins etc.
  2. Ausreißer entdecken und entfernen
  3. Fehlende Werte ersetzen
  4. Methoden der Dimensionsreduktion und der Merkmalsauswahl, insbesondere Genetische Algorithmen und Greedy-Heuristiken
  5. Merkmalsgewichtung und gewichtsbasierte Selektion
  6. Evolutionäre Merkmalskonstruktion
  7. Validierung von Vorverarbeitung und von Preprocessin-Modellen.
  8. Sammlung von Statistiken über den Erfolg der Vorverarbeitung

Selbstverständlich werden in der Schulung ausführliche Übungen auf verschiedenen Datensätzen für alle Themenbereiche durchgeführt.

Weitere Schulungen zu Thema Rapid-I

Einführung in das Data Mining und die prädiktive Analyse mit RapidMiner

In dieser Schulung erhalten die Teilnehmer einen kompakte Einblick in die Basics des Data Mining und in die Anwendung RapidMiner....Merken
 

DataMining Pro - Datenvorverarbeitung, Komplexe Data Mining Prozesse, automatisierte Optimierung

In dieser Schulung wird die automatische Optimierung von Parametern, die Optimierung der Prozessstruktur selbst, erweiterte Möglichkeiten der gesteuerten Merkmalsauswahl und Merkmalskonstruktion, die Sammlung von Prozessstatistiken, die Steuerung von Ein- und Ausgaben, die Benutzung von Makros, kostensensitives Lernen und andere Meta-Lernverfahren, die Änderungen des Prediction Threshold...Merken
 
 

Anfragedetails

Seminartyp wählen:




Preis pro Person
1.795,00 € netto
2.136,05 € inkl. 19% MwSt
Verpflegung zzgl.
Seminarunterlagen zzgl.
Standort wählen:

Termin wählen:






auf den Merkzettel