Web Mining und Web Usage Mining mit dem RapidMiner

Seminarinformationen

Seminar-Ziel

In dieser Schulung erhalten die Teilnehmer eine Einführung in Web Mining und Web Analytics. Hier werden Themen wie Webcrawler, automatisierte Webseitenklassifikation und -clustering und die Informationsextraktion aus Webseiten abgedeckt. Den Teilnehmern wird aufgezeigt, wie RapidMiner mit einem Webcrawler verbunden werden kann, wie Webseiten automatisch gesammelt und verarbeitet werden können und die automatische Erzeugung von Klassikatoren für Webseiten oder Blogeinträgen. Zudem wird in dieser Schulung aufgezeigt, wie Informationen aus Webseiten automatisch via XPath oder regulären Ausdrücken herausgezogen werden können. Dew weiteren erfolgt eine Domonstration Webservices wie die Amazon API (z.B. zur Extraktion von Produktinformationen) oder die Google API (z.B. zur Extraktion von geographischen Informationen) in den Analyseprozess integriert werden können. Eine Vielzahl von praktischen Beispielen für verschiedenste Bereiche, wie adaptive personalisierte Newsfilter, Sentiment Classifications und die inhaltsbasierte Klassifikation von Webtexten, zeigen den Teilnehmer, wie das in der Schulung gewonnene Wissen eine eigene Web Mining Problematik angewendet werden kann.

Teilnehmer Zielgruppe

Administratoren, Analysten, Anwender, Entscheidungsträger und Entwickler

Kurs Voraussetzungen

Grundkenntnisse in der Data Mining sowie Grundkenntnisse der Mathematik sind von Vorteil

Seminardauer

  • 2 Tage
  • 09:00 Uhr bis 17:00 Uhr

Schulungsunterlagen

  • nach Absprache

Seminar-Inhalt / Agenda

  1. Data Minings mit RapidMiner - Grundlagen
  2. Data Mining für Texte oder Web - Eine Einführung
  3. Einen Webcrawlers mit RapidMiner verknüpfen

Textdaten vorverarbeiten

  1. Tokenizing
  2. Tagging
  3. Term Frequencies
  4. Document Frequencies
  5. TFIDF

Maschinelles Lernen für Text Mining

  1. Naive Bayes und Support Vector Machines

Automatische Klassifikation von Texten

  1. Klassifizierung von Webseiten, Blogs oder Diskussionsbeiträgen abhängig von ihrem Inhalt, von Benutzerpräferenzen oder Stimmungen (Sentiment Classification)

Text Clustering

  1. Automatische Segmentierung von Webseiten oder anderen Texten in Gruppen ähnlicher Dokumente

 

  1. Informationsextraktion mittels XPath und regulären Ausdrücken
  2. Integration der Amazon API und der Google API
  3. Analyse von Web Logs und Web Log Mining
  4. Grundideen des Aufbaus eines Empfehlungssystems für Webanwendungen und Webshops

 

In der Schulung werden von den Teilnehmern ausführliche praktische Übungen auf unterschiedlichen Datensätzen durchgeführt!

Weitere Schulungen zu Thema Rapid-I

DataMining Pro - Datenvorverarbeitung, Komplexe Data Mining Prozesse, automatisierte Optimierung

In dieser Schulung wird die automatische Optimierung von Parametern, die Optimierung der Prozessstruktur selbst, erweiterte Möglichkeiten der gesteuerten Merkmalsauswahl und Merkmalskonstruktion, die Sammlung von Prozessstatistiken, die Steuerung von Ein- und Ausgaben, die Benutzung von Makros, kostensensitives Lernen und andere Meta-Lernverfahren, die Änderungen des Prediction Threshold...Merken
 

Sentiment Analyse, Opinion Mining und automatische Marktforschung

 
 

Anfragedetails

Seminartyp wählen:




Preis pro Person
1.795,00 € netto
2.136,05 € inkl. 19% MwSt
Verpflegung zzgl.
Seminarunterlagen zzgl.
Standort wählen:

Termin wählen:






auf den Merkzettel