In dieser Schulung erhalten die Teilnehmer eine Einführung in Web Mining und Web Analytics. Hier werden Themen wie Webcrawler, automatisierte Webseitenklassifikation und -clustering und die Informationsextraktion aus Webseiten abgedeckt. Den Teilnehmern wird aufgezeigt, wie RapidMiner mit einem Webcrawler verbunden werden kann, wie Webseiten automatisch gesammelt und verarbeitet werden können und die automatische Erzeugung von Klassikatoren für Webseiten oder Blogeinträgen. Zudem wird in dieser Schulung aufgezeigt, wie Informationen aus Webseiten automatisch via XPath oder regulären Ausdrücken herausgezogen werden können. Dew weiteren erfolgt eine Domonstration Webservices wie die Amazon API (z.B. zur Extraktion von Produktinformationen) oder die Google API (z.B. zur Extraktion von geographischen Informationen) in den Analyseprozess integriert werden können. Eine Vielzahl von praktischen Beispielen für verschiedenste Bereiche, wie adaptive personalisierte Newsfilter, Sentiment Classifications und die inhaltsbasierte Klassifikation von Webtexten, zeigen den Teilnehmer, wie das in der Schulung gewonnene Wissen eine eigene Web Mining Problematik angewendet werden kann.
Administratoren, Analysten, Anwender, Entscheidungsträger und Entwickler
Grundkenntnisse in der Data Mining sowie Grundkenntnisse der Mathematik sind von Vorteil
Textdaten vorverarbeiten
Maschinelles Lernen für Text Mining
Automatische Klassifikation von Texten
Text Clustering
In der Schulung werden von den Teilnehmern ausführliche praktische Übungen auf unterschiedlichen Datensätzen durchgeführt!