Text Analytics

Für tiefere Einsichten in kundengenerierte Informationen

Das Datenvolumen wird in den nächsten Jahren weiter exorbitant ansteigen. Das liegt neben neuer und besserer Technik auch an sozialen Netzwerken und nutzergenerierten Daten. In vielen Fällen werden zwar soziale Netzwerke oder Bewertungssysteme in Shops eingesetzt, doch nur in wenigen Szenarien wird aus diesen Daten auch echter Mehrwert geschaffen.

Das ändert sich im Big-Data-Zeitalter und mit Text Analytics. Dank ausgereifter Software ist es heute möglich, unstrukturierte Dateien, die Fließtext enthalten, zeit- und kostengünstig auszuwerten. Dank moderner Methoden können sogar Vorhersagen für die Zukunft erstellt werden.

Mögliche Einsatzbereiche können sein:

  • Marktforschung
  • Wettbewerbsanalyse
  • Sicherheit und Verwaltung
  • Betrugserkennung
  • Wissenschaft

Beispiel: Kundenbindung im E-Commerce

Frau K. betreibt einen mittelständischen Online Shop für Stoffe und Seiden (S&S). Sie beschäftigt rund 10 Mitarbeiter: Vertrieb, Verwaltung/Support, einen Systemadministrator und eine Abteilung für Lagerhaltung. Ihre IT-Entwicklungs-Dienstleistungen bezieht sie von einer externen Firma, die neben Software-Entwicklung auch eine Business Analytics-Abteilung hat.

S&S kann sich dank exklusiver Stoffe und Seiden am Markt halten. Frau K. möchte nun herausfinden, warum viele ihrer Kunden nur einmalig bei ihr einkaufen und wie sie Kunden besser binden kann. Neben dem Shop wird auf der Website auch ein Forum zum Thema Stoffe, Nähen etc. betrieben. Es gibt zudem eine Facebook-Seite, auf der hauptsächlich Produkte und Sonderaktionen beworben werden. Des Weiteren werden im CMS ihres Shops Artikelbewertungen gespeichert. Die Shop Bewertung läuft über ein anerkanntes Gütesiegel, und es wurde eine E-Mail-Adresse für den Kundensupport eingerichtet.

Somit ergeben sich folgende Input-Quellen für Kundenfeedback:

  • Forum
  • Artikelbewertung
  • Shop Bewertung
  • Info@ E-Mail Adresse für Fragen und Rückmeldungen
  • Facebook-Seite

Das Problem ist, dass jeglicher Input nur von der Support-Abteilung bearbeitet wird. Dort wird nach einem simplen Ticketsystem vorgegangen. Positives Feedback wird unzureichend zur Kenntnis genommen, Mails mit negativem Feedback und Beschwerden werden vom Support bearbeitet. Dabei legt das Support-Team vor allem Wert auf eine zügige Bearbeitung und eine schnellstmögliche Lösung der Kundenanfrage. Rückschlüsse oder Vorhersagen für die Zukunft werden daraus nicht gezogen. Der Rest der Firma – einschließlich Frau K. – bekommt davon wenig bis gar nichts mit.

Das Forum wird vom System-Administrator verwaltet. Dieser beschäftigt sich wenig mit dem Inhalt der Kommentare; er sortiert vor allem Spam aus und schließt verwaiste Boards, er kümmert sich um rein administrative Tätigkeiten, um das Forum sauber zu halten.

Feedback aus dem Forum, Artikelbewertungen, Shop Bewertungen oder die Facebook Seite werden nicht berücksichtigt. Frau K. möchte das ändern, verfügt aber nicht über die nötigen Ressourcen, diese Quellen manuell abzuarbeiten. Viel praktischer wäre es doch, die Analyse dieser Texte per Software zu automatisieren.

Automatische Quellenanalyse durch Text Analytics/Text Mining

Mit moderner Text Mining-Software ist es möglich, unstrukturierte Text-Dokumente aus den unterschiedlichsten Quellen automatisiert analysieren zu lassen. Daraus lassen sich im Abgleich mit alten Daten Vorhersagen, zum Beispiel zum Kundenverhalten und über die Abwanderungsrate, zu erstellen.

Bei gängigen Text Mining-Tools sind dafür keine Programmierkenntnisse Voraussetzung, Prozesse werden grafisch dargestellt. Workflows, die auf Datensätze angewandt werden, müssen nur zusammengeklickt, die Parameter sinnvoll eingestellt werden. So ist ein schneller Start möglich. Erst für optimale Ergebnisse muss man die komplexen Zusammenhänge der Analyse-Prozesse im Detail verstehen.
 
Text-Analytics 1

Abbildung 1: Vorgehen Text Analyse. Quelle: Ancud IT

Text-Analytics 2

Abbildung 2: Vorgehen Text Analyse. Quelle: Ancud IT

Frau K. will diese neue Technik einsetzen, um Kundenabwanderungen besser vorherzusehen und dem rechtzeitig vorzubeugen. Um ihr Ziel zu erreichen, beauftragt sie ihren IT-Dienstleister, alle vorliegenden Daten mit einem Text Analytics-Tool analysieren zu lassen.

Am Anfang stehen die Daten, in welchem Format sie vorliegen spielt keine Rolle. Beispielsweise liegen E-Mails als .txt-Datei vor, Artikelbewertungen werden vom CMS als Excel-Tabelle exportiert, und Beiträge aus dem Forum liegen in HTML vor. Eine Text Mining-Software wird mit den Dokumenten gespeist. Das heißt, sie werden in ihrer ursprünglichen Form im System hinterlegt. Das Tool übernimmt die Konvertierung und Strukturierung der unstrukturierten Datensätze und wendet verschiedene Methoden auf die Datensätze an.

Die Texte werden segmentiert, das bedeutet, dass Buchstaben zu Wörtern zusammengefasst werden. Mehrere Wörter bilden einen Satz. Unbrauchbare Satzzeichen werden entfernt. Im Anschluss werden die Segmente klassifiziert, das heißt nach bestimmten Kriterien – ihrer Bedeutung oder Funktion – geordnet. Durch die Definition von Kategorien, wie beispielsweise „positiv“ und „negativ“, wird Begriffen oder Begriffskombinationen eine Gewichtung gegeben. So könnten beispielsweise die Begriffe „Account schließen“ und „kündigen“ im Kontext der Kundenabwanderung eine negative Gewichtung aufweisen. Tauchen diese Wörter nun verstärkt in E-Mails oder Kommentaren auf, kann man die Wahrscheinlichkeit bestimmen, dass der betroffene Verfasser seinen Account in naher Zukunft kündigen will. Zieht man nun noch andere klassifizierte Segmente hinzu – wie „lange“, „Ladezeiten“ und „Lieferzeiten“ oder Kombinationen dieser Wörter – kann unter Umständen auch die Ursache für seine Kündigung identifiziert werden. Das System erkennt diese Zusammenhänge und stuft die Churn-Wahrscheinlichkeit dieses Nutzers auf Hoch ein. Im Abgleich mit alten oder externen Daten werden aus diesen Informationen Vorhersagen für die Zukunft erstellt. All das passiert auf der Basis von Vergangenheitsdaten 100% automatisch. Der Nutzer muss Begriffe nicht manuell identifizieren, zuordnen oder gar gewichten.

Ein negativer Kommentar wird per ID einem bestimmten Nutzer zugeordnet, es kann auf einzelne oder gebündelte Beschwerden reagiert werden. Ein mögliches Entschuldigungsschreiben kann beispielsweise das Problem einräumen und auf die Reaktion der Firma hinweisen, mit einem speziellen Angebot locken (Rabattaktion) oder andere Maßnahmen der Kundenpflege einleiten.

Was zuvor mühsam per Hand gemacht wurde, übernimmt jetzt vollautomatisch eine Software. Kommentare müssen nicht mehr eigens durchgelesen und eingestuft werden. Das System analysiert auf modernen Rechnersystemen tausende Texte in Minuten, stuft sie ein und gibt dem Fachanwender eine Übersicht über alle Themen und Probleme. Dieser kann einzeln oder gebündelt darauf reagieren.

Im Fall von S&S hat sich die Kundenabwanderungsrate um 25% verbessert. Durch gezielte E-Mails an die unzufriedenen Kundengruppen kann Frau K. deren Zorn über lange Lieferzeiten auffangen. Die Kunden fühlen sich persönlich angesprochen und in ihren Bedürfnissen verstanden. Die Entschuldigung kommt gut an und verstärkt das familiäre Gefühl bei S&S, das die Kunden so schätzen. Zudem hat Frau K. herausgefunden, dass die Lieferzeiten des derzeitigen Paketdiensts in den Augen der regionalen Kunden zu lange sind. Daher beschließt sie, für dieses Gebiet einen anderen Dienst auszuprobieren. Des Weiteren stellt sie einen Mitarbeiter ein, um einen Lagerverkauf möglich zu machen. So können Kunden aus der Region auch einfach in den Laden kommen, um ihre Ware abzuholen oder sich umzuschauen. In einer E-Mail informiert sie alle Kunden im näheren Lieferumfeld, dass es jetzt auch einen Lagerverkauf gibt und sie sich über einen Besuch freuen würde. Das verbessert die Kundenbeziehung noch weiter.

Text-Analytics 3

Abbildung 3: Prozess Text Analyse. Quelle: Ancud IT

Resultat: Zufriedene Kunden bei weniger Aufwand

Durch die Churn-Vorhersagen, die aus kundengenerierten Textdaten stammen, konnte Frau K. die Kundenabwanderung deutlich reduzieren und die Effizienz ihrer Maßnahmen zur Kundenbindung erheblich steigern, Schwachstellen in der Lieferkette aufdecken und beheben sowie die Beziehung zu den Kunden qualitativ verbessern. Vorher unzufriedene Kunden fühlen sich nun wertvoller und persönlich angesprochen. Durch den Lagerverkauf erweitert sie ihre Geschäftstätigkeit um einen Offlinekanal, und das kommt bei den Kunden in der Region gut an. Ihr Gewinn ist seit diesen ersten Umstellungen deutlich gestiegen – all das nur durch die Erkenntnisse der Text Analyse.

Autor: Lukas Holzamer
Kontakt: Dipl.-Phys. Johannes Knauf, Consultant BI, Ancud IT-Beratung GmbH, business-intelligence@ancud.de
www.ancud.de/de/Leistungen/BusinessIntelligence.html
www.ancud.de