Internet Ökonomie Portale, Push - Technologie und Personalisierung Michael Augustin 26.6.2003 Gliederung Portale Das Tor zum WWW Wirtschaftseinblick Push-Technologie Funktionsweise Unicast und Multicast Push is still alive Personalisierung Der gläserne Kunde Vorführung von Bitlog Data Mining Einführung Der KDD- Prozess Verfahren Portale Das Tor zum WWW Portale Wichtige Kriterien Hilfe für Einstieg, Weiterführung und Orientierung im World Wide Web Anlauf- und Rückkehrstelle für das Browsen bieten wichtige und allgemeine Web- Services auf persönliche Belange zugeschnitten Sprungbrett für weiteres Surfen im Netz Portale Portale Einteilung nach eBusiness-Aktivitäten Consumer-Portal offener Nutzerkreis kundenspezifisch orientiert hochfrequentierte Web-Einstiegsseiten im Internet leistungsstarker Suchdienst als wesentliches Element Enterprise-Information-Portal offener Nutzerkreis unternehmensspezifisch ausgerichtet Einstiegsseiten für Web-Site eines Unternehmens Informationen des Unternehmens im Web anbieten Portale Extranet-Portal geschlossener Kundenkreis Zielgruppe: potentiell kooperierende Geschäftskunden berücksichtigt spezielle Services wie Bestell- und Liefervorgänge Intranet Portal geschlossener Kundenkreis unternehmens-intern orientiert für Mitarbeiter ein konsistenter Blick auf das Unternehmen direkter und angepasster Zugriff auf Unternehmensapplikationen und Intranetinhalte Portale Bedeutsame Faktoren für das Marketing Ausbau zu attraktivem Werbemedium Gewinnen und Auswerten nutzerspezifischer Informationen Professioneller Auftritt im WWW Etablierung und Sicherung des Portals als Marke mit positiven Markenassoziationen Product, Place, Price, Promotion Portale Wirtschaftseinblick Portale Geschätzte Werbeausgaben der 4 wichtigsten Weltregionen Portale Top 5 der Web-Portale 1999 Nr. Name URL Mtl. Nutzer in Mio 1 Yahoo www.yahoo.com 30,893 2 AOL www.aol.com 29,141 3 MSN www.msn.com 22,046 4 GO (Disney) www.go.com 19,484 5 Netscape www.netscape .com 18,676 Push - Technologie Funktionsweise Push - Technologie Rückblick 1997 das Jahr der Push - Technologie Vorreiter: Individual Inc., Cryan Verfahren, um Nutzer mit gewünschten Informationen zu versorgen Manuelles Suchen war nicht mehr zumutbar Verwendet Konzepte des traditionellen Verlagwesens (Abonnement- Modell) Gegenstück zu Pull Push - Technologie Funktionsweise Benutzer (Abonnent) wird Mitglied bei einem Anbieter oder speziellen Informationskanal (Channel) mittels senden eines Informationsprofils Einstellen wann Anbieter senden soll Anhand des Zeitplans verbindet sich der user-PC zum Server im Internet und holt sich von da seine Informationen Information speichern Benutzer über neue Information benachrichtigen Push - Technologie Unicast und Multicast Push - Technologie Unicast TCP - Basierend viel Bandbreite nötig für jeden Nutzer eigene Verbindung, auch bei identischen Anforderungen „Pull“ Datenanforderung Browser Server Inhalt auf PC laden Inhalt anzeigen Push - Technologie Unicast TCP - Basierend viel Bandbreite nötig für jeden Nutzer eigene Verbindung, auch bei identischen Anforderungen Profil übermitteln Client Server Entsprechende Information herunterladen Benachrichtigung Push - Technologie 3 Modelle der Informationszustellung bei Unicast Unterschiede dieser Modelle Benutzerprofilfähigkeiten Aufwand zur Integration in bestehende Strukturen der Informationszustellung der Anbieter andere Bereiche, die Anbieter als Notwendig erachten Channel Content Channel Content Push Server Web Server Push Client Push Client Computer Computer Channel Content Web Servers Push Client Content Agents Computer Push - Technologie Multicast ein Server sendet Daten zu mehreren Clients in einem einzelnen Transfer UDP basierend weniger Bandbreite wird verbraucht ermöglicht ereignisgesteuerte Echtzeitdaten und Updates Intranet- Administrator kann selbst für diese Fähigkeit seines Netzes sorgen in Blöcke und Frames geteilte Daten werden vom Server kontinuierlich gesendet Push - Technologie Verdeutlichung von Multicast Content Source Internet Backbone Secondary Distribution Servers PoP ISP Primary Distribution Servers Clients Intranet Push - Technologie Push is still alive Push - Technologie Weiterentwicklung Bloomer oder Skycom bieten Möglichkeit per PCI-toSatelite-Adapter (30 MBit/sec) Text, Video, Audio und komplette Webseiten zu verarbeiten Airmedia ermöglicht kabellose Zustellung von Daten über das Rundfunknetz 24 Stunden/Tag Microsoft - übertragen von Updates Spam Push - Technologie Siemens - Vertriebsabteilung Nutzung der Backweb-Software keine Informationsangebote mehr durchgehen Aufteilung des eigenen Informationsangebots in unterschiedliche Channels Hotline entlastet Support nicht mit Anrufen Überflutet Personalisierung Der gläserne Kunde Personalisierung Ziele Informationen über Kunden sammeln durch sehr spezielle Datenauswertung individuelle, dynamische und gewinnbringende Beeinflussung auf Kaufverhalten ausüben Angebote auf Ansprüche der Nutzer zuschneiden diskrete Manipulation Personalisierung Der Personalisierungsprozess Profiling Match Making Explizite Daten Implizite Daten dynamisch statisch (Postanschrift, Präferenzen ...) (Click-Stream, Verweilzeiten ...) (Agentenansatz, Collaborative Filtering) Data Mining Data Mining Einführung Data Mining Nutzen und Anwendung gezielte/ themenbezogene Datensuche Strukturen und Zusammenhänge finden die nicht bekannt sind Verfahren für Unternehmens und Wettbewerbsdaten, aber auch in der Medizin und im Sport von Notwendigkeit Wissenschaft für sehr komplexe Datenmengen Data Mining Ich habe eine Box, die gut in die Hand paßt Es ist eine leichte Box Im Supermarkt gibt es sie in vielen Farben Auf meiner Box steht ein Name Die Box kann man öffnen Öffnet man sie, entdeckt man etwa 20 Stäbchen Wilhelm Data Mining Einsatzmöglichkeiten Konstellationen und Ausprägungen von Marketinginstrumenten ermitteln frühzeitiges erkennen von Trendwechseln Herausfinden von kauffreudigen Kunden Erkennen von abwanderungsgefährdeten Kunden Feststellen von Gründen für Produktionsfehler Kategorisierung von Kunden Webseiten-Optimierung Data Mining Der KDD- Prozess Data Mining Der Knowledge Database Discovery Prozess 1) Daten sammeln 2) Daten vorbereiten (Data-preprozessing) 3) Anwendung der Data Mining Verfahren 4) Auswertung Informationsgewinn (neue Erkenntnisse) Data Mining Datensammlung Vorkommen und Formen von Daten erkennen In der Natur - Ca Calcium - Mg Magnesium - He Helium Neu generierte Daten - Texte - Strichcode ... Historische Daten Operationale Daten Informational Data Metadaten Data Mining Datenhaltung Flat Files Tabellenkalkulationen Datenbanken - relational Strukturen • indexstrukturiert • B-Baum • Data Warehouse Data Mining Datenaufbereitung Gründe: Daten sind ungeordnet unbrauchbare Daten sind enthalten Existenz von Lücken in der Datensammlung Data Mining Preprocessing: Data Formatting Data Cleaning Data Filterning Behandlung von invalid values Behandlung von Ausreißern Behandlung von missing values Behandlung von sparse columns/tables Sampling Berechnung neuer Variablen Festsetzen von valid values Gebrauch von Taxonomien Name Mapping Value Mapping Diskretisierung Pivotisierung Data Coding/Neuronale Netze Data Mining Methoden Assoziationen (Warenkorbanalysen) suchen nach Regeln für jede Regel Support und Confidence finden Wie oft alle Elemente der Regel in der Datenbank vorkommen Durchschnitt von Head und Body if then Data Mining Klassifikationen Neuronale Netze Baumklassifikationen Wohnort Berlin Bremen Gehalt > 5000 Guter Kunde < 5000 Schlechter Kunde Data Mining Clustering Gruppierung von Datensätzen Gruppen von Datensätzen zusammensuchen, die gemeinsame Merkmale aufweisen Distancemaß entscheidet Ähnlichkeit von Objekten beim Punkte Cluster räumliche Entfernung der Punkte betrachten ähnlich mit Farben (orange rot) (grün blau) Vielen Dank für die Aufmerksamkeit Quellenangabe www.cs.uni-potsdam.de/~borchi www.iicm.edu/thesis/hforstinger/Kapitel6.html www.8ung.at/mobileworkshop/artikel_id65.htm www.networkworld.de www.ibusines.de/shop/db/shop.0472hr.html