Wirtschaftsinformatik 14.05.2005 Kapitel 5 / Internet Das Internet ist heute ein weltumspannendes Rechnernetz, zusammengesetzt aus internationalen, nationalen und lokalen Teilnetzen. Alle verwenden das Kommunikationsprotokoll TCP/IP Das Internet ging aus dem ARPANET (Advanced Research Projects Agency Network) hervor. Ziel, heterogene Rechnersysteme bei dezentraler Steuerung auf der Basis einfacher Protokolle miteinander zu verbinden. Hosts sind permanent angeschlossene Rechner. Das Standardisierungsgremium IETF (Internet Engineering Task Force) steuert und überwacht die u.a. die Weiterentwicklung der im Internet verwendeten Protokolle. TCP/IP Transmission Control Protocol/Internet Protocol. Eine Reihe von Netzwerkprotokollen, die die Kommunikation zwischen Rechnern ermöglicht. Fand zunächst Verbreitung als Teil von UNIX-Betriebssystemen und heute für alle relevanten Betriebssysteme verfügbar. Es ist das grundlegende Kommunikationsprotokoll im Internet. Verglichen mit dem ISO/OSI-Referenzmodell besteht TCP/IP nur aus vier Schichten. ISO/OSI-Modell 7 Anwendung 6 Darstellung 5 Kommunikationssteuerung 4 Transport 3 Vermittlung 2 Sicherung 1 Bitübertragung TCP/IP-Familie mit Protokollbeispielen 7 Anwendung (FTP, http, SMTP, Telnet) 6 5 4 Host to Host (TCP) 3 Internet (IP) 2 Lokales Netz (Ethernet) 1 IP-Adressen IP definiert die Struktur der weltweit eindeutigen Internet-Adressen (IP-Adressen), die Teilnetze und Rechner im Netz identifizieren, definiert den Aufbau der Internet-Pakete und regelt deren Weitertransport, das heisst Routing. IP-Adresse besteht derzeit aus 32 Bit, eine Folge von vier Zahlen zwischen 0 und 256, z.B. 194.94.124.236. DNS Zur Handhabbarkeit werden IP-Adressen durch symbolische Namen (Domain-Namen) dargestellt. Der Name Server übersetzt den Domain-Namen in die IP-Adresse mittels Domain-Name-System (DNS). Domainnamen sind hierarchisch aufgebaut und werden mit steigender Stufe von links nach rechts geschrieben. Beispiel: 1 Wirtschaftsinformatik 14.05.2005 Kapitel 5 / Internet www.hs-niederrhein.de, mit de als Top Level Domain (de = Deutschland). Die ICANN (Internet Corporation for Assigend Names and Numbers) verwaltet IP-Adressen und Domain-Namen. Generische Toplevels com, edu, gov, net, org, info und biz Bild 5.3 Der Weg eines Datenpakets Zugang zum Internet Mehrere Möglichkeiten, zur Internet-Anbindung. Internet Service Provider (ISP) unterhalten permanent ans Internet angeschlossene Rechner, lokale Anbieter und grosse Unternehmer, Online-Dienste (AOL, TOnline) Dienste im Internet Anwendungsnahe Dienste basieren auf standardisierten Protokollen, Verwendung zur Kommunikation zwischen Client und Server. Telnet-Programm Anmelden bei einem Rechner im Internet mit Benutzerkennung und Passwort. Zugriff auf Programme und Daten und arbeiten, als ob der eigene Rechner als Terminal fest mit dem entfernten Rechner verbunden sei (=Terminalemulation). Dateitransfer FTP Mit File Transfer Protokoll Daten zwischen Rechnern im Internet übertragen (upload und download). Einige FTP-Server im Internet erlauben den anonymen, passwortfreien, Zugang. e-mail SMTP E-mails über das Internet erfolgen über das Simple Mail Transfer Protocol. Vorteile: einfache Handhabung, Weiterverarbeitung ohne Medienbruch, Transport multimedialer Anhänge. Post Office Protocol (POP) und IMAP (Internet Message Access Protocol) regeln das Abrufen von emails durch den Anwender. Diskussionsforen Mit News erfolgt der öffentliche Meinungsaustausch. Diskussionsgruppen (Newsgroups) sind themenbezogen hirarchisch strukturiert. Mit dem Programm Newsreader Inhalte einer Newsgroup abrufen, neue Beiträge erstellen. Der Dienst basiert auf dem Network News Transfer Protocol (NNTP) 2 Wirtschaftsinformatik 14.05.2005 Kapitel 5 / Internet World Wide Web Neben e-mail der am häufigsten benutzte Dienst im Internet. Hypertext Transfer Protocol (http) definiert die grundlegende Funktionalität dieses Dienstes. Das WWW ist ein verteiltes Informationssystem. Tim Berners-Lee prägte diesen Begriff 1989 am CERN in Genf. Eine erste Version der Spezifikation des WWW (http, HTML) dort entwickelt und 1991 freigegeben. Zentrales Element ist das multimediale Dokument (Website). Es integriert Medien, wie Texte, Bilder, Audio- und Videodaten. Verknüpfung mit Dokumenten auch anderer Rechner im Internet über Querverweise, Links, nach dem Hypertext-Prinzip Homepage ist die Einstiegseite des Informationsangebots. Webbrowser WWW basiert auf dem Client-Server-Modell. Auf der Client-Seite bereiten sogenannte Webbrowser die Websites grafisch auf. Webbrowser wie Microsoft Internet Explorer, Mozilla und Opera. Bild 5.4 Eine Website im Browser Webserver (Microsoft Internet Information Server IIS für Windows 2000, Apache Webserver für diverse Plattformen) Auf Anfrage des Webbrowser liefert der Webserver eine gewünschte Website. http Hypertext Transfer Protocol regelt die Kommunikation zwischen Webbrowser und Webserver Eine eindeutige Adresse in Form des Uniform Resource Locator (URL) identifiziert jede Website und jede andere Ressource. Beispiel http://www.pcshop.de/produkte/index.html http = Übertragungsprotokoll www.pcshop.de = Domain-Name des Webservers produkte = Verzeichnispfad index.html = Dateiname der Webseite Bild 5.5 http-Anfrage und http-Antwort 3 Wirtschaftsinformatik 14.05.2005 Kapitel 5 / Internet HTML Hypertext Markup Language, eine Seitenbeschreibungssprache ist Standard für die Darstellung der Informationen einer Website. Sie legt das Layout der Inhalte fest Mit Hilfe vordefinierter „Tags“ werden die Inhalte einer Website, wie Texte, Bilder usw., angeordnet und formatiert. Bild 5.6 Beschreibung mit HTML Ein Tag <x> wird durch </x> geschlossen. Das HTML-Dokument <html> … </html> besteht aus einem Kopf <head>… </head> und einem Rumpf <body>…</body>. Die Grafik wird eingebunden mit einer Referenz auf die Datei pc.gif: <img.src=“pc.gif“/>. <p>…</p> erzeugt einen Absatz Der Link auf die Seite katalog.html, im selben Datenverzeichnis wie die Seite index.html, wird durch <a bref=“katalog.html“>…</a> angegeben. Die Markierung schliesst den Verweistext. XML Extensible Markup Language erlaubt über genau definierte Tags eine Beschreibung strukturierter Informationen. XML ist geeignet für Web-Präsentationen, elektronischer Datenaustausch (EDI), Druckvorlagen für Bücher, Datenbankzugriffe, Kopplung verteilter Anwendungssysteme. Bild 5.7 Ein einfaches XML-Dokument WML Drahtlose Web-Anwendungen über das Handy mit dem Protokoll WAP (Wireless Application Protocol) und der Sprache WML (Wireless Markup Language), die auf XML basieren. Suchdienste helfen, Informationen in Form von Themenkataloge oder Abfrageprogramm, um Stichwörter au der Basis vorgehaltener Datenbanken zu suchen. spezielle Suchprogramme durchforsten das WWW regelmässig nach neuen Informationen, sammeln inhaltsrelevante Terme und legen diese mit der jeweiligen URL-Adresse der Fundstelle in Datenbanken ab. 4 Wirtschaftsinformatik 14.05.2005 Kapitel 5 / Internet Portale Analog zur Homepage Einstieg in eine Informationsangebot. Angebot ist nach zielgruppenspezifischen Inhalten strukturiert (Fachportale, Themenportale, Unternehmensportale). Das Portal passt sich an die Bedürfnisse des Benutzers an dank eines erstellten Benutzerprofils (Personalisierung) Dynamische Web-Anwendungen Sie werden erst erzeugt, wenn der Benutzer sie anfordert. Die Inhalte dieser Seiten können aus verschiedenen externen Datenbanken stammen. Statische Websites stehen den Benutzern in unveränderter und gleicher Form zum Abruf bereit. Beispiel 1. Der Benutzer erfasst den Namen eines Autors in einem Formular. 2. Der Webbrowser sendet diese Daten an den Webserver. 3. Der Webserver sucht nun nach den verfügbaren Buchtiteln dieses Autors in einer Datenbank. 4. das Suchergebnis wird zu einer HTML-Seite automatisch zusammengestellt und zum Client übertragen worden. Techniken zur die Web-Anwendungen und der Erzeugung dynamischer Inhalte: Programme auf dem Client für die Darstellung der Daten und Benutzerinteraktion Programme auf dem Server für die Bereitstellung und Erzeugung der Daten Client-seitige Programme Ein Webbrowser zur Eingabe von Daten für den Webserver (Adresse, Formulardaten) und der Anzeige der zurückgesendeten Dokumente (HTML-Seite mit integrierten Bildern usw.) Auch für Plausibilitätsprüfungen von Eingabedaten, Animation und Veränderung der präsentierten Inhalte während der Anzeige Zusatzprogramme, Plug-Ins Zusatzprogramme sind plattformabhängig und werden einmal zusätzlich zum Browser auf dem ClientRechner installiert. 1. eigenständig, auch unabhängig vom Browser verwendbare Programme 2. Plug-Ins Plug-Ins sind dynamisch ladbare Module, erweitern die Funktionalität des Browsers.s Sie können aber nicht als eigenständige Programme unabhängig vom Browser aufgerufen werden. Plug-Ins zur Darstellung von Video-Clips, zur 3D-Animation Wiedergabe von Audiodaten Beliebige Medientypen können in HTML-Seiten eingebunden werden. Alle aus dem Netz geladenen Programme haben einen Code. Der Webserver überträgt eine angeforderte Website und speziell den dazugehörenden Code über http automatisch an den Client erst zum Zeitpunkt der Anforderung. Der Code wird beim Client ausgeführt und anschliessend wieder gelöscht. Dies können plattformunabhängige Maschinencodes sein, wie Java Applets. Programme, die mit Skriptsprachen (= Java Script) erstellt wurden, können in HTML-Seiten eingebettet oder separat übertragen werden. Funktionen eines Skripts können direkt ausgeführt werden 1. beim Laden des Dokuments im Browser 2. oder beim Senden eines Formulars. 5 Wirtschaftsinformatik 14.05.2005 Kapitel 5 / Internet Elemente einer HTML-Seite können für Skripte zugänglich gemacht werden, sodass diese gesteuert, dynamisch positioniert geändert werden können. Dies nennt sich Dynamic HTML (DHTML) Java Applets für plattformunabhängige Anwendungen mit komplexen grafischen Oberflächen. Ein Applet ist ein Java-Programm, das von einer HTML-Seite aus gestartet wird, über das Netz auf den ClientRechner geladen und dort innerhalb des Webbrowsers ausgeführt. Applets stellen Netzverbindungen zu dem Server her, von dem der Code geladen wurde, und dort mit Anwendungen kommunizieren. Microsofts ActiveX-Technologie für Einbindung von ausführbaren Programmen (ActiveX-Contros) in Webseiten ActiveX-Controls sind plattformabhängig und nutzen Funktionen der Windows-Programme, die auf dem Benutzer PC installiert sind. Serverseitige Programme Erweiterungen der Webserver-Funktionalität ermöglichen den Aufruf von Programmen zur dynamischen Generierung von Webseiten auf dem Server. Das Common Gateway Interface (CGI) ist ein Verfahren für einen solchen Programmaufruf. CGI ist eine standardisierte Schnittstelle. Sie regelt die Kommunikation (Ein-, Ausgabe) zwischen Webserver und einem externen Programm (CGI-Programm), dieses CGI-Programm generiert eine dynamische Website. CGI können in beinahe jeder Skript- oder Programmiersprache realisiert werden. CGI-Programme 1. Werten http-Anfragen aus, wie Daten aus HTML-Formularen. 2. Führen z.B. Datenbankabfragen aus. 3. Generieren HTML-Seiten Es existieren noch andere, teilweise herstellerabhängige Verfahren zur Anbindung externer Programme auf dem Server. Bild 5.8 CGI PHP Beispiel einer einfachen Suchanfrage auf der Basis der Skiptsprache PHP (Hypertext Preprocessor): PHP-Skripte sind Textadteien, die eine Mischung aus HTML-Anweisungen und PHP-Programmcode enthalten. Bei Aufruf von PHP-Skripten wird der Programmcode auf der Server-Seite interpretiert und ausgeführt. Der Client erhält Website und übrige HTML-Anweisungen als Ergebnisse der Ausführung. Der PHP-Interpreter kann als CGI-Programm vom Webserver (z.B. Apache) ausgeführt werden. Bild 5.10 HTML-Code des Suchformulars suchen.html 6 Wirtschaftsinformatik 14.05.2005 Kapitel 5 / Internet <html> <head> <title>Suchen</title> </head> <body> <h1>Suchen im Buchkatalog</h1> <form action=”abfrage.php” method=”post”> <b>Autor:</b> <input type=”text” name=”autor” size=”30”/> <input type=”submit” value=”Suche”/> </form> </body> </html> Das Formular ist innerhalb von <form>…</form> spezifiziert. Es enthält u.a. das Eingabefeld <input…> mit dem Namen autor und die Schaltfläche mit der Beschriftung „Suche“, die der Benutzer betätigen muss, um die Formulardaten zu senden. Diese Daten werden vom PHP-Skript abfrage.php (siehe Parameter action im <form>-Tag) auf der Server-Seite verarbeitet. Bild 5.11 PHP-Skript abfrage.php <html> <head> <title>Suchergebnis</title> </head> <body> <h1>Suchergebnis Ihre Abfrage</h1> <?php $con = odbc_connect (“katalog”, “”, “”); $sql = “SELECT title FROM buch WHERE autor = ‘$autor’ ORDER BY titel”; $result = odbc_exec ($con, $sql); while (odbc_fetch_row($result)) { echo odbc_result ($result, 1); echo “<br/>\n”; } odbc_close($con); ?> <p><a href=”suchen.html><b>Zurück</b></a></p> </body> </html> Die von PHP zu interpretierenden Anweisungen sind durch die Markierungen <?php und ?> umschlossen und damit vom HTML-Code deutlich getrennt. Zu Beginn wird die Verbindung zur Datenbank katalog (hier eine mittels ODBC angeschlossene MSAccess-Datenbank) hergestellt (odbc_connect), dann in unter sql gespeicherte Datenbankafrage SELECT …ausgeführt (odbc_exec) Die in SQL furmulierte Abfrage ermittelt alle in der Tabelle buch gespeicherten Titel, deren Autor mit dem Inahlt der Variablen autor übereinstimmt. Die Variable autor entspreicht dem Formularfeld autor. In einer Programmschleife werden nun mit odbc_fetch-row die einzelnen Titel geholt und ausgegeben (odbc_result). Am Ende wird die Verbindung zur Datenbank geschlossen (odbc_close) 7 Wirtschaftsinformatik 14.05.2005 Kapitel 5 / Internet 5.12 Die von PHP generierte HTML-Seite 5.13 Das Suchergebnis Intranet Intranet ist ein unternehmensinternes Netz. Es setzt die Kommunikationsprotokolle des Internets (TCP/IP) und Webbrowser und Webserver usw. ein. Im Gegensatz zum Internet ist der Zugang auf bestimmte Personengruppen des Unternehmens beschränkt. Ein Intranet kann mit dem Internet verbunden werden. Einwahl von externen MA (Aussendienstler) aus dem Internet in das firmeninterne Netz, um Geschäftsprozesse abzuwickeln. Firewall Schützt gegen unberechtigte Zugriffe von aussen auf unternehmerische Daten. Die Firewall ist eine Sicherheitsschleuse und besteht aus Hardware und Software. Über diese Sicherheitsschleuse wird jeglicher Netzverkehr zwischen Internet und Intranet geführt. Über Filter sind nur bestimmte Verbindungen und Anwendungen erlaubt. Ansonsten können bestimmte IP-Adressen von der Kommunikation ausgeschlossen werden. Kryptographie Sichererer, vertraulicher Austausch von Informationen über öffentliche Leitungen durch Verschlüsselung sowie den Nachweis der Identität eines Benutzers (Authentifizierung) beim Zugriff auf firmeninterne Ressourcen. VPN Lokale Netzwerke (Intranets) an diversen Orten innerhalb einer Firma werden über Internet zu einem sogenannten Virtual Private Network (VPN) verbunden. Dazu wird eine sichere Verbindung (Tunnel) 8 Wirtschaftsinformatik 14.05.2005 Kapitel 5 / Internet innerhalb des Intranets eingerichtet, via Verschlüsselung und spezieller Protokolle. VPNs dienen auch zur Einbindung von Kunden, Lieferanten und Aussendienstmitarbeiter. Eine sichere VPN-Verbindung kann aufgebaut werden von einem Rechner des lokalen Firmennetzes oder erst vom Internet Service Provider, falls dieser die VPN-Funktionalität anbietet. Eigene Websites Folgende Möglichkeiten, um eigene Informationen im WWW bereitzustellen: 1. Der Webserver ist Teil des firmeneigenen lokalen Netzes mit Festverbindung zum Internet. 2. Der firmeneigene Webserver (Rechner) steht beim ISP ohne Festverbindung zum firmeneigenen Netz. Updates der Websites können fallweise durch Einwahl beim ISP z.B. über FTP erfolgen. 3. Die firmeneigenen Websites sind auf einem Rechner des ISP. Bild 5.14 Sichere Verbindung ins Internet 9