solution brief Behebung sporadischer Leistungsprobleme von Anwendungen: Minuten statt Stunden Sporadische Leistungsprobleme gehören zu den frustrierendsten Aufgaben, denen ITAdministratoren gegenüberstehen. Ein offenbar zufälliges Auftreten dieser Probleme, eine nahezu unmögliche Reproduzierbarkeit aller Bedingungen und die Komplexität von Anwendungen mit ihren Abhängigkeiten erschweren die Identifizierung und Behebung der Ursachen. Administratoren versuchen zumeist mit zeitaufwendigen manuellen Protokollauswertungen und Experimenten, die Probleme zu reproduzieren und zu diagnostizieren. Sinnvoller als diese aufwendigen und frustrierenden Verfahren ist ein effizienter Ansatz mit Werkzeugen und Übersichten, um sporadische Leistungsprobleme im Nu zu identifizieren und zu beheben. Ineffizienz bekämpfen Systemadministratoren sind geübt darin, Probleme zu lösen. Jedoch ist zu Anfang eine Vorstellung zu der Vorgehensweise erforderlich. Leider können Endbenutzer meist kaum verwertbare Informationen nennen. Wahrscheinlich berichten diese nur von allgemeinen Symptomen wie langsamen Anwendungen oder unerklärlichen Verbindungsverlusten, und sie wissen nicht, ob diese Symptome durch ein sporadisches Leistungsproblem verursacht werden. Sporadische Probleme sind besonders schwierig zu beheben, weil diese nicht lang genug andauern, um sie in Ruhe zu untersuchen und zu lösen. Die Probleme treten auf, verursachen Schäden und verschwinden wieder. Die einzigen verwertbaren Spuren befinden sich in Ereignisprotokollen, jedoch oft verborgen in kaum überschaubaren Datenbergen. Die Suche nach handfesten Indizien kann damit so schwierig werden wie die sprichwörtliche Suche nach der Nadel im Heuhaufen. Die Grundursache des Problems kann fast überall versteckt sein, da die meisten Geschäftsanwendungen als komplexe Instanzen mit vielen Ressourcen interagieren, beispielsweise Datenbanken, Webservern, Verzeichnisdiensten und dem Netzwerk selbst. Diese Komplexität zwingt dem Administrator ein langsames, arbeitsintensives Untersuchungsverfahren auf, das andere tägliche Aufgaben und Projekte verzögern kann. Ohne klare Hinweise auf die Ursache des Problems ist der Systemverwalter gezwungen, Leistungsprotokolle aus allen Teilen der Anwendungsumgebung zu überprüfen. Dieses Verfahren erfordert die Analyse langer Ereignislisten in diversen Protokollen: Eintrag für Eintrag wird nach einem besonderen Ereignis, einer Fehlerbedingung oder einer Kombination von Bedingungen gesucht, die zum zeitlichen Rahmen der Benutzerbeschwerden passen. Um das Problem zu isolieren, versuchen manche Administratoren Testskripte zu schreiben, aber komplexe Anwendungen können so viele Zustände besitzen, dass dieses Trial-and-Error-Verfahren viele Stunden oder gar Wochen dauern kann. In großen Organisationen mit spezialisierten Administratoren, beispielsweise für die Datenbankadministration (DBA) oder die Netzwerkverwaltung, können diese Spezialisten hinzugezogen werden, um ein Problem zu isolieren, doch auch ihnen bleibt wie dem Systemadministrator nur das beschwerliche Analyseverfahren. Die Inanspruchnahme eines anderen Administrators mit eigener Arbeitsauslastung kann ohne schlüssige Beweise, dass das Problem tatsächlich in dessen Fachbereich fällt, unnötigerweise eine Menge Zeit verbrauchen. Sollte ein Sachverhalt gar die Zusammenarbeit mehrerer Gruppen erfordern, kann zusätzliche Zeit verschwendet werden, bevor das Problem gelöst ist. Sollte nach der Behebung der Angelegenheit das Problem wiederkehren, wird der Geschäftsbetrieb erneut unterbrochen, werden neue Benutzerbeschwerden auflaufen und wird sich der Druck erhöhen, eine wirksamere Lösung zu finden, die den Administratoren hilft, die Herausforderungen und Kosten durch sporadische Leistungsprobleme zu überwinden. Schnellere Lösungen dank Application Performance Monitoring Bei der Diagnose sporadischer Leistungsprobleme liegt die größte Schwierigkeit darin, den richtigen Startpunkt zu kennen. Wo ist die Problemursache zu finden? In der Anwendung selbst? Oder bei einer Datenbank oder bei einem Webserver? Oder liegt vielleicht ein Netzwerkproblem vor? Ohne einen stichhaltigen Startpunkt fehlt der Ansatz für den richtigen Diagnoseweg und eine effiziente Analyse. Den Ausweg aus dieser Sackgasse bietet eine Lösung für das Application Performance Monitoring (APM), mit der Administratoren alle Anwendungsabhängigkeiten verknüpfen können. In einer derartigen APM-Umgebung erhalten Administratoren über gezielte Echtzeitüberwachungen sofort den richtigen Abbildung 1: Die IT-Infrastruktur des CRM-Services besteht aus mehreren Komponenten. Copyright © 2014, Ipswitch, Inc. All rights reserved. WhatsUp is a registered trademark and Ipswitch is a trademark of Ipswitch, Inc. Other products or company names are or may be trademarks or registered trademarks and are the property of their respective holders. Diagnoseweg und klare grafische Darstellungen, um diesem Weg zur Grundursache des Leistungsproblems zu folgen. Profile erstellen Abbildung 1 zeigt das Beispiel einer IT-Dienstleistungsumgebung für das Customer-RelationshipManagement(CRM). Diese umfasst mehrere Anwendungen auf mehreren Servern. Eventuelle Probleme, welche die Leistung aller Anwendungen in dieser Umgebung beeinflussen, beispielsweise Datenbankprobleme oder Probleme mit dem Microsoft® IIS-Webserver, können die Leistung des CRM-Services beeinträchtigen. Entsprechend erfordert eine Diagnose von sporadischen Leistungsproblemen des CRM-Services die Überwachung aller Elemente, die zu den Bestandteilen des Services gehören, und eine Präsentation aller relevanten Informationen auf einer höheren Übersichtsebene, die einen Startpunkt für eine Analyse bietet. Ein Application Performance Monitor nutzt Anwendungsprofile, um sporadische Leistungsprobleme von Anwendungen zu diagnostizieren. Anwendungsprofile definieren, wie Anwendungen überwacht werden und welche Aktionen vorzunehmen sind, wenn eine Anwendung oder eine ihrer Komponenten nicht mehr korrekt arbeitet. Ein Application Performance Monitor ist besonders nützlich, wenn nicht nur Anwendungsprofile, sondern auch komplexe Beziehungen und Abhängigkeiten definiert werden können - für einfache mehrschichtige Anwendungen oder für große Serverfarmen bis hin zu kompletten IT-Dienstleistungen. Abbildung 2: Das Anwendungsprofil des Servers ist in das Profil der Serverfarm integriert. Abbildung 3: Das Anwendungsprofil der Serverfarm ist in das Profil des CRM-Services integriert. Copyright © 2014, Ipswitch, Inc. All rights reserved. WhatsUp is a registered trademark and Ipswitch is a trademark of Ipswitch, Inc. Other products or company names are or may be trademarks or registered trademarks and are the property of their respective holders. Das Beispiel in Abbildung 1 zeigt, dass eine der zu überwachenden Komponenten des CRM-Services eine Serverfarm ist. Eine typische SQL-Serverkonfiguration besteht aus einem Online-TransactionProcessor (OLTP), einem Staging-Server und einem SQL Server für das Data Warehousing. Für die Überwachung jeder SQL-Serverinstanz erstellt ein Administrator ein Anwendungsprofil. Die individuellen Profile werden dann in ein übergeordnetes Profil integriert, um hierüber die gesamte SQL-Serverfarm zu überwachen (Abbildung 2). Das Profil für die gesamte SQL-Serverfarm kann dann in ein nochmals übergeordnetes Profil integriert werden, welches den gesamten CRM-Service umfasst (Abbildung 3). Mit dem Einsatz dieses Verfahrens für jede Komponente eines IT-Services wird ein umfassendes Dienstprofil aufgebaut, das den Schlüssel zu einer schnellen Diagnose von Problemursachen darstellt. Dieses Profil stellt sicher, dass der Administrator auf einen Blick den Status des ganzen Dienstes überblicken und bei Bedarf auf einfache Weise Detaildaten für jede als problematisch gemeldete Komponente abrufen kann. Ein umfassendes Dienstüberwachungsprofil bildet die Grundlage für eine schnelle und präzise Problemdiagnose. Probleme diagnostizieren Die Erstellung eines Dienstprofils wie im CRM-Beispiel ist in der Regel in weniger als zwei Stunden abgeschlossen. Mit dieser geringen Investition kann der Aufwand für die Diagnose eines sporadischen Leistungsproblems von mühevollen Stunden auf wenige effiziente Minuten verringert werden. Multipliziert mit der Anzahl von Leistungsproblemen, die bearbeitet werden müssen, kann die tägliche Zeitersparnis beträchtlich sein. Abbildung 4: Der Ausfall von Microsoft Dynamics kann schnell auf ein Problem der unterstützenden Serverfarm zurückgeführt werden. Abbildung 5: Eine Detailanalyse zeigt ein Problem mit dem Data Warehouse-Server. Copyright © 2014, Ipswitch, Inc. All rights reserved. WhatsUp is a registered trademark and Ipswitch is a trademark of Ipswitch, Inc. Other products or company names are or may be trademarks or registered trademarks and are the property of their respective holders. Beispielsweise könnte der Application Performance Monitor eine Echtzeitwarnung über den Ausfall von Microsoft Dynamics anzeigen. Der Administrator ruft dann einfach ein übergeordnetes Profil des CRM-Services auf und erkennt auf einen Blick ein Problem mit der unterstützenden SQL-Serverfarm (Abbildung 4). Der Problembereich ist rot markiert und damit einfach zu identifizieren. Abbildung 6: Das Profil des Data Warehouse-Servers offenbart die Ursache des Problems. Der Administrator ruft daraufhin die Detailinformationen der SQL-Serverfarm ab und erkennt, dass das Problem beim Data Warehouse-Server liegt (Abbildung 5). Im nächsten Schritt des Diagnoseverfahrens werden detaillierte Daten zum Status des Data Warehouse-Servers aufgerufen. Dies geschieht mit einem Mausklick auf das rote Quadrat. Mit einem Mauslick auf das rote Quadrat oben gelangen wir zum Status des Data WarehouseServers (siehe unten, Abbildung 6). Es ist sofort zu erkennen, dass der Grund für das von Anwender wahrgenommene Problem mit Microsoft Dynamics ein Speicherproblem auf dem Data Warehouse-Server ist. Mit nur wenigen Mausklicks haben wir die Grundursache des Ausfalls von Microsoft Dynamics bestimmt. Ein Verlaufsdiagramm der SpeichermanagerMetriken (siehe Abbildung 7) belegt zusätzlich, dass das Auftreten des Speicherproblems mit den Benutzerbeschwerden Abbildung 7: Sporadische Ausfälle von Microsoft Dynamics stehen in Beziehung zu Speicherauslastungsspitzen auf dem Data Warehouse-Server. zu Microsoft Dynamics in Beziehung steht. Was aber könnte sein, wenn ein Anwender ein Leistungsproblem von Microsoft Dynamics Copyright © 2014, Ipswitch, Inc. All rights reserved. WhatsUp is a registered trademark and Ipswitch is a trademark of Ipswitch, Inc. Other products or company names are or may be trademarks or registered trademarks and are the property of their respective holders. meldet, ein schneller Blick auf das übergeordnete CRM-Dienstprofil aber alle Systemkomponenten als einwandfrei zeigt? In diesem Fall liegt wahrscheinlich ein Problem des Netzwerks selbst vor. Viele Anwendungen wurden ohne Rücksicht auf Funknetzwerke entwickelt. Solche Anwendungen können problematisch auf eventuelle Verzögerungen und Latenzen in Funknetzwerken reagieren. Im Ergebnis können von Anwendern in Funknetzwerken Zeitüberschreitungen, Verbindungsabbrüche und Datenverluste wahrgenommen werden. Um die Ursachen von Netzwerkproblemen genauso einfach wie im Beispiel oben zu bestimmen, kann eine Erweiterung des Application Performance Monitorings auf das Netzwerk helfen. Abbildung 8: Ein überbelegter Access Point steht in Beziehung zu dem Leistungsproblem. Um zu bestimmen, ob das Netzwerk als Ursache für ein Leistungsproblem mit Microsoft Dynamics in Frage kommt, könnte ein Administrator ermitteln, ob betroffene Anwender in einem kabelgebundenen oder funkbasierten Netzwerk gearbeitet haben. Wurde ein Funknetzwerk verwendet, kommt als naheliegende Ursache ein überbelegter Access Point infrage. Ein schneller Blick auf ein Auslastungsdiagramm des Access Points bestätigt dessen Überbelegung (Abbildung 8). Aber mit diesem Wissen allein ist das Problem noch nicht gelöst. Warum wurde der Access Point überbelegt? Wenn dies ein sporadisches Problem ist, wo liegt dann die Ursache? Überlastet vielleicht der Netzwerkverkehr durch eine monatliche Konferenzschaltung in einem nahegelegenen Besprechungsraum zeitweise den Zugangspunkt? Abbildung 9: Anzeige der Access Point-Belegung durch Anwender und deren Bandbreitenverbrauch Copyright © 2014, Ipswitch, Inc. All rights reserved. WhatsUp is a registered trademark and Ipswitch is a trademark of Ipswitch, Inc. Other products or company names are or may be trademarks or registered trademarks and are the property of their respective holders. Abbildung 10: Eine nicht klassifizierte Anwendung verursacht einen exzessiven Bandbreitenverbrauch. Oder gibt es vielleicht Mitarbeiter, die entgegen der vereinbarten IT-Richtlinie den Access Point mit unerlaubten Streaming-Anwendungen wie Pandora oder YouTube überlasten? Die Bestimmung der Grundursache ist entscheidend für eine kosteneffiziente Lösung. Eine Lösung des Problems durch eine strengere Richtlinienumsetzung hinsichtlich des Bandbreitenverbrauchs kann die Beschaffung zusätzlicher Access Points überflüssig machen. Mit dem gleichen Auswahlverfahren, das bei der Isolierung des Problems der SQL-Serverfarm benutzt wurde, kann ein Administrator bestimmen, wer den Zugangspunkt auslastete und wie viel Bandbreite dabei verbraucht wurde, als das Microsoft Dynamics-Leistungsproblem auftrat. Abbildung 9 zeigt den eindeutig exzessiven Bandbreitenverbrauch durch eine Person. Im letzten Schritt zeigt ein Abruf von Detailinformationen, dass der überwiegende Teil des Bandbreitenverbrauchs dieser Person durch eine nicht klassifizierte Anwendung erfolgte, die laut der IT-Richtlinie nicht erlaubt sein dürfte (Abbildung 10). Automatisierte Reaktionen Wenn die Grundursachen von sporadischen Problemen der Anwendungsleistung identifiziert sind, können Administratoren mit dem Application Performance Monitor mehrstufige Aktionsrichtlinien erstellen, um künftige Vorfälle schneller zu behandeln. Aktionsrichtlinien können Ereignisprotokollierungen, Echtzeitwarnungen und PowerShell-Skriptaktionen zur Selbstheilung umfassen, beispielsweise einen Rechner- und/oder Service-Neustart. Aktionsrichtlinien können den Ebenen von Diensten, Anwendungen und Komponenten zugewiesen werden. Copyright © 2014, Ipswitch, Inc. All rights reserved. WhatsUp is a registered trademark and Ipswitch is a trademark of Ipswitch, Inc. Other products or company names are or may be trademarks or registered trademarks and are the property of their respective holders. Anwendungsprofile mit Abhängigkeitsverknüpfungen ermöglichen koordinierte mehrstufige Aktionsrichtlinien, um die optimale Leistung von komplexen Anwendungen und IT-Diensten sicherzustellen. Umfassende Geschäftsvorteile Application Performance Monitoring kann die Lösung sporadischer Probleme rationalisieren und viele Stunden mühevoller Arbeit durch wenige hochproduktive Minuten ersetzen. Die erfolgreichsten Lösungen bieten folgende Leistungen: • Einheitliche Sicht auf die gesamte IT-Infrastruktur und alle Anwendungen • Anpassbare Anwendungsprofile inklusive aller Abhängigkeitsdefinitionen Dieses Leistungsvermögen erlaubt Administratoren eine schnellere und präzisere Diagnose von sporadischen Leistungsproblemen, unabhängig davon, ob diese durch ein Gerät oder das Netzwerk selbst verursacht werden. Darüber hinaus können anpassbare Profile die IT-Zusammenarbeit fördern. Beispielsweise kann ein Systemadministrator einen Datenbankadministrator bitten, Bereiche für das Monitoring zu empfehlen, die in der Vergangenheit Probleme bereiteten. Eine kooperative Zusammenarbeit mit gemeinsamen Prioritäten und geteilten Informationen rationalisiert das Diagnoseverfahren, verkürzt die Diagnosezeiten, spart Administrationszeit und reduziert Benutzerbeschwerden. Drei häufige Ursachen erschweren die Lösung sporadischer Probleme Problem Resolution Das sporadische Auftreten von Leistungsproblemen macht eine Diagnose oft schwierig. Behalten Sie die folgenden drei häufigen Ursachen für sporadische Probleme im Auge: • Speicherlecks: Der Microsoft Internet Information Service (IIS) für Windows® Server ist ein flexibler, sicherer und handlicher Webserver. Anwendungen laden von diesem Server häufig Informationen in den lokalen Speicher für eine Verarbeitung. Nach der Verarbeitung sollte der Speicher wieder freigegeben werden, aber nicht immer geschieht dieses. Daraus kann ein überlasteter Arbeitsspeicher (RAM) resultieren, der keine weitern Daten mehr aufnehmen kann. Damit kann der Zentralprozessor (CPU) weniger Aufträge bearbeiten, und die Anwendungsleistung bricht zusammen. Copyright © 2014, Ipswitch, Inc. All rights reserved. WhatsUp is a registered trademark and Ipswitch is a trademark of Ipswitch, Inc. Other products or company names are or may be trademarks or registered trademarks and are the property of their respective holders. • Lang laufende Abfragen: Eine scheinbar harmlose Aktion, beispielsweise die Änderung eines Schemas oder die Aktualisierung einer gespeicherten Prozedur, kann eine Sperrung auslösen, woraus eine sehr lang laufende SQL-Abfrage resultiert. Solche Abfragen zehren an den CPU- und Speicherressourcen und verlangsamen die Anwendungsleistung. • Funklatenzen: Viele Anwendungen, besonders ältere, können problematisch auf die üblichen Latenzen in Funknetzwerken reagieren. Wenn diese Anwendungen über ein Funknetzwerk mit Datenbanken und Webservern agieren, können die erwarteten Reaktionszeiten überschritten werden. Daraus resultieren Zeitüberschreitungen und verärgerte Anwender. Effektive Werkzeuge für das Application Performance Monitoring können diese - und andere Ursachen für sporadische Leistungsprobleme schnell und präzise diagnostizieren helfen. Ipswitch Network Management Die Network Management Division von Ipswitch Inc. ist der Entwickler von WhatsUp Gold, die integrierte Suite von IT-Management-Lösungen, die individuell oder nach dem Baustein-Prinzip eingesetzt werden können. WhatsUp Gold Lösungen sind bereits in über 150.000 Netzwerken weltweit im Einsatz und bieten KMUs und Unternehmen der Enterprise-Klasse ein umfassendes Monitoring von kabelgebundenen und kabellosen Netzwerken, Systemen, Anwendungen und NetzwerkBandbreite, sowohl in physischen als auch virtuellen Infrastukturen. Seit 21 Jahren entwickelt Ipswitch benutzerfreundliche und erschwingliche Produkte, die IT-Managern auf der ganzen Welt helfen, IT-Service für den geschäftlichen Erfolg bereitzustellen. Ipswitch hat seinen Hauptsitz in Lexington, Massachusetts, und hat Zweigstellen in Georgia, Wisconsin and Utah, sowie internationale Büros in den Niederlanden und Japan. Ipswitch, Inc. 83 Hartwell Avenue Lexington, MA 02421 USA (781) 676-5700 Kingsfordweg 151 1043 GR Amsterdam The Netherlands Copyright © 2014, Ipswitch, Inc. All rights reserved. WhatsUp is a registered trademark and Ipswitch is a trademark of Ipswitch, Inc. Other products or company names are or may be trademarks or registered trademarks and are the property of their respective holders. Ipswitch Japan 株式会社 〒106-0047 東京都港区南麻布4-11-22 南麻布T&Fビル8階