Behebung sporadischer Leistungsprobleme von Anwendungen

Werbung
solution brief
Behebung sporadischer Leistungsprobleme von
Anwendungen: Minuten statt Stunden
Sporadische Leistungsprobleme gehören zu den frustrierendsten Aufgaben, denen ITAdministratoren gegenüberstehen. Ein offenbar zufälliges Auftreten dieser Probleme,
eine nahezu unmögliche Reproduzierbarkeit aller Bedingungen und die Komplexität von
Anwendungen mit ihren Abhängigkeiten erschweren die Identifizierung und Behebung der
Ursachen.
Administratoren versuchen zumeist mit zeitaufwendigen manuellen Protokollauswertungen
und Experimenten, die Probleme zu reproduzieren und zu diagnostizieren. Sinnvoller als diese
aufwendigen und frustrierenden Verfahren ist ein effizienter Ansatz mit Werkzeugen und
Übersichten, um sporadische Leistungsprobleme im Nu zu identifizieren und zu beheben.
Ineffizienz bekämpfen
Systemadministratoren sind geübt darin, Probleme zu lösen. Jedoch ist zu Anfang eine
Vorstellung zu der Vorgehensweise erforderlich. Leider können Endbenutzer meist kaum
verwertbare Informationen nennen. Wahrscheinlich berichten diese nur von allgemeinen
Symptomen wie langsamen Anwendungen oder unerklärlichen Verbindungsverlusten, und sie
wissen nicht, ob diese Symptome durch ein sporadisches Leistungsproblem verursacht werden.
Sporadische Probleme sind besonders schwierig zu beheben, weil diese nicht lang genug
andauern, um sie in Ruhe zu untersuchen und zu lösen. Die Probleme treten auf, verursachen
Schäden und verschwinden wieder. Die einzigen verwertbaren Spuren befinden sich in
Ereignisprotokollen, jedoch oft verborgen in kaum überschaubaren Datenbergen. Die Suche
nach handfesten Indizien kann damit so schwierig werden wie die sprichwörtliche Suche
nach der Nadel im Heuhaufen. Die Grundursache des Problems kann fast überall versteckt
sein, da die meisten Geschäftsanwendungen als komplexe Instanzen mit vielen Ressourcen
interagieren, beispielsweise Datenbanken, Webservern, Verzeichnisdiensten und dem
Netzwerk selbst. Diese Komplexität zwingt dem Administrator ein langsames, arbeitsintensives
Untersuchungsverfahren auf, das andere tägliche Aufgaben und Projekte verzögern kann.
Ohne klare Hinweise auf die Ursache des Problems ist der Systemverwalter gezwungen,
Leistungsprotokolle aus allen Teilen der Anwendungsumgebung zu überprüfen. Dieses Verfahren
erfordert die Analyse langer Ereignislisten in diversen Protokollen: Eintrag für Eintrag wird nach
einem besonderen Ereignis, einer Fehlerbedingung oder einer Kombination von Bedingungen
gesucht, die zum zeitlichen Rahmen der Benutzerbeschwerden passen. Um das Problem
zu isolieren, versuchen manche Administratoren Testskripte zu schreiben, aber komplexe
Anwendungen können so viele Zustände besitzen, dass dieses Trial-and-Error-Verfahren viele
Stunden oder gar Wochen dauern kann.
In großen Organisationen mit spezialisierten Administratoren, beispielsweise für die
Datenbankadministration (DBA) oder die Netzwerkverwaltung, können diese Spezialisten
hinzugezogen werden, um ein Problem zu isolieren, doch auch ihnen bleibt wie dem
Systemadministrator nur das beschwerliche Analyseverfahren. Die Inanspruchnahme eines
anderen Administrators mit eigener Arbeitsauslastung kann ohne schlüssige Beweise, dass das
Problem tatsächlich in dessen Fachbereich fällt, unnötigerweise eine Menge Zeit verbrauchen.
Sollte ein Sachverhalt gar die Zusammenarbeit mehrerer Gruppen erfordern, kann zusätzliche Zeit
verschwendet werden, bevor das Problem gelöst ist.
Sollte nach der Behebung der Angelegenheit das Problem wiederkehren, wird der
Geschäftsbetrieb erneut unterbrochen, werden neue Benutzerbeschwerden auflaufen und wird
sich der Druck erhöhen, eine wirksamere Lösung zu finden, die den Administratoren hilft, die
Herausforderungen und Kosten durch sporadische Leistungsprobleme zu überwinden.
Schnellere Lösungen dank Application Performance Monitoring
Bei der Diagnose sporadischer Leistungsprobleme liegt die größte Schwierigkeit darin, den
richtigen Startpunkt zu kennen. Wo ist die Problemursache zu finden? In der Anwendung selbst?
Oder bei einer Datenbank oder bei einem Webserver? Oder liegt vielleicht ein Netzwerkproblem
vor? Ohne einen stichhaltigen Startpunkt fehlt der Ansatz für den richtigen Diagnoseweg und eine
effiziente Analyse.
Den Ausweg aus dieser Sackgasse bietet
eine Lösung für das Application Performance
Monitoring (APM), mit der Administratoren
alle Anwendungsabhängigkeiten verknüpfen
können. In einer derartigen APM-Umgebung
erhalten Administratoren über gezielte
Echtzeitüberwachungen sofort den richtigen
Abbildung 1: Die IT-Infrastruktur des CRM-Services besteht
aus mehreren Komponenten.
Copyright © 2014, Ipswitch, Inc. All rights reserved. WhatsUp is a registered trademark and Ipswitch
is a trademark of Ipswitch, Inc. Other products or company names are or may be trademarks or
registered trademarks and are the property of their respective holders.
Diagnoseweg und klare grafische Darstellungen, um diesem Weg zur Grundursache des
Leistungsproblems zu folgen.
Profile erstellen
Abbildung 1 zeigt das Beispiel einer IT-Dienstleistungsumgebung für das Customer-RelationshipManagement(CRM). Diese umfasst mehrere Anwendungen auf mehreren Servern. Eventuelle
Probleme, welche die Leistung aller Anwendungen in dieser Umgebung beeinflussen,
beispielsweise Datenbankprobleme oder Probleme mit dem Microsoft® IIS-Webserver, können
die Leistung des CRM-Services beeinträchtigen. Entsprechend erfordert eine Diagnose von
sporadischen Leistungsproblemen des CRM-Services die Überwachung aller Elemente, die zu den
Bestandteilen des Services gehören, und eine Präsentation aller relevanten Informationen auf
einer höheren Übersichtsebene, die einen Startpunkt für eine Analyse bietet.
Ein Application Performance Monitor nutzt Anwendungsprofile, um sporadische
Leistungsprobleme von Anwendungen zu diagnostizieren. Anwendungsprofile definieren, wie
Anwendungen überwacht werden und welche Aktionen vorzunehmen sind, wenn eine Anwendung
oder eine ihrer Komponenten nicht mehr korrekt arbeitet. Ein Application Performance Monitor ist
besonders nützlich, wenn nicht nur Anwendungsprofile, sondern auch komplexe Beziehungen und
Abhängigkeiten definiert werden können - für einfache mehrschichtige Anwendungen oder für
große Serverfarmen bis hin zu kompletten IT-Dienstleistungen.
Abbildung 2: Das Anwendungsprofil des Servers ist in das
Profil der Serverfarm integriert.
Abbildung 3: Das Anwendungsprofil der Serverfarm ist in
das Profil des CRM-Services integriert.
Copyright © 2014, Ipswitch, Inc. All rights reserved. WhatsUp is a registered trademark and Ipswitch
is a trademark of Ipswitch, Inc. Other products or company names are or may be trademarks or
registered trademarks and are the property of their respective holders.
Das Beispiel in Abbildung 1 zeigt, dass eine der zu überwachenden Komponenten des CRM-Services
eine Serverfarm ist. Eine typische SQL-Serverkonfiguration besteht aus einem Online-TransactionProcessor (OLTP), einem Staging-Server und einem SQL Server für das Data Warehousing. Für
die Überwachung jeder SQL-Serverinstanz erstellt ein Administrator ein Anwendungsprofil. Die
individuellen Profile werden dann in ein übergeordnetes Profil integriert, um hierüber die gesamte
SQL-Serverfarm zu überwachen (Abbildung 2).
Das Profil für die gesamte SQL-Serverfarm kann dann in ein nochmals übergeordnetes Profil
integriert werden, welches den gesamten CRM-Service umfasst (Abbildung 3). Mit dem Einsatz
dieses Verfahrens für jede Komponente eines IT-Services wird ein umfassendes Dienstprofil
aufgebaut, das den Schlüssel zu einer schnellen Diagnose von Problemursachen darstellt.
Dieses Profil stellt sicher, dass der Administrator auf einen Blick den Status des ganzen Dienstes
überblicken und bei Bedarf auf einfache Weise Detaildaten für jede als problematisch gemeldete
Komponente abrufen kann.
Ein umfassendes Dienstüberwachungsprofil bildet die Grundlage für eine schnelle und präzise
Problemdiagnose.
Probleme diagnostizieren
Die Erstellung eines Dienstprofils wie im CRM-Beispiel ist in der Regel in weniger als zwei
Stunden abgeschlossen. Mit dieser geringen Investition kann der Aufwand für die Diagnose
eines sporadischen Leistungsproblems von mühevollen Stunden auf wenige effiziente Minuten
verringert werden. Multipliziert mit der Anzahl von Leistungsproblemen, die bearbeitet werden
müssen, kann die tägliche Zeitersparnis beträchtlich sein.
Abbildung 4: Der Ausfall von Microsoft Dynamics kann schnell
auf ein Problem der unterstützenden Serverfarm zurückgeführt
werden.
Abbildung 5: Eine Detailanalyse zeigt ein Problem mit dem
Data Warehouse-Server.
Copyright © 2014, Ipswitch, Inc. All rights reserved. WhatsUp is a registered trademark and Ipswitch
is a trademark of Ipswitch, Inc. Other products or company names are or may be trademarks or
registered trademarks and are the property of their respective holders.
Beispielsweise könnte der Application
Performance Monitor eine Echtzeitwarnung
über den Ausfall von Microsoft Dynamics
anzeigen. Der Administrator ruft dann einfach
ein übergeordnetes Profil des CRM-Services auf
und erkennt auf einen Blick ein Problem mit der
unterstützenden SQL-Serverfarm (Abbildung 4).
Der Problembereich ist rot markiert und damit
einfach zu identifizieren.
Abbildung 6: Das Profil des Data Warehouse-Servers offenbart
die Ursache des Problems.
Der Administrator ruft daraufhin die Detailinformationen der SQL-Serverfarm ab und erkennt,
dass das Problem beim Data Warehouse-Server liegt (Abbildung 5). Im nächsten Schritt des
Diagnoseverfahrens werden detaillierte Daten zum Status des Data Warehouse-Servers
aufgerufen. Dies geschieht mit einem Mausklick auf das rote Quadrat.
Mit einem Mauslick auf das rote Quadrat oben gelangen wir zum Status des Data WarehouseServers (siehe unten, Abbildung 6). Es ist sofort zu erkennen, dass der Grund für das von
Anwender wahrgenommene Problem mit Microsoft Dynamics ein Speicherproblem auf dem
Data Warehouse-Server ist. Mit nur wenigen Mausklicks haben wir die Grundursache des
Ausfalls von Microsoft
Dynamics bestimmt.
Ein Verlaufsdiagramm
der SpeichermanagerMetriken (siehe
Abbildung 7) belegt
zusätzlich, dass
das Auftreten des
Speicherproblems
mit den
Benutzerbeschwerden
Abbildung 7: Sporadische Ausfälle von Microsoft Dynamics stehen in Beziehung zu
Speicherauslastungsspitzen auf dem Data Warehouse-Server.
zu Microsoft Dynamics in
Beziehung steht.
Was aber könnte sein, wenn ein Anwender ein Leistungsproblem von Microsoft Dynamics
Copyright © 2014, Ipswitch, Inc. All rights reserved. WhatsUp is a registered trademark and Ipswitch
is a trademark of Ipswitch, Inc. Other products or company names are or may be trademarks or
registered trademarks and are the property of their respective holders.
meldet, ein schneller Blick auf das übergeordnete
CRM-Dienstprofil aber alle Systemkomponenten
als einwandfrei zeigt? In diesem Fall liegt
wahrscheinlich ein Problem des Netzwerks selbst
vor. Viele Anwendungen wurden ohne Rücksicht auf
Funknetzwerke entwickelt. Solche Anwendungen
können problematisch auf eventuelle Verzögerungen
und Latenzen in Funknetzwerken reagieren. Im
Ergebnis können von Anwendern in Funknetzwerken
Zeitüberschreitungen, Verbindungsabbrüche und
Datenverluste wahrgenommen werden.
Um die Ursachen von Netzwerkproblemen genauso
einfach wie im Beispiel oben zu bestimmen, kann
eine Erweiterung des Application Performance
Monitorings auf das Netzwerk helfen.
Abbildung 8: Ein überbelegter Access Point steht in
Beziehung zu dem Leistungsproblem.
Um zu bestimmen, ob das Netzwerk als Ursache für ein Leistungsproblem mit Microsoft
Dynamics in Frage kommt, könnte ein Administrator ermitteln, ob betroffene Anwender in einem
kabelgebundenen oder funkbasierten Netzwerk gearbeitet haben. Wurde ein Funknetzwerk
verwendet, kommt als naheliegende Ursache ein überbelegter Access Point infrage.
Ein schneller Blick auf ein Auslastungsdiagramm des Access Points bestätigt dessen
Überbelegung (Abbildung 8). Aber mit diesem Wissen allein ist das Problem noch nicht gelöst.
Warum wurde der Access Point überbelegt? Wenn dies ein sporadisches Problem ist, wo
liegt dann die Ursache? Überlastet vielleicht der Netzwerkverkehr durch eine monatliche
Konferenzschaltung in einem nahegelegenen Besprechungsraum zeitweise den Zugangspunkt?
Abbildung 9: Anzeige der Access
Point-Belegung durch Anwender
und deren Bandbreitenverbrauch
Copyright © 2014, Ipswitch, Inc. All rights reserved. WhatsUp is a registered trademark and Ipswitch
is a trademark of Ipswitch, Inc. Other products or company names are or may be trademarks or
registered trademarks and are the property of their respective holders.
Abbildung 10: Eine nicht klassifizierte Anwendung verursacht
einen exzessiven Bandbreitenverbrauch.
Oder gibt es vielleicht Mitarbeiter, die entgegen der vereinbarten IT-Richtlinie den Access
Point mit unerlaubten Streaming-Anwendungen wie Pandora oder YouTube überlasten? Die
Bestimmung der Grundursache ist entscheidend für eine kosteneffiziente Lösung. Eine Lösung
des Problems durch eine strengere Richtlinienumsetzung hinsichtlich des Bandbreitenverbrauchs
kann die Beschaffung zusätzlicher Access Points überflüssig machen.
Mit dem gleichen Auswahlverfahren, das bei der Isolierung des Problems der SQL-Serverfarm
benutzt wurde, kann ein Administrator bestimmen, wer den Zugangspunkt auslastete und
wie viel Bandbreite dabei verbraucht wurde, als das Microsoft Dynamics-Leistungsproblem
auftrat. Abbildung 9 zeigt den eindeutig exzessiven Bandbreitenverbrauch durch eine Person.
Im letzten Schritt zeigt ein Abruf von Detailinformationen, dass der überwiegende Teil des
Bandbreitenverbrauchs dieser Person durch eine nicht klassifizierte Anwendung erfolgte, die
laut der IT-Richtlinie nicht erlaubt sein dürfte (Abbildung 10).
Automatisierte Reaktionen
Wenn die Grundursachen von sporadischen Problemen der Anwendungsleistung identifiziert
sind, können Administratoren mit dem Application Performance Monitor mehrstufige
Aktionsrichtlinien erstellen, um künftige Vorfälle schneller zu behandeln. Aktionsrichtlinien können
Ereignisprotokollierungen, Echtzeitwarnungen und PowerShell-Skriptaktionen zur Selbstheilung
umfassen, beispielsweise einen Rechner- und/oder Service-Neustart. Aktionsrichtlinien
können den Ebenen von Diensten, Anwendungen und Komponenten zugewiesen werden.
Copyright © 2014, Ipswitch, Inc. All rights reserved. WhatsUp is a registered trademark and Ipswitch
is a trademark of Ipswitch, Inc. Other products or company names are or may be trademarks or
registered trademarks and are the property of their respective holders.
Anwendungsprofile mit Abhängigkeitsverknüpfungen ermöglichen koordinierte mehrstufige
Aktionsrichtlinien, um die optimale Leistung von komplexen Anwendungen und IT-Diensten
sicherzustellen.
Umfassende Geschäftsvorteile
Application Performance Monitoring kann die Lösung sporadischer Probleme rationalisieren
und viele Stunden mühevoller Arbeit durch wenige hochproduktive Minuten ersetzen. Die
erfolgreichsten Lösungen bieten folgende Leistungen:
• Einheitliche Sicht auf die gesamte IT-Infrastruktur und alle Anwendungen
• Anpassbare Anwendungsprofile inklusive aller Abhängigkeitsdefinitionen
Dieses Leistungsvermögen erlaubt Administratoren eine schnellere und präzisere Diagnose von
sporadischen Leistungsproblemen, unabhängig davon, ob diese durch ein Gerät oder das Netzwerk
selbst verursacht werden. Darüber hinaus können anpassbare Profile die IT-Zusammenarbeit
fördern. Beispielsweise kann ein Systemadministrator einen Datenbankadministrator bitten,
Bereiche für das Monitoring zu empfehlen, die in der Vergangenheit Probleme bereiteten. Eine
kooperative Zusammenarbeit mit gemeinsamen Prioritäten und geteilten Informationen rationalisiert
das Diagnoseverfahren, verkürzt die Diagnosezeiten, spart Administrationszeit und reduziert
Benutzerbeschwerden.
Drei häufige Ursachen erschweren die Lösung sporadischer
Probleme Problem Resolution
Das sporadische Auftreten von Leistungsproblemen macht eine Diagnose oft schwierig. Behalten
Sie die folgenden drei häufigen Ursachen für sporadische Probleme im Auge:
• Speicherlecks: Der Microsoft Internet Information Service (IIS) für Windows® Server ist
ein flexibler, sicherer und handlicher Webserver. Anwendungen laden von diesem Server
häufig Informationen in den lokalen Speicher für eine Verarbeitung. Nach der Verarbeitung
sollte der Speicher wieder freigegeben werden, aber nicht immer geschieht dieses. Daraus
kann ein überlasteter Arbeitsspeicher (RAM) resultieren, der keine weitern Daten mehr
aufnehmen kann. Damit kann der Zentralprozessor (CPU) weniger Aufträge bearbeiten, und
die Anwendungsleistung bricht zusammen.
Copyright © 2014, Ipswitch, Inc. All rights reserved. WhatsUp is a registered trademark and Ipswitch
is a trademark of Ipswitch, Inc. Other products or company names are or may be trademarks or
registered trademarks and are the property of their respective holders.
• Lang laufende Abfragen: Eine scheinbar harmlose Aktion, beispielsweise die Änderung
eines Schemas oder die Aktualisierung einer gespeicherten Prozedur, kann eine Sperrung
auslösen, woraus eine sehr lang laufende SQL-Abfrage resultiert. Solche Abfragen zehren an
den CPU- und Speicherressourcen und verlangsamen die Anwendungsleistung.
• Funklatenzen: Viele Anwendungen, besonders ältere, können problematisch auf die
üblichen Latenzen in Funknetzwerken reagieren. Wenn diese Anwendungen über ein
Funknetzwerk mit Datenbanken und Webservern agieren, können die erwarteten
Reaktionszeiten überschritten werden. Daraus resultieren Zeitüberschreitungen und
verärgerte Anwender.
Effektive Werkzeuge für das Application Performance Monitoring können diese - und andere Ursachen für sporadische Leistungsprobleme schnell und präzise diagnostizieren helfen.
Ipswitch Network Management
Die Network Management Division von Ipswitch Inc. ist der Entwickler von WhatsUp Gold, die
integrierte Suite von IT-Management-Lösungen, die individuell oder nach dem Baustein-Prinzip
eingesetzt werden können. WhatsUp Gold Lösungen sind bereits in über 150.000 Netzwerken weltweit
im Einsatz und bieten KMUs und Unternehmen der Enterprise-Klasse ein umfassendes Monitoring
von kabelgebundenen und kabellosen Netzwerken, Systemen, Anwendungen und NetzwerkBandbreite, sowohl in physischen als auch virtuellen Infrastukturen. Seit 21 Jahren entwickelt Ipswitch
benutzerfreundliche und erschwingliche Produkte, die IT-Managern auf der ganzen Welt helfen,
IT-Service für den geschäftlichen Erfolg bereitzustellen. Ipswitch hat seinen Hauptsitz in Lexington,
Massachusetts, und hat Zweigstellen in Georgia, Wisconsin and Utah, sowie internationale Büros in
den Niederlanden und Japan.
Ipswitch, Inc.
83 Hartwell Avenue
Lexington, MA 02421 USA
(781) 676-5700
Kingsfordweg 151
1043 GR Amsterdam
The Netherlands
Copyright © 2014, Ipswitch, Inc. All rights reserved. WhatsUp is a registered trademark and Ipswitch is a trademark
of Ipswitch, Inc. Other products or company names are or may be trademarks or registered trademarks and are the
property of their respective holders.
Ipswitch Japan 株式会社
〒106-0047 東京都港区南麻布4-11-22
南麻布T&Fビル8階
Herunterladen