Präsentation

Werbung
Seminar
Großrechneraspekte (Mainframe)
Thema:
Netzwerk & System Management
von
Soeren Apelt
Inhalt
• Architektur für Komponenten beim
Systemmanagement
• Enterprise Management Konsole
• Event Management
• Problem Management & Help Desk
• System Repository & Datenhaltung
Wozu System Management?
• zentrale Überwachung und Steuerung aller Komponenten (möglichst
selbstständig)
• hohe Verfügbarkeit
• Fehlererkennung und –meldung
• kostengünstige Wartung
• geringe Administrationskosten
• allg. Kosten- und Arbeitsersparnisse
• Aufgaben
–
–
–
–
–
neue Platten installieren
Hardware rekonfigurieren
Server mit neuem Speicherplatz ausstatten
Daten zwischen den Laufwerken bewegen
Softwaremanagament
Aufgabenverteilung
• Remote Operation
– Administrator beobachtet und steuert Systemkomponenten
– von einem geographisch entfernten Ort
• Unattended Operation
– Electronic monitoring
– System / Automation handelt im Problemfall selbständig
– Zuständige Person wird bei Bedarf benachrichtigt
Erläuterung der Grundkonfiguration
• Agenten
– Teil von Endgeräten (z.B.
Arbeitsplatzrechner, Netzgeräte)
• Manager
– empfängt Traps von den Agenten
– Kommandos und Daten an Agenten
senden
– Daten abspeichern
– Anwendungen aufrufen
• Repository (Datenspeicher)
• Administrator / Konsole
– Daten von Agenten oder aus Repository
auslesen
– Anwendungen aufrufen und interaktiv
damit arbeiten
System Management Architektur
System Management Framework
• Kooperation der Komponenten
• gemeinsamen Schnittstellen und
Datenhaltung
• managed Interaktionen der
System Management
Anwendungen
• implementiert verteilbare
Client/Server Architektur
Funktionen eines NSM Frameworks
•
•
•
•
•
•
•
•
Policy Regimes
Profile Manager
Tasks
Scheduling Funktion
Security Einrichtungen
Rollback/Recovery
Administration
plus deren Verflechtungen
und Attribute (z.B. welcher
Administrator darf auf
welche Managed Nodes mit
welchen Rechten zugreifen)
Gliederung von NSM Funktionen
• Verfügbarkeit (Availability)
–
–
–
–
–
Enterprise Management Konsole
Fault, Event Management
Agenten
Autodiscovery
Netzwerk Management
• Operations (Tools)
–
–
–
–
–
–
–
–
–
Problem Management, Help Desk
Remote Control
Job Scheduling, Workload Management
Performance Management
Application Management
Storage Management
Security Administration
Business Process Management
Accounting, Berichtswesen
Gliederung von NSM Funktionen
• Deployment
– Configuration Management
– Software Management, Distribution und Installation
– Asset Management
• Erweiterbarkeit
–
–
–
–
Anwendungsprogrammierschnittstellen (API, SDK)
Main Frame und SNA Integration
Integration mit den Komponenten anderer Hersteller
Unterstützung durch ISV´s
Ereignis Management Konsole
• Framework arbeitet mit graphischen Oberfläche (GUI)
• die Ereignismanagement Konsole ist ein spezielles Fenster in
der GUI
– auftretende Systemevents werden überwacht
– hierfür wird ein separater (Hardware) Rechner eingesetzt
Event Management(1)
• Event Logging
– Einfangen von Events/Alerts (z.B. von individuellen Agenten, die in
Hubs, Routern, Arbeitsplatzrechnern oder Software operieren)
• Event Consolidation
– Prioritisierung und Filterung von Events
• Event Korrelation
– Gruppierung von Events/Alerts in einen einzigen Event/Alert
– Aufgabe: Erleichterung der Erkennung zugrundeliegender Probleme
• Event Notification
– ermöglicht Darstellung von Events
– einzelne Administratoren bekommen nur für sie relevante Events zu
sehen (z.B. Colour Coding hebt Bedeutung der Events hervor
– Benachrichtigung z.B. perFax, Telephone, E-Mail oder Beeper)
• Event Response
– besteht aus den beiden Komponenten Event Diagnose und (der
idealerweise automatischen) Event Resolution
Event Management(2)
• Beispiele:
–
–
–
–
–
–
–
–
–
Fehler Diagnose
Fehlerbehandlung an dezentrale Server weiterleiten
Fehler auf der (Ereignismanagement)-Konsole gesondert hervorheben
Präventive Maßnahmen im Fall von Überlastungssituationen
Fehlervermeidung über automatisierte Prozesse
Once-only reporting beim gleichzeitigen Versagen mehrerer Systeme
Unterstützung von Eskalationsmechanismen
Abspeichern und Komprimierung von Status-, Meß- und Performance-Daten
Anstoßen der automatischen Problemeröffnung über Machine generated
Problem tracking und Eintragen des Trouble Tickets im Help Desk
Event Management(3)
• Event
Korrelationsfähigkeiten:
– Rule Templates für
häufig auftretende
Verhaltensweisen
– Erzeugen, Modifizieren
und Vernichten von Rule
Sets
– Scripting Tool für die
Erzeugung von Rules
– Möglichkeit des
Austesten von Rules, ehe
sie in den
Produktionsbetrieb
übernommen werden
Enterprise Management Konsole
• zentralen Manager ( Enterprise Management Konsole)
– Komponenten:
•
•
•
•
zentraler Ereignis Manager
verteilte Ereignis Management Konsolen
zentrale Datenhaltung
verteilte Adaptoren
Hierarchische Gliederung von Enterprise
Management Konsolen
•
•
•
Verteilung der NSM Funktionen auf viele logische und physikalische Server
„Manager of Managers“ (MOM) = Enterprise Management Konsole
(Midlevel Manager, MLM) = Domänen
– es gibt geographische und administrative Domänen
– reduzieren die Netzlast
– kaskadierbar
– größere Flexibilität
– führt polling, Discovery und Management lokal aus
– Events korrelieren und automatische Reaktion
• Agenten
– ist eine Software Instanz
– überwachen Hard- und
Software Ressourcen
– ergreifen automatisch
Maßnahmen
– von Enterprise Management
Konsole aus zentral
administrierbar,
programmierbar und
verteilbar
– kommunizieren mit
Enterprise Management
Konsole
– oder MLM über Protokolle
• CMOT,SNMP1, SNMP2,
CMOL, CMIP, MIB2,
RMON1, RMON2
– auch proprietäre Protokolle,
die auf CORBA (z.B. Tivoli)
oder RPC (z.B. CA)
aufbauen
Problem Management, Help Desk(1)
• Verwaltung täglicher Probleme und Fragen
• genaue Bestimmung des Ursprunges eines Problems und
Rückführung auf bestimmte Hardware-, Software- und/oder
Prozedurfehler
• Bereiche:
– Komponentendefinitionen (z.B. Hardware, Software,
Telekommunikationsanlagen und Sicherheitssysteme
– Hierarchiebeziehungen, Garantie- und Wartungsinformationen werden
festgehalten
– Machine-generated Problem Tracking (MGPT) ermöglicht die
automatische Erstellung von Problemeinträgen (Datensätzen) auf Basis
der vom Eventmanagement überwachten Aktivitäten
– MGPT-Regeln dienen zur Erkennung von Problemen auf einzelnen
Hosts
Problem Management, Help Desk(2)
• Problembehandlung
– Problem analysieren und verfolgen, und entsprechende
Behebungsstrategie festgelegen
– Help Desk Funktion:
• Call Tracking, Escalation, Management, Reporting, Business
Analysis, Problem Solving und Document Retrieval
– Policy Based Automation regelt Autorisation
• Beispiel:
– Problem/Alert in Konsole eintrifft, wird automatisch eine Anfrage in
der Help Desk Anwendung geöffnet
– Configuration Datenbank stellt die Configuration vor Ort zur
Verfügung
– Change Management Datenbank können die letzten Änderungen
ausgelesen werden
– Problem Management Datenbank kann die letzten 5 Probleme
ausgelesen
– Bearbeitung erfolgeich, werden automatisch Event/Alert Records
deaktiviert
System Management Repository
• Eigenschaften
–
–
–
–
–
–
–
redundanzfreie Datenhaltung
Replikationsmöglichkeit
veröffentlichtes Daten- und Funktionsmodell
veröffentlichtes Objektmodell
Data Base Scaleability
Data Sharing durch unabhängige Management Anwendungen
Data Base Batch Import für ursprüngliches Laden von´Management
Information
– Unterstützung für ODBC compliant Datenbanken vorhanden
– Unterstütztung für Oracle, Sybase, Informix, Ingres, DB2 oder SQL
Server
Datenhaltung
• Die von den einzelnen Managern verwalteten Daten sind z.B.:
–
–
–
–
Performance Meßdaten beim Performance Management
Event History Daten beim Event Management
TCP/IP Topologien beim Netzwerk Management
Software Configuration Daten bei der Software Distribution
• objektorientierte Datenbank über die RIM (RDBMS Interface Manager)
Schnittstelle vorgetäuscht
• Repository selbst ist eine CORBA Objekt Datenbank
Zusammenfassung
•
•
•
•
Backup/Recovery
System Managed Storage
Hardware Management Console (HMC)
Storage Manager
•
•
•
•
•
Architektur für Komponenten für Systemmanagement
Enterprise Management Konsole
Event Management
Problem Management & Help Desk
System Repository & Datenhaltung
Herunterladen