Storage Solutions
Posts 1-6 of 6
-
Dirk Vogelsang Premium Member Group moderatorThe company name is only visible to registered members.Performance Monitoring und Reporting
Auf Vorschlag von Herrn Falk. Ich greife dieses Thema sehr gerne auf, denn ich selbst habe mannigfaltige Erfahrungen damit sammeln müssen.
-> Warum ist der SANavigator so langsam?
-> Wieso hat BMC damals ein (m.E. sehr gutes) Tool wieder abgeschafft?
-> Warum ist es einem so schwer gemacht, Systems Management und Storage Management Welten zu verheiraten?
Ich hoffe auf Diskussionen und mehr zu diesen und vielen anderen Themen...
- 25 Jan 2005, 11:04 pm
-
Thomas Brandt Premium Member Group moderatorThe company name is only visible to registered members.Re: Performance Monitoring und Reporting
Immer wieder stellt sich die Frage, wie, wo und was sind die Performance Informationen eines SANs. Es wird immer wieder über Performance im SAN gesprochen nur Frage ich mich wer hat eine Performance Baseline und wer überwacht sie regelmäßig?
Die SAN Performance ist eine Größe die sich vor allem aus den Latenzzeiten ergibt. Wo können die ermittelt werden? Die Switch Hersteller sagen "Wir haben die Informationen in unseren Switchen"... ja? Liefert das FC Protokoll eine Performance Information oder sind es eher statistische Daten? Die Storage Hersteller sagen "Wir liefern die Informationen..." Ja, und wie? Mit welchem Tool kann ich die Performance des Storage ermitteln und herausfinden wie lang die verstrichene Zeit von einer Serveranfrage bis zur Antwort an den Server ist?
Eines ist klar, die wirklichen Antworten befinden sich im SCSI Protokoll. Dort können genauestens die o.g. Informationen gemessen werden. Neben statistischen Informationen erhält man hier auch die Informationen über die Wartezeiten von Command-to-first-data, die Exchange-Completion-times und vieles mehr.
Diese Informationen plus die vielen anderen Informationen die sich in dem SCSI Layer finden lassen, führen dazu eine Ende-zu-Ende Messung von Antwortzeiten durchzuführen. Diese Informationen sind geeignet einen "SAN-Geschwindigkeitsmesser" zu installieren und obendrein noch ein Pro-Aktives Fehlerüberwachungstool zu erhalten, denn Fehler ergeben sich überwiegend auf dem SCSI Layer
Im Troubleshooting und Monitoring setzen wir genau diese Messungen ein. Sie sind Herstellerunabhängig, da sie durch Hardware TAPs (Test Access Points) direkt auf den Link zugreifen und damit auch in heterogenen Umgebungen einsetzbar sind.
Wie sind Ihre Erfahrungen mit Performance Messungen? Wie beurteilen Sie heute ob ein SAN performant ist? Wie betreiben Sie Pro-Aktives Fehlermanagement?
- 12 May 2005, 07:38 am
-
Post visible to registered members
-
Post visible to registered members
-
Thomas ReichardtThe company name is only visible to registered members.Re^3: Performance Monitoring und Reporting
Inzwischen sind ja auch etliche Performance-Parameter mit in SMI-S aufgenommen worden und mit geeigneter SAN-Managementsoftware lassen sich (nach Umsetzung dieser Möglichkeiten durch Tool und/oder HW-Hersteller) umfangreiche Analysen im Kontext der Gesamtumgebung (inkl. Trending/Alarming/Extrapolation) durchführen.
Über solche Storage-Management-Lösungen ist dann i.d.R. auch der Brückenschlag in System- und Servicemanagement gegeben, bis hin zur Befüllung von (federated) CMDB mit Informationen über Speicherkonfigurationen oder auch der Automatisierung von Changes als Reaktion auf bestimmte Performance Paramter.
Insofern kann ein entsprechendes Storagemanagement ganz wesentlich zur Überwindung von
- Informationsinseln,
- ineffizientem Betrieb,
- mangelhaftem Reporting
- langen/schweren Störungen durch unzureichende Analysemöglichkieten
- Abhängigkeiten von einzelnen Herstellern aufgrund von ...
- Abhängigkeit von spezifischem Knowhow einzelner Admins
aber auch zu besserer
- Planung
- Steuerung
- Kontrolle (z.B. Servicelevelüberwachung)
- Kostenverrechnung
- ...
beitragen.
- 24 Mar 2008, 8:20 pm
-
Thomas Brandt Premium Member Group moderatorThe company name is only visible to registered members.Re^4: Performance Monitoring und Reporting
Ja, ohne eine Datenbasis von Events und Metriken die auf einer Zeitachse verdichtet werden können, braucht man im Grunde keine Fehleranalyse beginnen.
Der Teufel der "Analyse" steckt dann später im Detail der Metriken und da stellen wir fest, dass selten Hersteller mit eigenen Tools in einer Eskalation durch einen Performance-Slow-Down, ausrecihend schnell und genau Fehler finden konnte. Es sollte aus unserer Sicht ergänzt werden. Durchschnittliche Applikationsperformance ist eben etwas anderes als die durchschnittliche Auslastung eines Links und nicht ganz so einfach zu ermitteln. Das aber neben anderen Metriken die i.d.R. nicht im FC Protokoll sondern im SCSI-Layer zu finden wären.
- 25 Mar 2008, 06:01 am
