Archiv für Mai, 2013

Kleine Einführung in einige vmware Performance Metriken und was sie bedeuten

Nach dem Artikel zur Metrik CPU.Ready nun eine weitere Metrik welche die CPU Analyse eine Virtuellen Maschine betrifft.

Heute – CPU.Usage

Unter den CPU Metriken einer VM kommt immer wieder die Metrik CPU.Usage auf. Was sagt diese nun aus?

Original vmware: Amount of actively used virtual CPU as a percentage of total available CPU.
CPU usage is the average CPU utilization over all available virtual CPUs in the virtual machine.“

Auf deutsch: „Menge der aktiv genutzten virtuellen CPUs [vCPU] einer VM als Prozentsatz der insgesamt verfügbaren physikalischen CPUs [pCPU]“

Ganz einfach erklärt

Prozentualer Anteil der Nutzung einer pCPU durch ein VM mit ihren vCPUs.

Beispiel: wenn eine VM eine CPU.Usage von 100% anzeigt, bedeutet das, das hier ein oder mehrere pCPUs zu 100% von dieser VM genutzt werden.

Metrik Berechung nach vmware Angaben:

Virtuelle CPU-Nutzung = MHz-Nutzung / (Anzahl an virtuellen CPUs × Core-Frequenz)

Fazit

Die Metrik CPU.Usage bezieht sich auf die pCPU Nutzung des Hostes und ist daher ein Indikator dafür, wie die vorhandenen physikalischen Cores des Hostes zur Zeit ausgelastet sind. Daher sollten immer mehrere VMs eines Hostes betrachtet werden, um z.B. zu analysieren welche VMs den Host entsprechend belasten und Rückschlüsse auf das „Warum“ zu finden. Dieses könnten Ressource Einstellungen (Reservation) in der VM oder einem Ressource Pool, bis hin zu gesetzten CPU Affinitäten sein.

Es ist durchaus möglich, das Engpässe im Bereich Memory oder Storage indirekt zu erhöhter vCPU Last führt, was wiederum in einer hohen CPU.Usage endet.

Kleine Einführung in einige vmware Performance Metriken und was sie bedeuten

Mit diesem Artikel möchte ich eine kleine lose Reihe von Artikeln zu diversen vmware Performance Metriken starten. Sicher ist zu den meisten schon einiges geschrieben worden, doch stelle ich immer wieder fest das vielfach nicht wirklich bekannt ist was eine Metrik aussagt. Ohne diese Kenntniss sind die Messwerte die z.B. der vCenter Server oder esxtop oder vCenter Operations Manager ausgeben wenig Wert. Daher diese kleine Reihe. Gern nehme ich auch Anregungen auf was gefagt ist!

Heute – CPU.Ready

Unter den CPU Metriken einer VM kommt immer wieder die Metrik CPU.Ready auf. Was sagt diese nun aus?

„Percentage of time that the virtual machine was ready, but could not get scheduled to run on the physical CPU. CPU.Ready time is dependent on the number of virtual machines on the host and their CPU loads.“

Auf deutsch: „Prozentualer Zeitanteil einer virtuelle Maschine welche die VM auf physikalische CPU Zuteilung wartet“

Ganz einfach erklärt

Jeder Hypervisor ist gleichzeitig ein geschedultes System! Solange keinerlei Overcommitment vorliegt, kann jede Ressource genutzt werden. Dieses gilt auch für den Zusammenhang zwischen physikalischer CPU [pCPU] und virtueller CPU [vCPU].

Im Falle den (fast normalen) Overcommitment von vCPUs auf einem HOST (mehr vCPUs als in Summe pCPUs – Cores) wird es nun spannend. Was passiert nun? Der vmkernel muß nun die einzelnen Anforderungen der vCPUs bzw. VMs schedulen.

Für 1 vCPU VMs ist das meist recht einfach. Bei SMP bzw. mehr vCPU VMs wird das schon schwerer, denn für eine z.B. 4 vCPU VM muß der vmkernel 4 parallele pCPU Slots finden. Das kann schon mal dauern (siehe „vmware Resource Techniken – CPUs und Multi vCPUs (SMP)„).

CPU.Ready wird an den meisten Stellen entweder in Millisekunden [ms] Wartezeit, oder in % des gesamt zur Verfügung stehen Zeitraums angegeben.

Fazit

Je höher die CPU.Ready Time ist desto schlechter für die VM und somit für die Performance der VM! Wie im genannten Artikel schon beschrieben ist eben hier oft weniger – mehr. (siehe auch hier „Gabes virtual World„)

Hoffentlich demnächst mehr. Welche Metriken sind am interessantesten?

Alles heisst nun Foglight! vkernel vOPS jetzt Foglight Standard – 02Eindrücke

Nach längerer Zeit habe ich mir mal wieder etwas Zeit gehabt die aktuelle Version von Foglight Standard (ehemals vkernel vOPS) anzutesten.

Versiion6.5Wie beeits beim ersten Begutachten vor einiger Zeit, macht diese Monitoring Lösung einen sehr guten Eindruck. Das wesentliche wird kurz und übersichtlich dargestellt. Performance Bottelnecks sind relativ leicht aufzuspüren und werden einfach, aber effektiv dargestellt.

Hier das Main Dashbord als erste Übersicht:

vOPS_MainDashbordMan bekommt einen guten Überblick zur gesamten vmware Umgebung. Anzahl der Objekte, physikalische Ressourcen, virtuelle Ressourcen usw.

Interessant sind aber vor allem die Auswertungen die Foglight Standard liefert (siehe roter Pfeil).

Installation

Die Installation von Foglight Standard erfolgt als fertige OVF Appliance. Sollte also von jedem vmware Admin durchführbar sein.

Intern arbeitet die Appliance mit einer Postgres DB (vmware nutzt die ja nun auch ;-)). Es kann aber auch MS SQL oder Oracle verwendet werden. Eine Datenmigration ist scheibar problemlos möglich. Hab ich aber nicht ausprobiert.

Auswertungen am Beispiel Datastore Latency

Klickt man im Main Deshbord z.B. auf den, vom roten Pfeil, gezeigten Link, bekommt man ein gute Übersicht der aktuellen Latenzen auf den Datastores (uns mehr)

vOPS_Latency_DatastoresDurch die Pfeile wird schnell sichtbar wo geg. Engpässe vorhanden sind oder drohen, dabei werden trotzdem aktuelle Messerte angezeigt.

Auch hier muß daran erinnert werden: „Nur Messwerte die mir etwas sagen, bzw. die ich interpretieren kann“ nützen mir“

Da hilft dann oft das Dokument aus gleicher Quelle wir diese Lösung „The Top 20 VMware Performance Metrics You Should Care About

Geht man nun mit der Maus über solch ein Feld (z.B. Total Latency) erhält man alle Werte noch einmal in einem Popup Fenster angezeigt (siehe Beispiel Summary Dashbord). Ein Doppelklich gibt nun detailierte Infos zum Problem, dem Impact und gegebenenfalls auch zur Lösung (Resolution).

vOPS_Summary

Also rundum eine einfache aber effektive Lösung für alle die nichts selbst konfigurieren wollen und denen die vorhandenen Ansichten ausreichen.

Konfigurationsmöglichkeiten – Reporting

Nichts desto Trotz kann man auch in Foglight Standard das eine oder andere Anpassen. Diese bezieht sich hauptsächlich auf Analysefunktionen, aber auch auf Kapazitätsberechnungen.

Beispiel: Slotsizes für die vmware HA Admission Control Policies

vOPS_SlotSizesHier kann man schön die optimale Einstellung für die eigene Umgebung finden.

Fazit

Eine gute und praxistaugliche Lösung. Installation ist denkbar einfach. Bedienung nach kurzer Lehrnphase logisch aufgebaut. Felxibilität aber eingeschränkt. Wer mehr will oder braucht muß auf Foglight for Virtualization (vFoglight Pro) oder andere Lösunge (wie vmware vCenter Operations Manager) ausweichen.