Schwellenwert für proz. Verwendung der Sendewarteschlange

Microsoft.SystemCenter.HealthService.CollectionRule.Performance.SendQueuePercentUsedMonitor (UnitMonitor)

Dieser Monitor verfügt über 2 Schwellenwerte. Beim ersten Schwellenwert erhält dieser Monitor einen Warnungsstatus. Beim zweiten Schwellenwert erhält dieser Monitor einen kritischen Status.

Knowledge Base article:

Zusammenfassung

Dieser Monitor misst "Integritätsdienst-Verwaltungsgruppe\Prozentuale Verwendung der Sendewarteschlange" und generiert folgende Zustände:

Monitorstatus

Schwellenwert für proz. Verwendung der Sendewarteschlange

Achtung

50 %

Kritisch

60 %

Ursachen

Dies kann durch eine Verbindung mit niedriger Bandbreite oder hoher Latenz von diesem Integritätsdienst zu seinem übergeordneten Verwaltungsserver verursacht werden. Es kann auch durch Regeln verursacht werden, die mehr Daten erfassen, als der übergeordnete Verwaltungsserver erfassen kann; insbesondere, wenn an den übergeordneten Verwaltungsserver viele Agents Berichte mit hohen Datenmengen senden.

Lösungen

Prüfen Sie mit Ihren Netzwerkadministratoren, ob die Netzwerkverbindung vom Integritätsdienst zum übergeordneten Verwaltungsserver erschöpft ist. In diesem Fall müssen Sie möglicherweise Ihre Netzwerke aktualisieren, um den Datenverkehr aufzunehmen.

Wenn Sie Ihr Netzwerk nicht aktualisieren können (wenn z. B. Ihr Integritätsdienst oder Gatewayserver in einer eintfernten Zweigstelle ist), können Sie unnötige Sammlungsregeln deaktivieren. Es folgt eine Liste der Regeltypen, die Sie deaktivieren können, und der Auswirkungen ihrer Deaktivierung:

Regeltyp

Regelzweck

Auswirkung der Deaktivierung

Leistungssammlung

Erfasst Leistungsdaten für entweder die operative Datenbank oder das Data Warehouse oder beide

Wenn eine Leistungssammlungsregel deaktiviert ist, sind in allen Ansichten, die diese Leistungsdaten anzeigen, keine Daten mehr anzeigbar. Wenn die Regel Daten für das Data Warehouse erfasst, erzeugen von dieser Leistung abhängige Berichte keine Daten mehr.

Ereignissammlung

Erfasst Ereignisdaten für die Diagnose. In einigen Fällen ist eine Warnung für ein Ereignis nicht hilfreich, aber das Ereignis ist entweder für forensische Fehlerbehebung oder für echtzeitnahe Fehlerbehebung hilfreich.

Wenn eine Ereignissammlungsregel deaktiviert ist, sind in allen Ansichten, die diese Ereignisdaten anzeigen, keine Daten mehr anzeigbar. Wenn die Regel Daten für das Data Warehouse erfasste, erzeugen von diesem Ereignis abhängige Berichte keine Daten mehr.

Wenn Sie diese Daten noch brauchen, ist eine weitere Option, die Sie im System implementieren können, um die über das Netzwerk gesendeten Datenmengen zu reduzieren, die Verwendung optimierter Leistungs- und Ereigniskonsolidierungs-Sammlungsregeln. Die folgende Tabelle gibt ihren Nutzen an und erläutert, wie die Daten zusammengefasst werden.

Regeltyp

Nutzen

Zusammenfassung der Daten

Optimierte Leistungssammlungsregel

Sendet das Leistungsdatenmuster nur, wenn es innerhalb eines bestimmten Prozentbereichs vom letzten Muster abweicht. Wenn z. B. das letzte Muster 42 war und die Regel so konfiguriert war, dass sie ein neues Muster nur mit einer Toleranz von 10 % erfasst, muss das nächste Muster 42 +/- 4,2 einhalten (z. B. muss das nächste Muster größer als 46,2 oder kleiner als 37,8 sein)

Weil nur Leistungsdaten, welche die konfigurierte Toleranz überschreiten, an die operative Datenbank oder das Data Warehouse gesendet werden, sind die Daten unpräziser. Je größer die Toleranz, desto geringer ist die Präzision.

Konsolidierte Ereignissammlungsregel

Eine Ereignissammlungsregel von diesem Typ sendet die Daten, wenn einer der Parameter, mit denen sie konfiguriert ist, vom letzten Ereignis abweicht. Sie können z. B. eine konsolidierte Ereignissammlungsregel konfigurieren, um Ereignisse zu konsolidieren, wenn Folgendes identisch ist:

  • Ereignisquelle

  • Ereignis-ID

  • Quellencomputer

  • Beschreibung

Jetzt können Sie einen Zeitrahmen konfigurieren, um diese Ereignisse zu konsolidieren (z. B. 10 Minuten). Wenn die oben genannten Kriterien auf alle Ereignisse in diesem 10-minütigen Zeitfenster zutreffen, wird nur 1 Ereignis gesendet, wobei seine Eigenschaft "Zählwiederholung" inkrementiert wird. Wenn dieses Ereignis häufig an einem einzigen Agent aufgetreten ist, bedeutet das, dass innerhalb von 24 Stunden nur 144 Ereignisse gesendet wurden, was deutlich unter der Anzahl der Ereignisse liegen kann, die tatsächlich im Ereignisprotokoll protokolliert wurden

Sie müssen wissen, welche Ereignisparameter und -eigenschaften Sie konsolidieren können. Beispielsweise bedeutet das Konfigurieren der Beschreibung, dass, wenn die Ereignisbeschreibung normalerweise eindeutig ist (z. B. einen Benutzernamen enthält), dennoch viele Ereignisse gesendet werden. In diesem Beispiel sollten Sie stattdessen den Ereignisparameter konsolidieren, der das Benutzernamenfeld repräsentiert.

Die Auswirkungen eines sehr großen Konsolidierungsfensters sind:

  • Verzögerte Ereignisse in der Ereignisansicht oder den Berichten sichtbar (weil die Daten bis zum Ende dieses Konsolidierungsfensters konsolidiert werden müssen)

  • Leicht höhere Ressourcenbelegung durch den Agent. Bei einer niedrigen Anzahl von Konsolidierungsregeln kann das vernachlässigbar sein. Bei einer großen Anzahl dieser Regeltypen zusammen mit großen Konsolidierungsfenstern wird die Ressourcenbelegung entsprechend steigen.

Siehe Produkthilfe oder navigieren Sie in der Konsole zum Dokumenterstellungsbereich, um den oben genannten Regeltyp zu erstellen.

Element properties:

TargetMicrosoft.SystemCenter.Agent
Parent MonitorMicrosoft.SystemCenter.HealthService.PerformanceHealthRollup
CategoryPerformanceHealth
EnabledTrue
Instance NameHealth Service Management Groups
Counter NameSend Queue \% Used
Frequency180
Alert GenerateTrue
Alert SeverityError
Alert PriorityHigh
Alert Auto ResolveTrue
Monitor TypeSystem.Performance.DoubleThreshold
RemotableTrue
AccessibilityInternal
Alert Message
Vom Schwellenwert der prozentualen Verwendung der Sendewarteschlange generierte Warnung
Der aktuelle Wert von {0} liegt außerhalb des akzeptierten Schwellenwerts.
RunAsDefault

Source Code:

<UnitMonitor ID="Microsoft.SystemCenter.HealthService.CollectionRule.Performance.SendQueuePercentUsedMonitor" Accessibility="Internal" Enabled="true" Target="SCLibrary!Microsoft.SystemCenter.Agent" ParentMonitorID="Microsoft.SystemCenter.HealthService.PerformanceHealthRollup" Remotable="true" Priority="Normal" TypeID="Performance!System.Performance.DoubleThreshold" ConfirmDelivery="false">
<Category>PerformanceHealth</Category>
<AlertSettings AlertMessage="Microsoft.SystemCenter.HealthService.CollectionRule.Performance.SendQueuePercentUsedMonitor_AlertMessageResourceID">
<AlertOnState>Error</AlertOnState>
<AutoResolve>true</AutoResolve>
<AlertPriority>High</AlertPriority>
<AlertSeverity>Error</AlertSeverity>
<AlertParameters>
<AlertParameter1>$Data/Context/Value$</AlertParameter1>
</AlertParameters>
</AlertSettings>
<OperationalStates>
<OperationalState ID="BelowThreshold" MonitorTypeStateID="UnderThreshold1" HealthState="Success"/>
<OperationalState ID="BetweenThresholds" MonitorTypeStateID="OverThreshold1UnderThreshold2" HealthState="Warning"/>
<OperationalState ID="OverThreshold" MonitorTypeStateID="OverThreshold2" HealthState="Error"/>
</OperationalStates>
<Configuration>
<ComputerName>$Target/Host/Property[Type="Windows!Microsoft.Windows.Computer"]/NetworkName$</ComputerName>
<CounterName>Send Queue % Used</CounterName>
<ObjectName>Health Service Management Groups</ObjectName>
<InstanceName>$Target/ManagementGroup/Name$</InstanceName>
<AllInstances>false</AllInstances>
<Frequency>180</Frequency>
<Threshold1>50</Threshold1>
<Threshold2>60</Threshold2>
</Configuration>
</UnitMonitor>