Send Queue \% Used

Microsoft.SystemCenter.HealthService.CollectionRule.Performance.SendQueuePercentUsedMonitor (UnitMonitor)

This monitor measures the Health Service Management Groups\Send Queue \% Used counter for the Health service.

Knowledge Base article:

Zusammenfassung

This monitor measures the Health Service Management Groups\Send Queue % Used and generates the following states:

Monitorstatus

Send Queue % Used Threshold

Warnung

50 %

Kritisch

60 %

Ursachen

Dies kann durch eine niedrige Bandbreite oder hohe Latenz der Verbindung zwischen diesem Integritätsdienst der System Center-Verwaltung und dem übergeordneten Verwaltungsserver verursacht werden. Es kann auch durch Regeln verursacht werden, die mehr Daten erfassen, als der übergeordnete Verwaltungsserver erfassen kann; insbesondere, wenn an den übergeordneten Verwaltungsserver viele Agents Berichte mit hohen Datenmengen senden.

Lösungen

Prüfen Sie mit Ihren Netzwerkadministratoren, ob die Netzwerkverbindung zwischen Integritätsdienst der System Center-Verwaltung und übergeordnetem Verwaltungsserver gesättigt ist. In diesem Fall müssen Sie möglicherweise Ihre Netzwerke aktualisieren, um den Datenverkehr aufzunehmen.

Wenn Sie Ihr Netzwerk nicht aktualisieren können (wenn sich z. B. der Integritätsdienst der System Center-Verwaltung oder Gatewayserver in einer entfernten Zweigstelle befinden), können Sie unnötige Sammlungsregeln deaktivieren. Es folgt eine Liste der Regeltypen, die Sie deaktivieren können, und der Auswirkungen ihrer Deaktivierung:

Regeltyp

Regelzweck

Auswirkung der Deaktivierung

Leistungssammlung

Sammelt Leistungsdaten für die operative Datenbank und/oder das Data Warehouse

Wenn eine Leistungssammlungsregel deaktiviert ist, sind in allen Ansichten, die diese Leistungsdaten anzeigen, keine Daten mehr anzeigbar. Wenn die Regel Daten für das Data Warehouse sammelt, erzeugen von dieser Leistung abhängige Berichte keine Daten mehr.

Ereignissammlung

Sammelt Ereignisdaten für die Diagnose. In einigen Fällen ist eine Warnung für ein Ereignis nicht hilfreich, aber das Ereignis ist entweder für forensische Fehlerbehebung oder für echtzeitnahe Fehlerbehebung hilfreich.

Wenn eine Ereignissammlungsregel deaktiviert ist, sind in allen Ansichten, die diese Ereignisdaten anzeigen, keine Daten mehr anzeigbar. Wenn die Regel Daten für das Data Warehouse sammelte, erzeugen von diesem Ereignis abhängige Berichte keine Daten mehr.

Wenn Sie diese Daten noch brauchen, ist eine weitere Option, die Sie im System implementieren können, um die über das Netzwerk gesendeten Datenmengen zu reduzieren, die Verwendung optimierter Leistungs- und Ereigniskonsolidierungs-Sammlungsregeln. Die folgende Tabelle gibt ihren Nutzen an und erläutert, wie die Daten zusammengefasst werden.

Regeltyp

Nutzen

Zusammenfassung der Daten

Optimierte Leistungssammlungsregel

Only sends the performance data sample if it deviates from the last sample within some percentage. E.g., if the last sample was 42, and the rule was configured to only collect to a new sample with a tolerance of 10%, the next sample will need to 42 +/- 4.2 (e.g. next sample needs to be greater than 46.2 or less than 37.8)

Weil nur Leistungsdaten, welche die konfigurierte Toleranz überschreiten, an die operative Datenbank oder das Data Warehouse gesendet werden, sind die Daten unpräziser. Je größer die Toleranz, desto geringer ist die Präzision.

Konsolidierte Ereignissammlungsregel

Eine Ereignissammlungsregel von diesem Typ sendet die Daten, wenn einer der Parameter, mit denen sie konfiguriert ist, vom letzten Ereignis abweicht. Sie können z. B. eine konsolidierte Ereignissammlungsregel konfigurieren, um Ereignisse zu konsolidieren, wenn Folgendes identisch ist:

  • Ereignisquelle

  • Ereignis-ID

  • Quellencomputer

  • Beschreibung

Jetzt können Sie einen Zeitrahmen konfigurieren, um diese Ereignisse zu konsolidieren (z. B. 10 Minuten). Wenn die oben genannten Kriterien auf alle Ereignisse in diesem 10-minütigen Zeitfenster zutreffen, wird nur ein Ereignis gesendet, wobei seine Eigenschaft "Wiederholungsanzahl" inkrementiert wird. Wenn dieses Ereignis häufig an einem einzigen Agent aufgetreten ist, bedeutet das, dass innerhalb von 24 Stunden nur 144 Ereignisse gesendet wurden, was deutlich unter der Anzahl der Ereignisse liegen kann, die tatsächlich im Ereignisprotokoll protokolliert wurden

Sie müssen wissen, welche Ereignisparameter und -eigenschaften Sie konsolidieren können. Beispielsweise bedeutet das Konfigurieren der Beschreibung, dass, wenn die Ereignisbeschreibung normalerweise eindeutig ist (z. B. einen Benutzernamen enthält), dennoch viele Ereignisse gesendet werden. In diesem Beispiel sollten Sie stattdessen den Ereignisparameter konsolidieren, der das Benutzernamenfeld repräsentiert.

Die Auswirkungen eines sehr großen Konsolidierungsfensters sind:

  • Verzögerte Ereignisse in der Ereignisansicht oder den Berichten sichtbar (weil die Daten bis zum Ende dieses Konsolidierungsfensters konsolidiert werden müssen)

  • Leicht höhere Ressourcenbelegung durch den Agent. Bei einer niedrigen Anzahl von Konsolidierungsregeln kann das vernachlässigbar sein. Bei einer großen Anzahl dieser Regeltypen zusammen mit großen Konsolidierungsfenstern wird die Ressourcenbelegung entsprechend steigen.

Siehe Produkthilfe oder navigieren Sie in der Konsole zum Dokumenterstellungsbereich, um den oben genannten Regeltyp zu erstellen.

Element properties:

TargetMicrosoft.SystemCenter.Agent
Parent MonitorMicrosoft.SystemCenter.HealthService.PerformanceHealthRollup
CategoryPerformanceHealth
EnabledTrue
Alert GenerateTrue
Alert SeverityError
Alert PriorityHigh
Alert Auto ResolveTrue
Monitor TypeMicrosoft.SystemCenter.HealthService.ConsecutiveSampleDoubleThreshold
RemotableTrue
AccessibilityPublic
Alert Message
{0}: Die Sendewarteschlange des Integritätsdiensts auf diesem System füllt sich
When the System Center Management Health Service is receiving data faster than it can send that data out, it will begin queuing the excess data. The queue has a fixed size and if that is reached, then the Health Service will start grooming data out of the queue. When this alert was generated, the "Send Queue \% Used" counter for this system was {0}. Refer to the knowledge for more details on possible causes and troubleshooting steps.
RunAsDefault

Source Code:

<UnitMonitor ID="Microsoft.SystemCenter.HealthService.CollectionRule.Performance.SendQueuePercentUsedMonitor" Accessibility="Public" Enabled="true" Target="SCLibrary!Microsoft.SystemCenter.Agent" ParentMonitorID="Microsoft.SystemCenter.HealthService.PerformanceHealthRollup" Remotable="true" Priority="Normal" TypeID="Microsoft.SystemCenter.HealthService.ConsecutiveSampleDoubleThreshold" ConfirmDelivery="false">
<Category>PerformanceHealth</Category>
<AlertSettings AlertMessage="Microsoft.SystemCenter.HealthService.CollectionRule.Performance.SendQueuePercentUsedMonitor_AlertMessageResourceID">
<AlertOnState>Error</AlertOnState>
<AutoResolve>true</AutoResolve>
<AlertPriority>High</AlertPriority>
<AlertSeverity>Error</AlertSeverity>
<AlertParameters>
<AlertParameter1>$Data/Context/Value$</AlertParameter1>
</AlertParameters>
</AlertSettings>
<OperationalStates>
<OperationalState ID="BelowThreshold" MonitorTypeStateID="UnderWarningThreshold" HealthState="Success"/>
<OperationalState ID="BetweenThresholds" MonitorTypeStateID="OverWarningThresholdUnderErrorThreshold" HealthState="Warning"/>
<OperationalState ID="OverThreshold" MonitorTypeStateID="OverErrorThreshold" HealthState="Error"/>
</OperationalStates>
<Configuration>
<ComputerName>$Target/Host/Property[Type="Windows!Microsoft.Windows.Computer"]/NetworkName$</ComputerName>
<CounterName>Send Queue % Used</CounterName>
<ObjectName>Health Service Management Groups</ObjectName>
<InstanceName>$Target/ManagementGroup/Name$</InstanceName>
<AllInstances>false</AllInstances>
<Frequency>180</Frequency>
<PercentFull>95</PercentFull>
<NumSamples>3</NumSamples>
<WarningThreshold>90</WarningThreshold>
<ErrorThreshold>95</ErrorThreshold>
</Configuration>
</UnitMonitor>