\% využití fronty pro odeslání

Microsoft.SystemCenter.HealthService.CollectionRule.Performance.SendQueuePercentUsedMonitor (UnitMonitor)

Toto monitorování vyhodnocuje čítač skupin pro správu služby Health Service\\% využití fronty pro odeslání ve službě stavu.

Knowledge Base article:

Souhrn

Toto sledování měří skupiny správy služby Health\Send Queue % Used a generuje následující stavy:

Stav sledování

Prahová hodnota Send Queue % Used

Varování

50 %

Kritický

60 %

Příčiny

Může to být způsobeno malou šířkou pásma nebo vysokou latencí připojení z této služby System Center Management Health k jejímu nadřazenému serveru. Může to být také způsobeno pravidly, která shromažďují více dat, než může nadřazený server pro správu zpracovat; obzvláště pokud má server pro správu mnoho agentů, kteří se mu hlásí zasíláním velkého množství dat.

Řešení

S pomocí správce sítě zkontrolujte, zda je síťové připojení mezi službou System Center Management Health a serverem pro správu nasyceno. Pokud ano, budete možná muset provést upgrade vašich sítí, abyste uspokojili provoz.

Pokud nemůžete provést upgrade sítě (například pokud je služba System Center Management Health nebo server brány ve vzdálené pobočce), můžete nepotřebná pravidla shromažďování vypnout. Níže je seznam typů pravidel, která můžete vypnout, a celkový vliv tohoto vypnutí:

Typ pravidla

Účel pravidla

Dopad po vypnutí

Kolekce výkonu

Shromažďuje údaje o výkonu do operační databáze, do datového skladu nebo do obou

Pokud pravidlo kolekce výkonu zakážete, všechna zobrazení, která ukazují údaje o výkonu, nebudou mít zobrazitelná data. Pokud toto pravidlo shromažďovalo data do datového skladu, tak sestavy závislé na tomto výkonu už nebudou zobrazovat žádná data.

Kolekce událostí

Shromažďuje data událostí pro diagnózu. V některých případech nám událost nemusí být užitečná pro tvorbu výstrah, ale může se hodit pro forenzní řešení potíží nebo řešení potíží v reálném čase.

Pokud pravidlo kolekce události zakážete, všechna zobrazení, která ukazují tuto událost, nebudou mít zobrazitelná data. Pokud toto pravidlo shromažďovalo data do datového skladu, tak sestavy závislé na této události už nebudou zobrazovat žádná data.

Pokud tato data i nadále potřebujete, můžete do systému zaimplementovat další možnost, která pomůže snížit množství dat posílaných prostřednictvím sítě, a sice optimalizované kolekce pravidel čítače výkonu a kolekce pravidel konsolidace událostí. Níže uvedená tabulka shrnuje jejich výhody a vysvětluje, jak se data sumarizují.

Typ pravidla

Výhoda

Jak se sumarizují data

Pravidlo kolekce optimalizovaného výkonu

Odesílá vzorek dat o výkonu pouze tehdy, když se tato data odchylují od posledního vzorku o určitý počet procent. Pokud měl například poslední vzorek 42 a pravidlo bylo nakonfigurováno pouze pro shromažďování nových vzorků s tolerancí 10 %, bude další vzorek potřebovat 42 +/- 4.2 (např. další vzorek musí být větší než 46.2 nebo menší než 37.8)

Protože se do operační databáze nebo datového skladu posílají pouze ta data výkonu, která přesahují nakonfigurovanou toleranci, budou data méně přesná. Čím větší tolerance, tím menší přesnost.

Pravidlo kolekce konsolidované události

Tento typ pravidla pro kolekci událostí odesílá data tehdy, když je jeden z parametrů, s nimiž je nakonfigurován, liší od poslední události. Můžete například nakonfigurovat konsolidované pravidlo kolekce pro konsolidaci událostí, ve kterých se shoduje:

  • Zdroj události

  • ID události

  • Zdrojový počítač

  • Popis

Poté můžete nakonfigurovat časové rozmezí pro konsolidaci těchto událostí (např. 10 minut). Pokud se výše uvedená kritéria shodují v každé události, tak se v rámci tohoto 10minutového okna odešle pouze 1 událost se správně zvýšeným počtem opakování. Pokud se tato událost vyskytovala často na jednom agentovi, znamená to, že během období 24 hodin bude odesláno pouze 144 událostí, což může být výrazně méně než počet událostí, které jsou zaznamenány v protokolu událostí

Musíte vědět, které parametry a vlastnosti události konsolidujete. Konfigurace popisu bude například znamenat, že pokud je popis události obvykle jedinečný (obsahuje například uživatelské jméno), tak budete stále dostávat mnoho událostí. Namísto toho můžete například konsolidovat Parametr události, který představuje položku uživatelského jména.

Velmi velké okno konsolidace ovlivní také:

  • Zpožděné události zobrazitelné v Zobrazení události nebo Sestavách (protože data je nutné konsolidovat až do ukončení tohoto konsolidačního okna)

  • Mírně zvýšené využití prostředků na agentovi. Při malém počtu pravidel konsolidace to může být nepatrné. Při obrovském množství těchto typů pravidel kombinovaných s dlouhým oknem konsolidace se využití prostředků zvýší odpovídajícím způsobem.

Přečtěte si nápovědu k produktu nebo přejděte v konzole do pracovního prostoru Vytváření a vytvořte typ pravidel uvedených výše.

Element properties:

TargetMicrosoft.SystemCenter.Agent
Parent MonitorMicrosoft.SystemCenter.HealthService.PerformanceHealthRollup
CategoryPerformanceHealth
EnabledTrue
Alert GenerateTrue
Alert SeverityError
Alert PriorityHigh
Alert Auto ResolveTrue
Monitor TypeMicrosoft.SystemCenter.HealthService.ConsecutiveSampleDoubleThreshold
RemotableTrue
AccessibilityPublic
Alert Message
{0}: Probíhá naplňování fronty pro odeslání služby stavu v tomto systému.
Pokud služba stavu správy nástroje System Center přijímá data rychleji, než může data odeslat, začne nadbytečná data řadit do fronty. Fronta má pevnou velikost, a pokud je dosažena, tak začne služba stavu rozdělovat data ven z fronty. Při generování této výstrahy měl čítač „\% využití fronty pro odeslání“ pro tento systém hodnotu {0}. Další podrobnosti o možných příčinách a krocích při řešení potíží naleznete ve znalostní bázi.
RunAsDefault

Source Code:

<UnitMonitor ID="Microsoft.SystemCenter.HealthService.CollectionRule.Performance.SendQueuePercentUsedMonitor" Accessibility="Public" Enabled="true" Target="SCLibrary!Microsoft.SystemCenter.Agent" ParentMonitorID="Microsoft.SystemCenter.HealthService.PerformanceHealthRollup" Remotable="true" Priority="Normal" TypeID="Microsoft.SystemCenter.HealthService.ConsecutiveSampleDoubleThreshold" ConfirmDelivery="false">
<Category>PerformanceHealth</Category>
<AlertSettings AlertMessage="Microsoft.SystemCenter.HealthService.CollectionRule.Performance.SendQueuePercentUsedMonitor_AlertMessageResourceID">
<AlertOnState>Error</AlertOnState>
<AutoResolve>true</AutoResolve>
<AlertPriority>High</AlertPriority>
<AlertSeverity>Error</AlertSeverity>
<AlertParameters>
<AlertParameter1>$Data/Context/Value$</AlertParameter1>
</AlertParameters>
</AlertSettings>
<OperationalStates>
<OperationalState ID="BelowThreshold" MonitorTypeStateID="UnderWarningThreshold" HealthState="Success"/>
<OperationalState ID="BetweenThresholds" MonitorTypeStateID="OverWarningThresholdUnderErrorThreshold" HealthState="Warning"/>
<OperationalState ID="OverThreshold" MonitorTypeStateID="OverErrorThreshold" HealthState="Error"/>
</OperationalStates>
<Configuration>
<ComputerName>$Target/Host/Property[Type="Windows!Microsoft.Windows.Computer"]/NetworkName$</ComputerName>
<CounterName>Send Queue % Used</CounterName>
<ObjectName>Health Service Management Groups</ObjectName>
<InstanceName>$Target/ManagementGroup/Name$</InstanceName>
<AllInstances>false</AllInstances>
<Frequency>180</Frequency>
<PercentFull>95</PercentFull>
<NumSamples>3</NumSamples>
<WarningThreshold>90</WarningThreshold>
<ErrorThreshold>95</ErrorThreshold>
</Configuration>
</UnitMonitor>