Toto monitorování vyhodnocuje čítač skupin pro správu služby Health Service\\% využití fronty pro odeslání ve službě stavu.
Toto sledování měří skupiny správy služby Health\Send Queue % Used a generuje následující stavy:
Stav sledování | Prahová hodnota Send Queue % Used |
Kritický | 60 % |
Může to být způsobeno malou šířkou pásma nebo vysokou latencí připojení z této služby System Center Management Health k jejímu nadřazenému serveru. Může to být také způsobeno pravidly, která shromažďují více dat, než může nadřazený server pro správu zpracovat; obzvláště pokud má server pro správu mnoho agentů, kteří se mu hlásí zasíláním velkého množství dat.
S pomocí správce sítě zkontrolujte, zda je síťové připojení mezi službou System Center Management Health a serverem pro správu nasyceno. Pokud ano, budete možná muset provést upgrade vašich sítí, abyste uspokojili provoz.
Pokud nemůžete provést upgrade sítě (například pokud je služba System Center Management Health nebo server brány ve vzdálené pobočce), můžete nepotřebná pravidla shromažďování vypnout. Níže je seznam typů pravidel, která můžete vypnout, a celkový vliv tohoto vypnutí:
Typ pravidla | Účel pravidla | Dopad po vypnutí |
Kolekce výkonu | Shromažďuje údaje o výkonu do operační databáze, do datového skladu nebo do obou | Pokud pravidlo kolekce výkonu zakážete, všechna zobrazení, která ukazují údaje o výkonu, nebudou mít zobrazitelná data. Pokud toto pravidlo shromažďovalo data do datového skladu, tak sestavy závislé na tomto výkonu už nebudou zobrazovat žádná data. |
Kolekce událostí | Shromažďuje data událostí pro diagnózu. V některých případech nám událost nemusí být užitečná pro tvorbu výstrah, ale může se hodit pro forenzní řešení potíží nebo řešení potíží v reálném čase. | Pokud pravidlo kolekce události zakážete, všechna zobrazení, která ukazují tuto událost, nebudou mít zobrazitelná data. Pokud toto pravidlo shromažďovalo data do datového skladu, tak sestavy závislé na této události už nebudou zobrazovat žádná data. |
Pokud tato data i nadále potřebujete, můžete do systému zaimplementovat další možnost, která pomůže snížit množství dat posílaných prostřednictvím sítě, a sice optimalizované kolekce pravidel čítače výkonu a kolekce pravidel konsolidace událostí. Níže uvedená tabulka shrnuje jejich výhody a vysvětluje, jak se data sumarizují.
Typ pravidla | Výhoda | Jak se sumarizují data |
Pravidlo kolekce optimalizovaného výkonu | Odesílá vzorek dat o výkonu pouze tehdy, když se tato data odchylují od posledního vzorku o určitý počet procent. Pokud měl například poslední vzorek 42 a pravidlo bylo nakonfigurováno pouze pro shromažďování nových vzorků s tolerancí 10 %, bude další vzorek potřebovat 42 +/- 4.2 (např. další vzorek musí být větší než 46.2 nebo menší než 37.8) | Protože se do operační databáze nebo datového skladu posílají pouze ta data výkonu, která přesahují nakonfigurovanou toleranci, budou data méně přesná. Čím větší tolerance, tím menší přesnost. |
Pravidlo kolekce konsolidované události | Tento typ pravidla pro kolekci událostí odesílá data tehdy, když je jeden z parametrů, s nimiž je nakonfigurován, liší od poslední události. Můžete například nakonfigurovat konsolidované pravidlo kolekce pro konsolidaci událostí, ve kterých se shoduje:
Poté můžete nakonfigurovat časové rozmezí pro konsolidaci těchto událostí (např. 10 minut). Pokud se výše uvedená kritéria shodují v každé události, tak se v rámci tohoto 10minutového okna odešle pouze 1 událost se správně zvýšeným počtem opakování. Pokud se tato událost vyskytovala často na jednom agentovi, znamená to, že během období 24 hodin bude odesláno pouze 144 událostí, což může být výrazně méně než počet událostí, které jsou zaznamenány v protokolu událostí | Musíte vědět, které parametry a vlastnosti události konsolidujete. Konfigurace popisu bude například znamenat, že pokud je popis události obvykle jedinečný (obsahuje například uživatelské jméno), tak budete stále dostávat mnoho událostí. Namísto toho můžete například konsolidovat Parametr události, který představuje položku uživatelského jména. Velmi velké okno konsolidace ovlivní také:
|
Přečtěte si nápovědu k produktu nebo přejděte v konzole do pracovního prostoru Vytváření a vytvořte typ pravidel uvedených výše.
Target | Microsoft.SystemCenter.HealthService | ||
Parent Monitor | Microsoft.SystemCenter.HealthService.PerformanceHealthRollup | ||
Category | PerformanceHealth | ||
Enabled | True | ||
Instance Name | Health Service Management Groups | ||
Counter Name | Send Queue \% Used | ||
Frequency | 60 | ||
Alert Generate | True | ||
Alert Severity | Error | ||
Alert Priority | High | ||
Alert Auto Resolve | True | ||
Monitor Type | System.Performance.ConsecutiveSamplesThreshold | ||
Remotable | True | ||
Accessibility | Public | ||
Alert Message |
| ||
RunAs | Default |
<UnitMonitor ID="Microsoft.SystemCenter.HealthService.Performance.SendQueuePercentUsedMonitor" Accessibility="Public" Enabled="true" Target="SCLibrary!Microsoft.SystemCenter.HealthService" ParentMonitorID="Microsoft.SystemCenter.HealthService.PerformanceHealthRollup" Remotable="true" Priority="Normal" TypeID="Performance!System.Performance.ConsecutiveSamplesThreshold" ConfirmDelivery="false">
<Category>PerformanceHealth</Category>
<AlertSettings AlertMessage="Microsoft.SystemCenter.HealthService.Performance.SendQueuePercentUsedMonitor.AlertMessage">
<AlertOnState>Error</AlertOnState>
<AutoResolve>true</AutoResolve>
<AlertPriority>High</AlertPriority>
<AlertSeverity>Error</AlertSeverity>
<AlertParameters>
<AlertParameter1>$Data/Context/Value$</AlertParameter1>
</AlertParameters>
</AlertSettings>
<OperationalStates>
<OperationalState ID="BelowThreshold" MonitorTypeStateID="ConditionFalse" HealthState="Success"/>
<OperationalState ID="OverThreshold" MonitorTypeStateID="ConditionTrue" HealthState="Error"/>
</OperationalStates>
<Configuration>
<ComputerName>$Target/Host/Property[Type="Windows!Microsoft.Windows.Computer"]/NetworkName$</ComputerName>
<CounterName>Send Queue % Used</CounterName>
<ObjectName>Health Service Management Groups</ObjectName>
<InstanceName>$Target/ManagementGroup/Name$</InstanceName>
<AllInstances>false</AllInstances>
<Frequency>60</Frequency>
<Threshold>90</Threshold>
<Direction>greaterequal</Direction>
<NumSamples>5</NumSamples>
</Configuration>
</UnitMonitor>