Bewaak alle agentprocessen om mogelijke agentproblemen met betrekking tot processortijd te identificeren.
Deze monitor berekent het totale CPU-gebruik van de Operations Manager-agent en de verwante processen. De monitor genereert een waarschuwing wanneer het CPU-gebruik boven een opgegeven drempelwaarde komt voor het opgegeven aantal opeenvolgende steekproeven.
Door het onderliggende script voor deze monitor wordt het CPU-gebruik steekproefgewijs bepaald voor het agentproces van Operations Manager (HealthService.exe), het onderliggende bewakingshostproces (MonitoringHost.exe) en de onderliggende processen van die bewakingshostprocessen (cscript.exe, PowerShell.exe, etc.). De berekening wordt door het script drie keer uitgevoerd. Het gemiddelde van de drie opeenvolgende steekproeven wordt als resultaat door deze monitor gebruikt om te bepalen of de status Kritiek of In orde is.
U kunt overschrijvingen gebruiken om de volgende parameters aan te passen en zo het standaardgedrag van deze monitor te wijzigen:
Frequentie (seconden). Dit is de frequentie waarmee de monitor steekproeven neemt van het processorgebruik van de agent. In de standaardinsteling evalueert de monitor het processorgebruik van de agent om de 300 seconden (5 minuten).
Het aantal opeenvolgende steekproeven voor de kritieke status. In de standaardinstelling wordt door deze monitor een kritieke status gemeld wanneer de opgegeven drempelwaarde bij 6 opeenvolgende steekproeven is overschreden.
Het aantal opeenvolgende steekproeven voor de status In orde. In de standaardinstelling wordt door deze monitor een status In orde gemeld wanneer 3 opeenvolgende steekproeven onder de opgegeven drempelwaarde blijven.
Drempelwaarde. Standaard is de drempel voor het CPU-gebruik 25%.
Deze monitor is standaard uitgeschakeld voor alle beheerservers.
Bovenmatig CPU-gebruik van verschillende Operations Manager-agentprocessen is mogelijk een indicatie dat de agent of een van de onderliggende afhankelijke processen niet goed functioneren. Als de agent en de onderliggende afhankelijke processen juist zijn bijgewerkt, dan wordt de agent op het bewaakte systeem te veel gebruikt. Dit is mogelijk kortstondig door een recente update in de beheergroep, zoals de implementatie van een nieuw management pack, of het is vanwege een daadwerkelijke overbelasting van de agent. In het laatste geval is afstemming vereist.
Controleer het volgende om ervoor te zorgen dat de agent en de onderliggende afhankelijkheden goed functioneren:
Controleer of de meest recente versie van de Operations Manager-agent op het systeem is geïnstalleerd.
Controleer of de update voor MSXML 6.0 van Knowledge Base artikel 968967 (http://go.microsoft.com/fwlink/?LinkId=181885) is geïnstalleerd.
Als de computer met het besturingssysteem Windows XP, Windows 2000 Server of Windows Server 2003 werkt, moet u ervoor zorgen dat Windows Script Host 5.7 of hoger op de computer wordt uitgevoerd. Via de volgende koppeling kunt u Windows Script Host 5.7 downloaden http://go.microsoft.com/fwlink/?LinkId=181884.
Als het probleem aanhoudt nadat die configuraties zijn gecontroleerd, dan is nadere analyse nodig om te begrijpen wat de oorzaak is van het CPU-gebruik. Onderzoek het probleem verder met een combinatie van de volgende stappen:
Controleer de recente geschiedenis van het processorgebruik van de agent, het aantal werkstromen en modules met de volgende weergave: Weergave van agentprestaties Aan de hand van de gegevens van het processorgebruik van de agent kunt u zien of het een recent probleem is of dat het al enige tijd optreedt. Aan de hand van de werkstroom- en moduleitemgegevens krijgt u een indicatie van de belasting die door de verschillende regels, monitors en detecties op de agent worden uitgeoefend. Deze gegevens moeten ook worden vergeleken met agents die in orde zijn.
Gebruik een hulpprogramma als Effective Configuration Viewer (Viewer van effectieve configuraties) (http://go.microsoft.com/fwlink/?LinkId=182300) om het aantal klasse-instanties dat op de agent is gedetecteerd te begrijpen. Meer klasse-instanties kunnen resulteren in een groter aantal werkstromen en modules, die op hun beurt tot een hogere belasting kunnen leiden.
Gebruik de prestatiemeter om gedetailleerde metingen voor het Percentage processortijd van het procesobject te verzamelen. Hierdoor krijgt u inzicht in welke processen voor het grootste deel bijdragen aan het totale processorgebruik.
Controleer of recente updates of wijzigingen van management packs overeenkomen met de toename in CPU-gebruik.
Neem na het vaststellen van de oorzaak of oorzaken een van de volgende stappen om het probleem op te lossen:
Als er onlangs iets in een management pack is gewijzigd of een nieuw management pack is geïmplementeerd, moet u de situatie goed in de gaten houden om te zien of het probleem aanhoudt.
Verminder de frequentie van detecties door deze tijdelijk uit te schakelen en zo het CPU-gebruik over de hele dag te verdelen. Het nadeel hiervan is dat de kans bestaat dat detecties pas in een later stadium plaatsvinden.
Verminder de frequentie van regels of monitors die volgens een schema worden uitgevoerd om zo het CPU-gebruik over de hele dag te verdelen. Dit heeft als nadeel dat er minder bewaking is.
Als de agent door meerdere beheergroepen wordt beheerd (een configuratie die multihomed wordt genoemd), zal dit ook bijdragen aan hoger processorgebruik. Overweeg het aantal beheergroepen waarmee de agent wordt beheerd te beperken.
Als u na het proberen van alle bovenstaande stappen geen oplossing vindt, neemt u contact op met de klantenservice van Microsoft (http://support.microsoft.com/).
Deze monitor heeft een bijbehorende diagnosetaak 'Diagnostische gegevens van processorgebruik agent verzamelen' waarmee de steekproeven van het CPU-gebruik opnieuw worden uitgevoerd. De diagnosetaak is standaard uitgeschakeld.
Daarnaast is er in de Operations-console de taak 'Processorgebruik van agent ophalen', waarmee de steekproeven van het CPU-gebruik opnieuw worden uitgevoerd. Wanneer u de taak 'Processorgebruik van agent ophalen' uitvoert, kunt u de parameters voor de time-out en het aantal steekproeven instellen. Door de taak wordt een resultatentabel geretourneerd. De taak 'processorgebruik agent' uitvoeren
Target | Microsoft.SystemCenter.HealthService | ||
Parent Monitor | Microsoft.SystemCenter.HealthService.PerformanceHealthRollup | ||
Category | Custom | ||
Enabled | True | ||
Alert Generate | True | ||
Alert Severity | Error | ||
Alert Priority | Normal | ||
Alert Auto Resolve | True | ||
Monitor Type | Microsoft.SystemCenter.HealthService.SCOMpercentageCPUTimeCounterMonitorType | ||
Remotable | False | ||
Accessibility | Public | ||
Alert Message |
| ||
RunAs | Default |
<UnitMonitor ID="Microsoft.SystemCenter.HealthService.SCOMpercentageCPUTimeMonitor" Accessibility="Public" Enabled="onEssentialMonitoring" Target="SCLibrary!Microsoft.SystemCenter.HealthService" ParentMonitorID="Microsoft.SystemCenter.HealthService.PerformanceHealthRollup" Remotable="false" Priority="Normal" TypeID="Microsoft.SystemCenter.HealthService.SCOMpercentageCPUTimeCounterMonitorType" ConfirmDelivery="true">
<Category>Custom</Category>
<AlertSettings AlertMessage="Microsoft.SystemCenter.HealthService.SCOMpercentageCPUTimeMonitor.AlertMessage">
<AlertOnState>Error</AlertOnState>
<AutoResolve>true</AutoResolve>
<AlertPriority>Normal</AlertPriority>
<AlertSeverity>Error</AlertSeverity>
<AlertParameters>
<AlertParameter1>$Target/Host/Property[Type="Windows!Microsoft.Windows.Computer"]/PrincipalName$</AlertParameter1>
<AlertParameter2>$Data/Context/SampleValue$</AlertParameter2>
</AlertParameters>
</AlertSettings>
<OperationalStates>
<OperationalState ID="CPUTimeOverThreshold" MonitorTypeStateID="OverThreshold" HealthState="Error"/>
<OperationalState ID="CPUTimeUnderThreshold" MonitorTypeStateID="UnderThreshold" HealthState="Success"/>
</OperationalStates>
<Configuration>
<IntervalSeconds>321</IntervalSeconds>
<TimeoutSeconds>300</TimeoutSeconds>
<SyncTime>00:00</SyncTime>
<ComputerName>$Target/Host/Property[Type="Windows!Microsoft.Windows.Computer"]/PrincipalName$</ComputerName>
<Threshold>25</Threshold>
<ConsecutiveSampleCountCritical>6</ConsecutiveSampleCountCritical>
<ConsecutiveSampleCountHealthy>3</ConsecutiveSampleCountHealthy>
</Configuration>
</UnitMonitor>