Отслеживание всех процессов агента для выявления потенциальных проблем, связанных со слишком высокой загрузкой процессора.
Этот монитор вычисляет общую загрузку центрального процессора агентом Operations Manager и связанными процессами и создает предупреждение, если загрузка ЦП превышает заданное пороговое значение в определенном количестве последовательных выборок.
Принцип работы основного сценария этого монитора заключается в нахождении и выборке данных о загрузке ЦП для процесса агента Operations Manager (HealthService.exe), его дочерних процессов наблюдения за узлом (MonitoringHost.exe) и процессов, которые являются дочерними по отношению к этим процессам наблюдения за узлом (cscript.exe, PowerShell.exe и т. д.). Сценарий выполняет вычисления три раза, после чего выдает среднее значение по трем последовательным выборкам, которое затем используется этим монитором для определения критического или работоспособного состояния.
С помощью переопределений можно настроить следующие параметры, чтобы изменить поведение монитора по умолчанию.
Частота (секунд). Это частота, с которой монитор производит выборки данных о загрузке процессора агентом. По умолчанию монитор оценивает загрузку процессора агентом каждые 300 секунд (5 минут).
Количество последовательных выборок для критического состояния. По умолчанию монитор переходит в критическое состояние, если заданное пороговое значение превышено в 6-ти последовательных выборках.
Количество последовательных выборок для работоспособного состояния. По умолчанию монитор переходит в работоспособное состояние, если значения 3-х последовательных выборок ниже заданного порогового значения.
Пороговое значение. По умолчанию пороговое значение загрузки ЦП — 25%.
Этот монитор по умолчанию отключен для всех серверов управления.
Слишком интенсивное использование ЦП различными процессами агента Operations Manager может свидетельствовать о неправильной работе агента или одного из его основных зависимых объектов. Если агент и его основные зависимые объекты обновлены правильно, уровень загрузки агента на наблюдаемом компьютере превышает допустимый. Возможно, это краткосрочное явление, причиной которого послужило недавнее обновление в группе управления, например развертывание нового пакета управления, или же причина в том, что агент действительно работает под чрезмерной нагрузкой и требует настройки.
Чтобы убедиться в правильной работе агента и его основных зависимых объектов, выполните указанные ниже действия.
Убедитесь, что на компьютере установлена самая последняя версия агента Operations Manager.
Убедитесь, что установлено обновление для MSXML 6.0 из статьи базы знаний 968967 (http://go.microsoft.com/fwlink/?LinkId=181885).
Если на компьютере используется операционная система Windows XP, Windows 2000 Server или Windows Server 2003, убедитесь, что на нем запущен сервер сценариев Windows версии 5.7 или более поздней. Ссылки для загрузки сервера сценариев Windows версии 5.7 см. по адресу http://go.microsoft.com/fwlink/?LinkId=181884.
Если после всех вышеописанных проверок проблема повторится, для выяснения причины повышенной загрузки ЦП потребуется более подробное изучение. Для дальнейшего исследования проблемы выполните указанные ниже действия, комбинируя их по своему усмотрению.
Просмотрите последние данные о загрузке процессора агентом, числе рабочих процессов и числе модулей, используя представление Производительность агента. Данные о загрузке процессора агентом позволят понять, появилась ли проблема недавно или периодически возникала в течение более длительного периода времени. Данные о числе рабочих процессов и модулей дадут представление о рабочей нагрузке агента, создаваемой различными правилами, мониторами и обнаружениями. Эти данные также необходимо сравнить с данными о работоспособных агентах.
С помощью специальной программы, например Effective Configuration Viewer (http://go.microsoft.com/fwlink/?LinkId=182300), определите, сколько экземпляров классов обнаружено на агенте. Большое количество экземпляров классов может привести к увеличению числа рабочих процессов и модулей, что, в свою очередь, может создать высокую рабочую нагрузку.
С помощью системного монитора получите более подробные измерения, используя счетчик "% загруженности процессора" для объекта "Процесс". Это даст общее представление о том, какие процессы создают наибольшую нагрузку на процессор.
Просмотрите все недавние обновления или изменения пакета управления, чтобы понять, есть ли связь между ними и увеличением загрузки ЦП.
После того как будут определены причины, выполните одно из перечисленных ниже действий, чтобы устранить проблему.
Если в пакет управления недавно было внесено изменение или был развернут новый пакет управления, продолжите наблюдение за ситуацией, чтобы увидеть, повторится ли проблема.
Уменьшите частоту обнаружений с помощью переопределений, чтобы распределить создаваемую ими нагрузку на ЦП в течение дня. Это компромиссное решение за счет возможного увеличения времени между обнаружениями.
Уменьшите частоту правил или мониторов, запускаемых по расписанию, чтобы распределить создаваемую ими нагрузку на ЦП в течение дня. Это компромиссное решение за счет наблюдения.
Если агент находится под управлением нескольких групп управления (такая конфигурация называется "агент с множественной адресацией"), это также вызовет повышение загрузки процессора. Рекомендуется уменьшить количество групп управления, под управлением которых находится агент.
Если ни одно из вышеперечисленных действий не позволило решить проблему, обратитесь в службу поддержки пользователей Майкрософт (http://support.microsoft.com/).
С этим монитором связана диагностическая задача "Диагностика сбора данных загрузки процессора агентом", которая возвращает выборку данных о загрузке процессора. Эта диагностическая задача по умолчанию отключена.
В консоли управления также имеется задача "Получение загрузки процессора агентом", которая возвращает выборку данных о загрузке процессора. При запуске задачи "Получение загрузки процессора агентом" можно задать параметры времени ожидания и числа выборок. Задача возвращает таблицу результатов. Запустить задачу "Получение загрузки процессора агентом"
Target | Microsoft.SystemCenter.HealthService | ||
Parent Monitor | Microsoft.SystemCenter.HealthService.PerformanceHealthRollup | ||
Category | Custom | ||
Enabled | True | ||
Alert Generate | True | ||
Alert Severity | Error | ||
Alert Priority | Normal | ||
Alert Auto Resolve | True | ||
Monitor Type | Microsoft.SystemCenter.HealthService.SCOMpercentageCPUTimeCounterMonitorType | ||
Remotable | False | ||
Accessibility | Public | ||
Alert Message |
| ||
RunAs | Default |
<UnitMonitor ID="Microsoft.SystemCenter.HealthService.SCOMpercentageCPUTimeMonitor" Accessibility="Public" Enabled="onEssentialMonitoring" Target="SCLibrary!Microsoft.SystemCenter.HealthService" ParentMonitorID="Microsoft.SystemCenter.HealthService.PerformanceHealthRollup" Remotable="false" Priority="Normal" TypeID="Microsoft.SystemCenter.HealthService.SCOMpercentageCPUTimeCounterMonitorType" ConfirmDelivery="true">
<Category>Custom</Category>
<AlertSettings AlertMessage="Microsoft.SystemCenter.HealthService.SCOMpercentageCPUTimeMonitor.AlertMessage">
<AlertOnState>Error</AlertOnState>
<AutoResolve>true</AutoResolve>
<AlertPriority>Normal</AlertPriority>
<AlertSeverity>Error</AlertSeverity>
<AlertParameters>
<AlertParameter1>$Target/Host/Property[Type="Windows!Microsoft.Windows.Computer"]/PrincipalName$</AlertParameter1>
<AlertParameter2>$Data/Context/SampleValue$</AlertParameter2>
</AlertParameters>
</AlertSettings>
<OperationalStates>
<OperationalState ID="CPUTimeOverThreshold" MonitorTypeStateID="OverThreshold" HealthState="Error"/>
<OperationalState ID="CPUTimeUnderThreshold" MonitorTypeStateID="UnderThreshold" HealthState="Success"/>
</OperationalStates>
<Configuration>
<IntervalSeconds>321</IntervalSeconds>
<TimeoutSeconds>300</TimeoutSeconds>
<SyncTime>00:00</SyncTime>
<ComputerName>$Target/Host/Property[Type="Windows!Microsoft.Windows.Computer"]/PrincipalName$</ComputerName>
<Threshold>25</Threshold>
<ConsecutiveSampleCountCritical>6</ConsecutiveSampleCountCritical>
<ConsecutiveSampleCountHealthy>3</ConsecutiveSampleCountHealthy>
</Configuration>
</UnitMonitor>