Монитор компьютеров группы ошибок

Microsoft.SystemCenter.CM.AEM.Views.Internal.ComputersAffectedWatsonBucketThreshold (AggregateMonitor)

Этот монитор проверяет количество компьютеров, пострадавших от ошибок этой группой ошибок.

Knowledge Base article:

Краткое описание

Этот монитор отслеживает общее количество уникальных компьютеров, сталкивающихся с аварийными завершениями, для некоторой группы ошибок. Количество уникальных компьютеров, на которых произошли ошибки приложения, входящие в группу ошибок, отчет о которых был отправлен в модуль безагентного отслеживания исключений, превысило заданное пороговое значение.

Причины

Количество ошибок, отчет о которых был отправлен в модуль безагентного отслеживания исключений в период тестирования, превысило заданное пороговое значение. Это может быть вызвано несколькими причинами в зависимости от приложения, в котором произошло аварийное завершение. Проблема также может заключаться в аппаратных ошибках на компьютерах, с которых отправляются отчеты в модуль безагентного отслеживания исключений.

Разрешение

Для дальнейшей диагностики проблемы можно выполнить следующие действия:

Если включена передача отчетов об ошибках, убедитесь, что доступно решение Майкрософт. В решении (при условии его доступности) содержатся сведения о разрешении проблемы.

Просмотрите представление события состояния "ошибка" для получения ссылки на CAB-файл после аварийного завершения из папки Persisted Cabs. Если это предыдущий отчет об ошибках, возможно, cab-файл был удален за давностью.

Для приложений, которые, возможно, не получили URL-адрес ответа с решениями от Майкрософт, данные об аварийных завершениях понадобятся группам поддержки приложений или разработчиков приложений

Установка последнего пакета обновлений или Quick Fix (QFE) на компьютерах под управлением модуля безагентного отслеживания приложений может привести к неожиданному увеличению количества ошибок на этих компьютерах. Проверьте наличие таких обновлений программного обеспечения

Для выполнения дальнейшей диагностики этой проблемы необходим анализ соответствующего отчета "N основных групп ошибок" для определения соответствующих N основных групп ошибок и определения группы наиболее критических ошибок на основе подсчета статистики.

Element properties:

TargetMicrosoft.SystemCenter.CM.AEM.WatsonBucket
Parent MonitorSystem.Health.AvailabilityState
AlgorithmWorstOf
CategoryAlert
EnabledTrue
Alert GenerateTrue
Alert SeverityError
Alert PriorityHigh
Alert Auto ResolveTrue
RemotableTrue
AccessibilityPublic
Alert Message
Монитор компьютеров группы ошибок
Число уникальных компьютеров, сталкивающихся с аварийными завершениями, для данной группы ошибок превысило пороговое значение. Общее число пострадавших уникальных компьютеров: {0}. Пороговое значение для данного монитора: {1}.

Source Code:

<AggregateMonitor ID="Microsoft.SystemCenter.CM.AEM.Views.Internal.ComputersAffectedWatsonBucketThreshold" Target="AEMLib!Microsoft.SystemCenter.CM.AEM.WatsonBucket" Accessibility="Public" Enabled="true" ParentMonitorID="Health!System.Health.AvailabilityState" Remotable="true" Priority="Normal">
<Category>Alert</Category>
<AlertSettings AlertMessage="Microsoft.SystemCenter.CM.AEM.Views.Internal.ComputersAffectedWatsonBucketThreshold.AlertMessage">
<AlertOnState>Error</AlertOnState>
<AutoResolve>true</AutoResolve>
<AlertPriority>High</AlertPriority>
<AlertParameters>
<AlertParameter1>$Data/Context/Columns/Column[1]$</AlertParameter1>
<AlertParameter2>$Data/Context/Columns/Column[3]$</AlertParameter2>
</AlertParameters>
</AlertSettings>
<Algorithm>WorstOf</Algorithm>
</AggregateMonitor>