MSSQL в Windows: подозрительное поведение агента. Агент не отвечает в течение нескольких последних минут

Microsoft.SQLServer.Windows.CollectionRule.Agent.The_agent_is_suspect._No_response_within_last_minutes_1_5_Rule (Rule)

Такая реакция на событие возникает из-за того, что агент репликации слишком занят, чтобы ответить, когда диспетчер SQL Server Enterprise Manager опрашивает агента репликации. Поэтому диспетчеру SQL Server Enterprise Manager неизвестно состояние данного агента репликации и он не может сообщить, работает ли агент репликации.

Knowledge Base article:

Сводка

Такая реакция на событие возникает из-за того, что агент репликации слишком занят, чтобы ответить, когда диспетчер SQL Server Enterprise Manager опрашивает агента репликации. Поэтому диспетчеру SQL Server Enterprise Manager неизвестно состояние данного агента репликации и он не может сообщить, работает ли агент репликации.

При сбое агента репликации вы получите следующее сообщение об ошибке:

Сообщение 20536, уровень серьезности 10 — "Репликация: сбой агента".

Существует нескольких причин, по которым может быть занят агент репликации. Возможно, реплицируется большой объем данных или возникли проблемы конфигурации или репликации, из-за которых задания выполняются в течение длительного времени.

Note that this rule does not work if SQL Server on Windows instance is monitored agentlessly.

Разрешения

Чтобы уменьшить частоту появления данного сообщения, увеличьте пороговое значение бездействия.

Изменение данного параметра ничего не исправляет. Вместо этого изменяется частота опроса текущего состояния агента репликации. Порядок изменения значения порога бездействия:

Если не поступают дополнительные сообщения об ошибках, указывающих на проблему с данным агентом репликации, то сообщение "потенциально неисправный агент" является единственным информационным сообщением. При получении данного сообщения не останавливайте агент репликации, если нет дополнительных связанных сообщений об ошибках. В случае остановки агент репликации выполняет откат обрабатываемого им процесса, а затем данный процесс приходится перезапускать вместо того, чтобы ожидать его завершения.

Переопределяемые параметры

Имя

Описание

Значение по умолчанию

Разрешить прокси

Указывает, должен ли модуль собирать события, которые возникают не на компьютере, указанном в параметре ComputerName.

Нет

Включено

Включает или отключает рабочий процесс.

Да

Приоритет

Определение приоритета оповещений.

1

Важность

Определяет серьезность предупреждения.

2

Element properties:

TargetMicrosoft.SQLServer.Windows.DBEngine
CategoryEventCollection
EnabledTrue
Alert GenerateTrue
Alert SeverityError
Alert PriorityNormal
RemotableTrue
Alert Message
MSSQL в Windows: подозрительное поведение агента. Агент не отвечает в течение нескольких последних минут
Идентификатор события: {0}. Агент репликации не записывал сообщение о ходе выполнения в журнал в течение {1} мин. Это может быть вызвано высокой загрузкой системы или тем, что агент не отвечает на запросы. Убедитесь, что записи реплицируются в место назначения и что соединения с подписчиком, издателем или распространителем по-прежнему установлены.
CommentMom2017ID='{C65DF52B-B877-48C3-B546-67D69C494E84}';MOM2017GroupID={467ECC75-C5DA-42BD-955C-A73BBB51AF74}

Member Modules:

ID Module Type TypeId RunAs 
_F6DA1507_12AF_11D3_AB21_00A0C98620CE_ DataSource Microsoft.SQLServer.Windows.DataSource.EventCollectionFiltered Default
GenerateAlert WriteAction System.Health.GenerateAlert Default

Source Code:

<Rule ID="Microsoft.SQLServer.Windows.CollectionRule.Agent.The_agent_is_suspect._No_response_within_last_minutes_1_5_Rule" Target="SqlDiscW!Microsoft.SQLServer.Windows.DBEngine" Enabled="true" ConfirmDelivery="true" Remotable="true" Comment="Mom2017ID='{C65DF52B-B877-48C3-B546-67D69C494E84}';MOM2017GroupID={467ECC75-C5DA-42BD-955C-A73BBB51AF74}">
<Category>EventCollection</Category>
<DataSources>
<DataSource ID="_F6DA1507_12AF_11D3_AB21_00A0C98620CE_" Comment="{F6DA1507-12AF-11D3-AB21-00A0C98620CE}" TypeID="Microsoft.SQLServer.Windows.DataSource.EventCollectionFiltered">
<MachineName>$Target/Property[Type="SqlCoreLib!Microsoft.SQLServer.Core.DBEngine"]/MachineName$</MachineName>
<NetbiosComputerName>$Target/Property[Type="SqlCoreLib!Microsoft.SQLServer.Core.DBEngine"]/NetbiosComputerName$</NetbiosComputerName>
<InstanceName>$Target/Property[Type="SqlCoreLib!Microsoft.SQLServer.Core.DBEngine"]/InstanceName$</InstanceName>
<ConnectionString>$Target/Property[Type="SqlCoreLib!Microsoft.SQLServer.Core.DBEngine"]/ConnectionString$</ConnectionString>
<InstanceVersion>$Target/Property[Type="SqlCoreLib!Microsoft.SQLServer.Core.DBEngine"]/Version$</InstanceVersion>
<InstanceEdition>$Target/Property[Type="SqlCoreLib!Microsoft.SQLServer.Core.DBEngine"]/Edition$</InstanceEdition>
<MonitoringType>$Target/Property[Type="SqlDiscW!Microsoft.SQLServer.Windows.DBEngine"]/MonitoringType$</MonitoringType>
<SqlExecTimeoutSeconds>60</SqlExecTimeoutSeconds>
<SqlTimeoutSeconds>15</SqlTimeoutSeconds>
<TimeoutSeconds>200</TimeoutSeconds>
<IntervalSeconds>300</IntervalSeconds>
<SyncTime/>
<EventDisplayNumber>20554</EventDisplayNumber>
</DataSource>
</DataSources>
<WriteActions>
<WriteAction ID="GenerateAlert" TypeID="Health!System.Health.GenerateAlert">
<Priority>1</Priority>
<Severity>2</Severity>
<AlertMessageId>$MPElement[Name="Microsoft.SQLServer.Windows.CollectionRule.Agent.The_agent_is_suspect._No_response_within_last_minutes_1_5_Rule.AlertMessage"]$</AlertMessageId>
<AlertParameters>
<AlertParameter1>$Target/Property[Type="SqlCoreLib!Microsoft.SQLServer.Core.DBEngine"]/MachineName$</AlertParameter1>
<AlertParameter2>$Target/Property[Type="SqlCoreLib!Microsoft.SQLServer.Core.DBEngine"]/InstanceName$</AlertParameter2>
<AlertParameter3>Event ID: $Data/Property[@Name='EventID']$. $Data/Property[@Name='Message']$</AlertParameter3>
</AlertParameters>
<Suppression>
<SuppressionValue/>
</Suppression>
</WriteAction>
</WriteActions>
</Rule>