长时间运行的作业

Microsoft.SQLServer.Windows.Monitor.Agent.LongRunningJobs (UnitMonitor)

此监视器检查长期运行的 SQL 代理作业。
请注意,任何版本的 SQL Server Express 均不支持 SQL Server 代理服务; 没有合适的发现对象。默认情况下,此监视器为禁用状态。请根据需要使用替代进行启用。

Knowledge Base article:

摘要

此监视器检查长期运行的 SQL 代理作业。如果作业的运行时间超出配置的阈值,将生成一个警告或错误警报。

默认情况下,此监视器不监视计划类型为“SQL Server 代理启动时自动启动”的作业,因为它们通常会持续运行直到 SQL 代理停止(即,连续),而这一行为对于它们来说是正常的。通常 SQL Server 复制使用此类作业。但在某些情况下,计划类型为“SQL Sever 代理启动时自动启动”的作业可能会运行相对较短的间隔时间。若要监视这些作业,只需将参数 "Included continuously executed jobs" 替换为这些作业名称的逗号分隔列表。列表中的作业名称应符合以下其中一个标识符类的要求:

1)常规:

2)分隔:

属于以上任何类别的任何名称应为 1 到 128 个字符,不包括分隔符字符。

原因

不正常状态是由运行时间超出定义的阈值的 SQL Server 代理作业引起的。这可能表示作业存在问题。

SQL Server 代理负责运行计划在特定时间或间隔发生的 SQL Server 任务,还负责检测管理员已为其定义了操作的特定情况(例如通过页面或电子邮件向某人发出警报)或将解决此情况的任务。SQL Server 代理还用于运行管理员定义的复制任务。

要确定引起警告或错误状态的作业,请检查状态更改或警报的上下文数据。

解决方法

检查 SQL Server Management Studio 以确定正在运行哪些作业。如果这些作业运行的时间过长,请对它们进行调查以查明原因。

使用 sp_help_jobactivity 以查看有关当前正在运行作业的信息。

或者,如果期望某些代理作业长时间运行:

可替代参数

名称

说明

默认值

警报优先级

定义警报优先级。

正常

警报严重性

定义警报严重性。

MatchMonitorHealth

严重阈值(分钟)

如果值超过此阈值,监视器会将其状态更改为“严重”。值介于此阈值与警告阈值(包括警告阈值)之间会导致监视器处于警告状态。

120

已启用

启用或禁用工作流。

生成警报

定义工作流是否生成警报。

包括连续执行的作业

一些 SQL 代理作业可以无限运行(直至代理停止)。这些作业通常具有“SQL Server 代理启动时自动启动”计划类型。例如,SQL Server 复制经常使用这些作业。这些作业会导致误报,并且在默认情况下监视器不会将它们考虑在内。但是当这些作业在短时间内运行时可能会有例外。若要监视这些作业,应定义这些作业名称的列表,并使用逗号分隔。

 

间隔(秒)

运行工作流的重复间隔时间(秒)。

600

同步时间

使用 24 小时格式指定的同步时间。可以忽略。

 

超时(秒)

指定工作流在关闭之前允许运行的时间,并标记为失败。

300

数据库连接超时(秒)

如果在指定期间无法访问数据库,工作流将失败并注册一个事件。

15

警告阈值(分钟)

警告阈值。超过该阈值会导致监视器至少进入警告状态。

60

Element properties:

TargetMicrosoft.SQLServer.Windows.Agent
Parent MonitorSystem.Health.PerformanceState
CategoryPerformanceHealth
EnabledFalse
Alert GenerateTrue
Alert SeverityMatchMonitorHealth
Alert PriorityNormal
Alert Auto ResolveTrue
Monitor TypeMicrosoft.SQLServer.Windows.MonitorType.Agent.LongRunningJobs
RemotableTrue
AccessibilityPublic
Alert Message
Windows 上的 MSSQL: 长时间运行的作业
计算机 {0} 上的 SQL 实例 {1} 上有长时间运行的代理作业。这可能表示一个或多个作业存在问题。
RunAsDefault

Source Code:

<UnitMonitor ID="Microsoft.SQLServer.Windows.Monitor.Agent.LongRunningJobs" Accessibility="Public" Enabled="false" Target="SqlDiscW!Microsoft.SQLServer.Windows.Agent" ParentMonitorID="Health!System.Health.PerformanceState" Remotable="true" Priority="Normal" TypeID="Microsoft.SQLServer.Windows.MonitorType.Agent.LongRunningJobs" ConfirmDelivery="false">
<Category>PerformanceHealth</Category>
<AlertSettings AlertMessage="Microsoft.SQLServer.Windows.Monitor.Agent.LongRunningJobs.AlertMessage">
<AlertOnState>Warning</AlertOnState>
<AutoResolve>true</AutoResolve>
<AlertPriority>Normal</AlertPriority>
<AlertSeverity>MatchMonitorHealth</AlertSeverity>
<AlertParameters>
<AlertParameter1>$Target/Host/Property[Type="SqlCoreLib!Microsoft.SQLServer.Core.DBEngine"]/MachineName$</AlertParameter1>
<AlertParameter2>$Target/Host/Property[Type="SqlCoreLib!Microsoft.SQLServer.Core.DBEngine"]/InstanceName$</AlertParameter2>
</AlertParameters>
</AlertSettings>
<OperationalStates>
<OperationalState ID="UnderThreshold1" MonitorTypeStateID="UnderThreshold1" HealthState="Success"/>
<OperationalState ID="OverThreshold1UnderThreshold2" MonitorTypeStateID="OverThreshold1UnderThreshold2" HealthState="Warning"/>
<OperationalState ID="OverThreshold2" MonitorTypeStateID="OverThreshold2" HealthState="Error"/>
</OperationalStates>
<Configuration>
<MachineName>$Target/Host/Property[Type="SqlCoreLib!Microsoft.SQLServer.Core.DBEngine"]/MachineName$</MachineName>
<NetbiosComputerName>$Target/Host/Property[Type="SqlCoreLib!Microsoft.SQLServer.Core.DBEngine"]/NetbiosComputerName$</NetbiosComputerName>
<InstanceName>$Target/Host/Property[Type="SqlCoreLib!Microsoft.SQLServer.Core.DBEngine"]/InstanceName$</InstanceName>
<ConnectionString>$Target/Host/Property[Type="SqlCoreLib!Microsoft.SQLServer.Core.DBEngine"]/ConnectionString$</ConnectionString>
<InstanceVersion>$Target/Host/Property[Type="SqlCoreLib!Microsoft.SQLServer.Core.DBEngine"]/Version$</InstanceVersion>
<InstanceEdition>$Target/Host/Property[Type="SqlCoreLib!Microsoft.SQLServer.Core.DBEngine"]/Edition$</InstanceEdition>
<MonitoringType>$Target/Host/Property[Type="SqlDiscW!Microsoft.SQLServer.Windows.DBEngine"]/MonitoringType$</MonitoringType>
<Threshold1>60</Threshold1>
<Threshold2>120</Threshold2>
<IncludedJobs/>
<SqlTimeoutSeconds>15</SqlTimeoutSeconds>
<TimeoutSeconds>300</TimeoutSeconds>
<IntervalSeconds>600</IntervalSeconds>
<SyncTime/>
</Configuration>
</UnitMonitor>