Send Queue \% Used

Microsoft.SystemCenter.HealthService.CollectionRule.Performance.SendQueuePercentUsedMonitor (UnitMonitor)

This monitor measures the Health Service Management Groups\Send Queue \% Used counter for the Health service.

Knowledge Base article:

Resumo

This monitor measures the Health Service Management Groups\Send Queue % Used and generates the following states:

Estado do Monitor

Send Queue % Used Threshold

Aviso

50 %

Crítica

60 %

Causas

Isso pode ser provocado por uma largura de banda baixa ou por uma conexão de latência alta desse Serviço de Integridade do System Center Management para seu Servidor de Gerenciamento pai. Isso também pode ser provocado por regras que estão coletando mais dados do que o Servidor de Gerenciamento pai pode processar, principalmente quando esse servidor possui muitos agentes subordinados a ele enviando grandes quantidades de dados.

Resoluções

Verifique com os administradores da rede se a conexão de rede do Serviço de Integridade do System Center Management para os Servidores de Gerenciamento pai está saturada. Nesse caso, você pode precisar atualizar as redes para acomodar o tráfego.

Se não for possível atualizar a rede (por exemplo, se o Serviço de Integridade do System Center Management ou o Servidor de Gateway estiver em uma filial remota), você poderá desabilitar regras de coleta desnecessárias. A lista a seguir relaciona tipos de regras que podem ser desabilitadas e o impacto da desabilitação:

Tipo de regra

Objetivo da regra

Impacto quando desabilitada

Coleta de desempenho

Coleta dados de desempenho para o Banco de Dados Operacional, Data Warehouse ou ambos

Quando uma regra de coleta de desempenho é desabilitada, as exibições de desempenho deixam de mostrar os dados. Se a regra estava coletando dados para o Data Warehouse, os relatórios dependentes desse desempenho não processarão mais nenhum dado.

Coleta de Eventos

Coleta dados de eventos para diagnóstico. Em alguns casos, um evento pode não ser útil para ser objeto de alertas, mas é útil para solução de problemas forenses ou solução de problemas em tempo quase real.

Quando uma regra de coleta de eventos é desabilitada, as exibições de eventos deixam de mostrar os dados. Se a regra estava coletando dados para o Data Warehouse, os relatórios dependentes desse evento não processarão mais nenhum dado.

Finalmente, se você ainda precisar desses dados, outra opção que pode implementar no sistema para tentar reduzir a quantidade de dados enviada pela rede é usar regras de coleta do contador de desempenho otimizadas e as regras de coleta de consolidação de eventos. A tabela a seguir resume o benefício e explica como os dados são resumidos.

Tipo de regra

Benefício

Modo de resumo dos dados

Regra de Coleta de Desempenho Otimizada

Only sends the performance data sample if it deviates from the last sample within some percentage. E.g., if the last sample was 42, and the rule was configured to only collect to a new sample with a tolerance of 10%, the next sample will need to 42 +/- 4.2 (e.g. next sample needs to be greater than 46.2 or less than 37.8)

Como apenas os dados de desempenho que excedem a tolerância configurada são enviados ao Banco de Dados Operacional ou ao Data Warehouse, os dados serão menos precisos. Quanto maior a tolerância, menor será a precisão.

Regra de Coleta de Eventos Consolidada

Esse tipo de regra de coleta de eventos envia os dados se um dos parâmetros configurados for diferente do último evento. Por exemplo, é possível configurar uma regra de coleta consolidada para consolidar eventos que sejam idênticos aos seguintes:

  • Origem do Evento

  • ID do Evento

  • Computador de Origem

  • Descrição

Em seguida, é possível configurar um período de tempo para consolidar esses eventos (por exemplo, 10 minutos). Se os critérios acima forem correspondidos para qualquer evento dentro dessa janela de 10 minutos, apenas 1 evento será configurado com sua propriedade Contagem de Repetições devidamente incrementada. Se esse evento estiver ocorrendo frequentemente em um único agente, significa que há apenas 144 eventos enviados em um período de 24 horas, o que pode ser bem menos do que o número de eventos realmente registrados no log de eventos

É necessário saber em quais parâmetros e propriedades de eventos a consolidação se baseia. Por exemplo, a configuração na Descrição significará que, se a Descrição do Evento for tipicamente exclusiva (por exemplo, ela contiver um nome de usuário), muitos eventos ainda serão enviados. Para esse exemplo, em vez disso, seria conveniente consolidar com base no parâmetro do evento que representa o campo de nome de usuário.

Além disso, uma janela de consolidação muito grande tem dois efeitos:

  • Atraso de eventos visíveis na Exibição de Eventos ou em Relatórios (pois os dados precisam ser consolidados até o final dessa janela de consolidação)

  • Utilização um pouco maior de recursos no agente. Com um número baixo de regras de consolidação, isso pode ser insignificante. Com um grande número de regras desses tipos compostas com janelas de consolidação longas, a utilização de recursos aumentará de modo proporcional.

Consulte a ajuda do produto ou navegue para o espaço Criação no console para criar o tipo de regra mencionado acima.

Element properties:

TargetMicrosoft.SystemCenter.Agent
Parent MonitorMicrosoft.SystemCenter.HealthService.PerformanceHealthRollup
CategoryPerformanceHealth
EnabledTrue
Alert GenerateTrue
Alert SeverityError
Alert PriorityHigh
Alert Auto ResolveTrue
Monitor TypeMicrosoft.SystemCenter.HealthService.ConsecutiveSampleDoubleThreshold
RemotableTrue
AccessibilityPublic
Alert Message
{0}: A fila de envio do serviço de integridade está ficando cheia
When the System Center Management Health Service is receiving data faster than it can send that data out, it will begin queuing the excess data. The queue has a fixed size and if that is reached, then the Health Service will start grooming data out of the queue. When this alert was generated, the "Send Queue \% Used" counter for this system was {0}. Refer to the knowledge for more details on possible causes and troubleshooting steps.
RunAsDefault

Source Code:

<UnitMonitor ID="Microsoft.SystemCenter.HealthService.CollectionRule.Performance.SendQueuePercentUsedMonitor" Accessibility="Public" Enabled="true" Target="SCLibrary!Microsoft.SystemCenter.Agent" ParentMonitorID="Microsoft.SystemCenter.HealthService.PerformanceHealthRollup" Remotable="true" Priority="Normal" TypeID="Microsoft.SystemCenter.HealthService.ConsecutiveSampleDoubleThreshold" ConfirmDelivery="false">
<Category>PerformanceHealth</Category>
<AlertSettings AlertMessage="Microsoft.SystemCenter.HealthService.CollectionRule.Performance.SendQueuePercentUsedMonitor_AlertMessageResourceID">
<AlertOnState>Error</AlertOnState>
<AutoResolve>true</AutoResolve>
<AlertPriority>High</AlertPriority>
<AlertSeverity>Error</AlertSeverity>
<AlertParameters>
<AlertParameter1>$Data/Context/Value$</AlertParameter1>
</AlertParameters>
</AlertSettings>
<OperationalStates>
<OperationalState ID="BelowThreshold" MonitorTypeStateID="UnderWarningThreshold" HealthState="Success"/>
<OperationalState ID="BetweenThresholds" MonitorTypeStateID="OverWarningThresholdUnderErrorThreshold" HealthState="Warning"/>
<OperationalState ID="OverThreshold" MonitorTypeStateID="OverErrorThreshold" HealthState="Error"/>
</OperationalStates>
<Configuration>
<ComputerName>$Target/Host/Property[Type="Windows!Microsoft.Windows.Computer"]/NetworkName$</ComputerName>
<CounterName>Send Queue % Used</CounterName>
<ObjectName>Health Service Management Groups</ObjectName>
<InstanceName>$Target/ManagementGroup/Name$</InstanceName>
<AllInstances>false</AllInstances>
<Frequency>180</Frequency>
<PercentFull>95</PercentFull>
<NumSamples>3</NumSamples>
<WarningThreshold>90</WarningThreshold>
<ErrorThreshold>95</ErrorThreshold>
</Configuration>
</UnitMonitor>