Limite da \% Usada da Fila de Envio

Microsoft.SystemCenter.HealthService.CollectionRule.Performance.SendQueuePercentUsedMonitor (UnitMonitor)

Esse monitor tem 2 limites. O primeiro limite colocará o monitor no estado de Aviso. O segundo limite colocará o monitor no estado Crítico.

Knowledge Base article:

Resumo

Esse monitor mede os Grupos de Gerenciamento do Serviço de Integridade\% Usada da Fila de Envio e gera os seguintes estados:

Estado do Monitor

Limite da % Usada da Fila de Envio

Aviso

50 %

Crítica

60 %

Causas

Isso pode ser provocado por uma largura de banda baixa ou por uma conexão de latência alta desse Serviço de Integridade para seu Servidor de Gerenciamento pai. Isso também pode ser provocado por regras que estão coletando mais dados do que o Servidor de Gerenciamento pai pode processar, principalmente quando esse servidor possui muitos agentes subordinados a ele enviando grandes quantidades de dados.

Resoluções

Verifique com os administradores da rede se a conexão de rede do Serviço de Integridade para os Servidores de Gerenciamento pai está saturada. Nesse caso, você pode precisar atualizar as redes para acomodar o tráfego.

Se não for possível atualizar a rede, (por exemplo, se o Serviço de Integridade ou o Servidor de Gateway estiver em uma filial remota), você poderá desabilitar regras de coleta desnecessárias. A lista a seguir relaciona tipos de regras que podem ser desabilitadas e o impacto da desabilitação:

Tipo de regra

Objetivo da regra

Impacto quando desabilitada

Coleta de desempenho

Coleta dados de desempenho para o Banco de Dados Operacional, Data Warehouse ou ambos

Quando uma regra de coleta de desempenho é desabilitada, os modo de exibição de desempenho deixam de mostrar os dados. Se a regra estava coletando dados para o Data Warehouse, os relatórios dependentes desse desempenho não processarão mais nenhum dado.

Coleta de Eventos

Coleta dados de eventos para diagnóstico. Em alguns casos, um evento pode não ser útil para ser objeto de alertas, mas é útil para solução de problemas forenses ou solução de problemas em tempo quase real.

Quando uma regra de coleta de desempenho é desabilitada, os modo de exibição de eventos deixam de mostrar os dados. Se a regra estava coletando dados para o Data Warehouse, os relatórios dependentes desse evento não processarão mais nenhum dado.

Finalmente, se você ainda precisar desses dados, outra opção que pode implementar no sistema para tentar reduzir a quantidade de dados enviada pela rede é usar regras de coleta do contador de desempenho otimizadas e as regras de coleta de consolidação de eventos. A tabela a seguir resume o benefício e explica como os dados são resumidos.

Tipo de regra

Benefício

Modo de resumo dos dados

Regra de Coleta de Desempenho Otimizada

Envia o exemplo de dados de desempenho apenas se ele tiver um desvio do último exemplo dentro de uma porcentagem. Por exemplo, se o último exemplo era 42, e a regra foi configurada para coletar um novo exemplo com uma tolerância de 10%, o próximo exemplo precisará ser 42 +/- 4,2 (por exemplo, o próximo exemplo precisa ser superior a 46,2 ou inferior a 37,8)

Como apenas os dados de desempenho que excedem a tolerância configurada são enviados ao Banco de Dados Operacional ou ao Data Warehouse, os dados serão menos precisos. Quanto maior a tolerância, menor será a precisão.

Regra de Coleta de Eventos Consolidada

Esse tipo de regra de coleta de eventos envia os dados se um dos parâmetros configurados for diferente do último evento. Por exemplo, é possível configurar uma regra de coleta consolidada para consolidar eventos que sejam idênticos aos seguintes:

  • Origem do Evento

  • ID de Evento

  • Computador de Origem

  • Descrição

Em seguida, é possível configurar um período de tempo para consolidar esses eventos (por exemplo, 10 minutos). Se os critérios acima forem atendidos em algum evento, dentro dessa janela de 10 minutos, apenas um evento será enviado com a propriedade RepeatCount incrementada. Se esse evento estiver ocorrendo frequentemente em um único agente, significa que há apenas 144 eventos enviados em um período de 24 horas, o que pode ser bem menos do que o número de eventos realmente registrados no log de eventos

É necessário saber em quais parâmetros e propriedades de eventos a consolidação se baseia. Por exemplo, a configuração na Descrição significará que, se a Descrição do Evento for tipicamente exclusiva (por exemplo, ela contiver um nome de usuário), muitos eventos ainda serão enviados. Para esse exemplo, em vez disso, seria conveniente consolidar com base no parâmetro do evento que representa o campo de nome de usuário.

Além disso, uma janela de consolidação muito grande tem dois efeitos:

  • Atraso de eventos visíveis no Modo de Exibição de Evento ou Relatórios (pois os dados precisam ser consolidados até o final dessa janela de consolidação)

  • Utilização um pouco maior de recursos no agente. Com um número baixo de regras de consolidação, isso pode ser insignificante. Com um grande número de regras desses tipos compostas com janelas de consolidação longas, a utilização de recursos aumentará de modo proporcional.

Consulte a ajuda do produto ou navegue para o espaço Criação no console para criar o tipo de regra mencionado acima.

Element properties:

TargetMicrosoft.SystemCenter.Agent
Parent MonitorMicrosoft.SystemCenter.HealthService.PerformanceHealthRollup
CategoryPerformanceHealth
EnabledFalse
Instance NameHealth Service Management Groups
Counter NameSend Queue \% Used
Frequency180
Alert GenerateTrue
Alert SeverityError
Alert PriorityHigh
Alert Auto ResolveTrue
Monitor TypeSystem.Performance.DoubleThreshold
RemotableTrue
AccessibilityPublic
Alert Message
{0}: A fila de envio do Serviço de Integridade do Operations Manager está ficando cheia
Quando o Serviço de Integridade do Operations Manager estiver recebendo dados mais rápido do que conseguir enviá-los, ele começará a enfileirar o excesso de dados. A fila tem um tamanho fixo e, se este for atingido, o serviço de Integridade começará a fazer grooming desses dados. Quando esse alerta foi gerado, o contador "\% Usada da Fila de Envio" para esse sistema era {1}. Consulte a base de dados de conhecimento para obter mais detalhes sobre as possíveis causas e conhecer as etapas para solução d problema.
RunAsDefault

Source Code:

<UnitMonitor ID="Microsoft.SystemCenter.HealthService.CollectionRule.Performance.SendQueuePercentUsedMonitor" Accessibility="Public" Enabled="false" Target="SCLibrary!Microsoft.SystemCenter.Agent" ParentMonitorID="Microsoft.SystemCenter.HealthService.PerformanceHealthRollup" Remotable="true" Priority="Normal" TypeID="Performance!System.Performance.DoubleThreshold" ConfirmDelivery="false">
<Category>PerformanceHealth</Category>
<AlertSettings AlertMessage="Microsoft.SystemCenter.HealthService.CollectionRule.Performance.SendQueuePercentUsedMonitor_AlertMessageResourceID">
<AlertOnState>Error</AlertOnState>
<AutoResolve>true</AutoResolve>
<AlertPriority>High</AlertPriority>
<AlertSeverity>Error</AlertSeverity>
<AlertParameters>
<AlertParameter1>$Data/Context/Value$</AlertParameter1>
</AlertParameters>
</AlertSettings>
<OperationalStates>
<OperationalState ID="BelowThreshold" MonitorTypeStateID="UnderThreshold1" HealthState="Success"/>
<OperationalState ID="BetweenThresholds" MonitorTypeStateID="OverThreshold1UnderThreshold2" HealthState="Warning"/>
<OperationalState ID="OverThreshold" MonitorTypeStateID="OverThreshold2" HealthState="Error"/>
</OperationalStates>
<Configuration>
<ComputerName>$Target/Host/Property[Type="Windows!Microsoft.Windows.Computer"]/NetworkName$</ComputerName>
<CounterName>Send Queue % Used</CounterName>
<ObjectName>Health Service Management Groups</ObjectName>
<InstanceName>$Target/ManagementGroup/Name$</InstanceName>
<AllInstances>false</AllInstances>
<Frequency>180</Frequency>
<Threshold1>50</Threshold1>
<Threshold2>60</Threshold2>
</Configuration>
</UnitMonitor>