В отказоустойчивом кластере виртуальные машины могут использовать общие тома кластера, которые находятся на одном LUN (диске), но все еще могут переключаться (или переходить от одного узла к другому) независимо друг от друга. Виртуальные машины могут использовать общий том кластера, только если связи между узлами кластера и том функционируют правильно, в том числе подключения к сети, доступ, драйверы и другие факторы.
Сведения о событии
ИД события: | 5121 |
Источник: | Microsoft-Windows-FailoverClustering |
Символическое имя: | DCM_VOLUME_NO_DIRECT_IO_DUE_TO_FAILURE |
Сообщение: Общий том кластера "%1" ("%2") более не доступен напрямую с этого узла кластера. Ввод-вывод будет перенаправлен к запоминающему устройству по сети на узел, которому принадлежит этот том. Это может привести к снижению производительности. Если перенаправление доступа для этого тома включено, отключите его. Если перенаправление доступа отключено, устраните неполадки связи этого узла с устройством хранения. После восстановления связи с устройством хранения работоспособность ввода-вывода также будет восстановлена. Выполните поиск в статье "Коды системных ошибок" ( http://go.microsoft.com/fwlink/?LinkId=83027). |
Это связано с отсутствием доступа к DNS-серверу этого узла кластера или с другой проблемой сетевого подключения.
CSV — проверка хранилища и конфигурации сети
Если в настоящее время у вас не открыт просмотр событий, см. "Открытие просмотра событий и просмотр событий, связанных с отказоустойчивой кластеризацией". Если событие содержит код ошибки, который вы еще не искали, см. "Поиск дополнительной информации о кодах ошибок, содержащихся в некоторых сообщениях о событиях". Рассмотрев сообщения о событиях, выберите действия, которые относятся к вашей ситуации:
Проверьте состояние и конфигурацию дисков в общих томах кластера. Дополнительные сведения см. в разделе "Сбор информации о состоянии и конфигурации диска в общих томах кластера".
Проверьте параметры сети. Дополнительные сведения см. в разделе "Проверка параметров сети, предназначенной для сетевого подключения к общим томам кластера".
Просмотрите политики безопасности, которые могут повлиять на подключение к общим томам кластера. Дополнительные сведения см. в разделе "Проверка разрешения необходимой проверки подлинности NTLM".
Для выполнения следующих процедур вам необходимо быть членом локальной группы администраторов на каждом кластерном сервере, а учетная запись, которую вы используете, должна быть учетной записью домена или вам должны быть делегированы соответствующие полномочия.
Сбор информации о состоянии и конфигурации диска в общих томах кластера
Чтобы собрать информацию о состоянии и конфигурации диска в общих томах кластера, выполните следующее:
Просмотрите соответствующие журналы событий на наличие ошибок, связанных с диском.
Просмотрите информацию о хранилище (доступна в интерфейсе) и при необходимости обратитесь к поставщику для получения дополнительной информации о хранилище.
Чтобы открыть оснастку отказоустойчивых кластеров, нажмите кнопку Пуск, выберите Администрирование, а затем выберите элемент Диспетчер отказоустойчивости кластеров. Если открывается диалоговое окно Контроль учетных записей, убедитесь, что в нем отображено нужное действие, затем нажмите кнопку Да.
В оснастке диспетчера отказоустойчивости кластеров разверните дерево консоли и выберите Общие тома кластера. В центральной области разверните вхождение для тома, информацию о котором необходимо собрать. Просмотрите состояние тома.
Чтобы подготовиться к тестированию диска в общих томах кластера, в центральной области щелкните правой кнопкой мыши диск, выберите Перевести ресурс в автономный режим, а затем при появлении соответствующего запроса подтвердите свой выбор. Повторите это действие для любых других дисков, которые требуется проверить.
Щелкните правой кнопкой мыши кластер, содержащий общие тома кластера, а затем нажмите кнопку Проверить кластер.
На странице Параметры тестирования выберите Выполнять только выбранные тесты.
На странице Выбор тестов снимите флажки с пунктов Конфигурация системы и Сеть. Таким образом будут проверены Конфигурация кластера, Запасы и Хранилище. Можно выполнить все эти тесты или выбрать только определенные, которые имеют отношение к вашей ситуации.
Следуйте инструкциям мастера, чтобы выполнить тесты.
На странице Сводка нажмите кнопку Просмотреть отчет.
Ниже пункта Результаты по категориям щелкните Хранилище, выберите любой тест, не помеченный как Успешно завершен, а затем просмотрите результаты.
Вернитесь к верхней части отчета и ниже пункта Результаты по категориям выберите Конфигурация кластера, а затем нажмите Список сведений о кластерах сети. Убедитесь, что сеть, предназначенная для подключения между узлами и общими томами кластера, помечена как Внутреннее использование или Внутреннее и клиентское использование. Убедитесь, что другие сети (например, сети, которые используются только для iSCSI, а не для сетевого подключения к кластеру) не имеют таких меток.
Если информация в отчете показывает, что одна или несколько сетей настроены неправильно, вернитесь к оснастке диспетчера отказоустойчивости кластеров и разверните Сети. Щелкните правой кнопкой мыши сеть, которую требуется изменить, нажмите кнопку Свойства, а затем убедитесь в правильности настроек для параметров Разрешить кластеру использовать эту сеть и Разрешить клиентам подключаться через эту сеть.
Чтобы вернуть диски в оперативный режим, нажмите Общие тома кластера, в центральной области щелкните правой кнопкой мыши диск, а затем выберите команду Перевести ресурс в оперативный режим. Повторите это действие для любых других дисков, которые требуется снова перевести в оперативный режим.
Проверка параметров сети, предназначенной для сетевого подключения к общим томам кластера
Чтобы проверить параметры сети, предназначенной для сетевого подключения к общим томам кластера, выполните следующее:
Нажмите кнопку Пуск, выберите пункты Панель управления, Сеть и Интернет, а затем — Центр управления сетями и общим доступом.
В области задач выберите Изменение параметров адаптера.
Щелкните правой кнопкой мыши необходимое подключение и выберите пункт Свойства.
Убедитесь, что установлены следующие флажки:
Клиент для сетей Microsoft
Служба доступа к файлам и принтерам сетей Microsoft
Проверка разрешения необходимой проверки подлинности NTLM
Чтобы просмотреть политики безопасности, которые действуют локально, на узле в кластере нажмите кнопку Пуск, выберите Администрирование, а затем — Локальная политика безопасности.
Выберите Настройки безопасности\Локальные политики\Параметры безопасности.
В центральной области нажмите заголовок Политика, чтобы отсортировать политики в алфавитном порядке.
Просмотрите Сетевая безопасность: ограничения NTLM: добавить удаленные серверы в исключения проверки подлинности NTLM и последующие элементы. Если элементы, связанные с "исключениями для серверов", отмечены как Отключено или другие элементы имеют конкретные параметры, возможно, применяется политика, которая препятствует проверке подлинности NTLM на этом сервере. В этом случае обратитесь к соответствующему администратору (например, к администратору Active Directory или безопасности), чтобы разрешить проверку подлинности NTLM для узлов кластера, которые используют общие тома кластера.
Открытие просмотра событий и просмотр событий, связанных с отказоустойчивой кластеризацией
Чтобы открыть просмотр событий и просмотреть события, связанные с отказоустойчивой кластеризацией, выполните следующее:
Если Диспетчер серверов еще не открыт, нажмите кнопку Пуск, выберите команду Администрирование, а затем щелкните пункт Диспетчер серверов. Если открывается диалоговое окно Контроль учетных записей, убедитесь, что в нем отображено нужное действие, затем нажмите кнопку Да.
В дереве консоли поочередно разверните элементы Диагностика, Просмотр событий, Журналы Windows, а затем выберите Система.
Для фильтрования событий таким образом, чтобы отображались только события с источникомFailoverClustering, в области Действия выберите Фильтровать текущий журнал. На вкладке Фильтр в поле Источники событий выберите FailoverClustering. Выберите другие параметры в случае необходимости и нажмите кнопку ОК.
Чтобы отсортировать отображаемые события по дате и времени, в центральной области щелкните заголовок столбца Дата и время.
Поиск дополнительной информации о кодах ошибок, содержащихся в некоторых сообщениях о событиях
Чтобы найти дополнительную информацию о кодах ошибок, содержащихся в некоторых сообщениях о событиях, выполните следующее:
Просмотрите событие и обратите внимание на код ошибки.
Посмотрите более подробную информацию о коде ошибки одним из двух способов:
Выполните поиск в статье "Коды системных ошибок" ( http://go.microsoft.com/fwlink/?LinkId=83027).
Нажмите кнопку Пуск, подведите указатель мыши к пункту Все программы, выберите Стандартные, затем выберите пункт Командная строка и введите следующий текст:
NET HELPMSG код_ошибки
Проверка
Убедитесь в возможности перевода общего тома кластера в оперативный режим. В случае недавних проблем с записью на том необходимо отслеживать журналы событий и функции соответствующей кластерной виртуальной машины, чтобы убедиться, что эти проблемы решены.
Для выполнения следующих процедур вам необходимо быть членом локальной группы администраторов на каждом кластерном сервере, а учетная запись, которую вы используете, должна быть учетной записью домена или вам должны быть делегированы соответствующие полномочия.
Проверка возможности перевода общего тома кластера в оперативный режим
Чтобы проверить возможность перевода общего тома кластера в оперативный режим, выполните следующее:
Чтобы открыть оснастку отказоустойчивых кластеров, нажмите кнопку Пуск, выберите Администрирование, а затем выберите элемент Диспетчер отказоустойчивости кластеров. Если открывается диалоговое окно Контроль учетных записей, убедитесь, что в нем отображено нужное действие, затем нажмите кнопку Да.
В оснастке диспетчера отказоустойчивости кластеров, если не отображается кластер, которым нужно управлять, в дереве консоли щелкните правой кнопкой мыши Диспетчер отказоустойчивости кластеров, выберите Управлять кластером, а затем выберите или задайте нужный кластер.
Если дерево консоли свернуто, разверните его под кластером, которым нужно управлять, а затем выберите Общие тома кластера.
В центральной области разверните вхождение для тома, который необходимо проверить. Просмотрите состояние тома.
Если том находится в автономном режиме, чтобы перевести его в оперативный режим, щелкните его правой кнопкой мыши, а затем выберите команду Перевести ресурс в оперативный режим.
Проверка состояния ресурса в отказоустойчивом кластере с помощью команды Windows PowerShell
Чтобы проверить состояние ресурса в отказоустойчивом кластере с помощью команды Windows PowerShell, выполните следующее:
На узле в кластере нажмите кнопку Пуск, подведите указатель к пункту Администрирование и выберите Модули Windows PowerShell. Если открывается диалоговое окно Контроль учетных записей, убедитесь, что в нем отображено нужное действие, затем нажмите кнопку Да.
Введите следующий текст:
Get-ClusterSharedVolume
Если выполнить предыдущую команду без указания имени ресурса, отобразится состояние всех общих томов кластера в кластере.
Target | Microsoft.Windows.6.2.Cluster.Monitoring.Service | ||
Category | Alert | ||
Enabled | True | ||
Alert Generate | True | ||
Alert Severity | Error | ||
Alert Priority | Normal | ||
Remotable | True | ||
Alert Message |
|
ID | Module Type | TypeId | RunAs |
---|---|---|---|
DS | DataSource | Microsoft.Windows.6.2.Cluster.EventProvider | Default |
WA | WriteAction | Microsoft.Windows.Cluster.GenerateAlertAction.SuppressedByDescription | Default |
<Rule ID="Microsoft.Windows.6.2.Cluster.Shared.Volume.IO.is.resumed.in.no.direct.io.mode" Enabled="true" Target="Clus8Library!Microsoft.Windows.6.2.Cluster.Monitoring.Service" ConfirmDelivery="true" Remotable="true" Priority="Normal" DiscardLevel="100">
<Category>Alert</Category>
<DataSources>
<DataSource ID="DS" TypeID="Microsoft.Windows.6.2.Cluster.EventProvider">
<Criteria>
<SimpleExpression>
<ValueExpression>
<XPathQuery>EventDisplayNumber</XPathQuery>
</ValueExpression>
<Operator>Equal</Operator>
<ValueExpression>
<Value>5121</Value>
</ValueExpression>
</SimpleExpression>
</Criteria>
<LogName>System</LogName>
<PublisherName>Microsoft-Windows-FailoverClustering</PublisherName>
</DataSource>
</DataSources>
<WriteActions>
<WriteAction ID="WA" TypeID="ClusLibrary!Microsoft.Windows.Cluster.GenerateAlertAction.SuppressedByDescription">
<Priority>1</Priority>
<Severity>2</Severity>
<AlertMessageId>$MPElement[Name="Microsoft.Windows.6.2.Cluster.Shared.Volume.IO.is.resumed.in.no.direct.io.mode.AlertMessage"]$</AlertMessageId>
</WriteAction>
</WriteActions>
</Rule>