En esta ocasión se presenta un procedimiento fácil y rápido para silenciar las alarmas generadas por el health check de vSAN, que puede ser utilizado en ambientes Nested (ESXi virtualizados) o en ambientes de laboratorio propiamente dichos. Esta puede ser una opción para omitir algunas de la verificaciones debido a que no siempre contamos con las condiciones de hardware, firmware y drivers apropiados para implementar la solución; ni mucho menos contamos con vSAN ReadyNodes disponibles para una POC (Proof of Concept).
¡CUIDADO! En ningún momento se recomienda este procedimiento en ambientes vSAN productivos ya que todos los componentes de hardware, drivers y firmware deben coincidir con la Guía de Compatibilidad de VSAN indicada para los nodos que conforman la solución.
Antes de iniciar el procedimiento comentemos un poco acerca de RVC (Ruby vSphere Console). Es una consola de línea de comando para VMware vSphere y Virtual Center. Ruby vSphere Console es basada en la popular interface RbVmomi Ruby para vSphere API. RbVmomi fue creada para reducir drásticamente la cantidad de codificación requerida para realizar tareas rutinarias, así como aumentar la eficacia de la ejecución de tareas, al tiempo que permite la máxima potencia de la API cuando es necesario. RVC se encuentra incluida en el vCenter Server Appliance (VCSA) y la versión de Windows de vCenter Server, y se ha convirtiendo en una de las principales herramientas para administrar y solucionar problemas de entornos Virtual SAN (vSAN).
RVC tiene muchas de las capacidades que se esperan de una interfaz de línea de comandos.
- Finalización de tabulación
- Comodines
- Marcas
- Modo Ruby
- Modo Python
- Introspección VMODL
- Conexiones múltiples
Extensibilidad
- Guiones de Ruby de una sola línea
- Casos de uso y ventajas de RVC
- Funcionalidad Virtual SAN cubierta
- Configuración de VSAN y políticas de almacenamiento
- Comandos de monitorización / resolución de problemas
- Monitoreo del desempeño a través de VSAN Observer
Ventajas
- Más información detallada sobre Virtual SAN vSphere Web Client
- Vista de grupo de VSAN mientras que esxcli solo puede ofrecer una perspectiva de servidor
- Operaciones masivas a través de comodines
- Funciona directamente contra ESX host, incluso si VC no funciona
NOTA: Para mayor información acerca de la utilización de RVC aplicada a vSAN podemos consultar la guía oficial VMware Ruby vSphere Console Command Reference for Virtual SAN.
PROCEDIMIENTO
1. Tenga presente que existe una lista de checks o validaciones que están disponibles para ser configurados y se encuentran consignados en la siguiente tabla. De manera que primero debemos verificar si la alarma que muestra el monitor de salud de vSAN se encuentra en éste listado.
Descripción | Check ID |
Cloud Health | |
Controller utility is installed on host | vendortoolpresence |
Controller with pass-through and RAID disks | mixedmode |
Customer experience improvement program (CEIP) | vsancloudhealthceipexception |
Disks usage on storage controller | diskusage |
Online health connectivity | vsancloudhealthconnectionexception |
vSAN and VMFS datastores on a Dell H730 controller with the lsi_mr3 driver | mixedmodeh730 |
vSAN configuration for LSI-3108 based controller | h730 |
vSAN max component size | smalldiskstest |
Cluster | |
Advanced vSAN configuration in sync | advcfgsync |
Deduplication and compression configuration consistency | physdiskdedupconfig |
Deduplication and compression usage health | physdiskdedupusage |
Disk format version | upgradelowerhosts |
ESXi vSAN Health service installation | healtheaminstall |
Resync operations throttling | resynclimit |
Software version compatibility | upgradesoftware |
Time is synchronized across hosts and VC | timedrift |
vSAN CLOMD liveness | clomdliveness |
vSAN Disk Balance | diskbalance |
vSAN Health Service up-to-date | healthversion |
vSAN cluster configuration consistency | consistentconfig |
vSphere cluster members match vSAN cluster members | clustermembership |
Data | |
vSAN VM health | vmhealth |
vSAN object health | objecthealth |
Encryption | |
CPU AES-NI is enabled on hosts | hostcpuaesni |
vCenter and all hosts are connected to Key Management Servers | kmsconnection |
Hardware compatibility | |
Controller disk group mode is VMware certified | controllerdiskmode |
Controller driver is VMware certified | controllerdriver |
Controller firmware is VMware certified | controllerfirmware |
Controller is VMware certified for ESXi release | controllerreleasesupport |
Host issues retrieving hardware info | hclhostbadstate |
SCSI controller is VMware certified | controlleronhcl |
vSAN HCL DB Auto Update | autohclupdate |
vSAN HCL DB up-to-date | hcldbuptodate |
Limits | |
After 1 additional host failure | limit1hf |
Current cluster situation | limit0hf |
Host component limit | nodecomponentlimit |
Network | |
Active multicast connectivity check | multicastdeepdive |
All hosts have a vSAN vmknic configured | vsanvmknic |
All hosts have matching multicast settings | multicastsettings |
All hosts have matching subnets | matchingsubnet |
Hosts disconnected from VC | hostdisconnected |
Hosts with connectivity issues | hostconnectivity |
Multicast assessment based on other checks | multicastsuspected |
Network latency check | hostlatencycheck |
vMotion: Basic (unicast) connectivity check | vmotionpingsmall |
vMotion: MTU check (ping with large packet size) | vmotionpinglarge |
vSAN cluster partition | clusterpartition |
vSAN: Basic (unicast) connectivity check | smallping |
vSAN: MTU check (ping with large packet size) | largeping |
Performance service | |
All hosts contributing stats | hostsmissing |
Performance data collection | collection |
Performance service status | perfsvcstatus |
Stats DB object | statsdb |
Stats DB object conflicts | renameddirs |
Stats master election | masterexist |
Verbose mode | verbosemode |
Physical disk | |
Component limit health | physdiskcomplimithealth |
Component metadata health | componentmetadata |
Congestion | physdiskcongestion |
Disk capacity | physdiskcapacity |
Memory pools (heaps) | lsomheap |
Memory pools (slabs) | lsomslab |
Metadata health | physdiskmetadata |
Overall disks health | physdiskoverall |
Physical disk health retrieval issues | physdiskhostissues |
Software state health | physdisksoftware |
Stretched cluster | |
Invalid preferred fault domain on witness host | witnesspreferredfaultdomaininvalid |
Invalid unicast agent | hostwithinvalidunicastagent |
No disk claimed on witness host | witnesswithnodiskmapping |
Preferred fault domain unset | witnesspreferredfaultdomainnotexist |
Site latency health | siteconnectivity |
Unexpected number of fault domains | clusterwithouttwodatafaultdomains |
Unicast agent configuration inconsistent | clusterwithmultipleunicastagents |
Unicast agent not configured | hostunicastagentunset |
Unsupported host version | hostwithnostretchedclustersupport |
Witness host fault domain misconfigured | witnessfaultdomaininvalid |
Witness host not found | clusterwithoutonewitnesshost |
Witness host within vCenter cluster | witnessinsidevccluster |
vSAN Build Recommendation | |
vSAN Build Recommendation Engine Health | vumconfig |
vSAN build recommendation | vumrecommendation |
vSAN iSCSI target service | |
Home object | iscsihomeobjectstatustest |
Network configuration | iscsiservicenetworktest |
Service runtime status | iscsiservicerunningtest |
2. Inicie sesión SSH en el vCenter Server Appliance y conéctese al Ruby vSphere Console (RVC) ejecutando el siguiente comando (sin habilitar el Shell)
rvc username@localhost
Ejemplo:
Command> rvc administrator@vsphere.local@localhost
3. Ingrese el password del usuario administrator@vsphere.local
Se utilizarán los siguientes comandos RVC para verificar y silenciar las alarmas
- vsan.health.silent_health_check_status
- vsan.health.silent_health_check_configure
4. Verifique el estado de las alertas con el primer comando, para el cual se debe conocer la ruta de cluster a analizar. Puede apoyarse de los comando cd y ls para navegar hasta encontrar la ruta correcta del cluster vSAN.
Ejemplo:
vsan.health.silent_health_check_status /localhost/Datacenter-Lab01/computers/vSAN-Cluster
5. Desde el vSphere Web Client navegue hasta el NombredelCluster|vSAN|Health para identificar el nombre de la alerta que se desea silenciar, teniendo en cuenta por supuesto que la misma no sea de impacto para la operación normal de la solución, de lo contrario deberá realizarse una adecuada investigación y solución del problema.
Para este caso al ser un ambiente de laboratorio virtualizado, se tiene la alerta SCSI controller is VMware certified que nos indica acerca de la incompatibilidad de la controladora de discos para el uso de vSAN, que no podemos solucionar debido a que la controladora es virtual; por lo tanto puede ser ignorada o silenciada. (¡Recuerde! Esto acción no debe ser realizada en ambientes productivos).
6. En la salida del comando anterior se muestra el mismo listado de Health Checks disponibles para configurar y su estado actual. De manera que para silenciar la verificación SCSI controller is VMware certified, se debe utilizar su correspondiente identificador o Check ID controlleronhcl
7. Ahora solo queda ejecutar el comando de configuración vsan.health.silent_health_check_configure de la siguiente manera para silenciar la alarma
vsan.health.silent_health_check_configure /localhost/Datacenter-Lab01/computers/vSAN-Cluster –a ‘controlleronhcl’
Utilice los parámetros de configuración disponibles, de acuerdo a su necesidad.
-a | –add-checks= |
Agregar verificación a la lista silenciosa, uso: -a [Health Check Id]. |
-r | –remove-cheques= |
Eliminar verificación de la lista silenciosa, uso: -r [Health Check Id]. Para restaurar la lista de verificación silenciosa, utilizando ‘-r all’ |
-i | –interactive-add | Usa el modo interactivo para agregar verificación a la lista silenciosa |
-n | –interactive-remove | Usa el modo interactivo para eliminar las verificaciones de la lista silenciosa |
-h | –help | Muestra este mensaje |
8. Regrese al vSphere Web Client y haga click en Retest en el Health monitor de vSAN para validar el cambio y podrá observar que la alerta aparece ahora como Skipped y no como Warning.