ESXTOP

Команды и ключи мониторинга сервера esxi

использование esxtop само по себе может тормозить работу сервера VMware ESXi!

Это может произойти в ситуации, если у вас к ESXi смонтировано довольно много логических томов LUN, на обнаружение которых требуется более 5 секунд. Дело в том, что esxtop каждые 5 секунд повторно инициализирует объекты, с которых собирает метрики производительности. В случае с инициализацией LUN, которая занимает длительное время, запросы на инициализацию томов будут складываться в очередь. А как следствие (при большом числе томов) это будет приводить к возрастанию нагрузки на CPU и торможению — как вывода esxtop, так и к замедлению работы сервера в целом.

Выход здесь простой — надо использовать esxtop с параметром -l:

# esxtop -l

В этом случае данная утилита ограничит сбор метрик производительности только теми объектами, которые были обнаружены при первом сканировании. Соответственно, так лучше всего ее и использовать, если у вас к серверу VMware ESXi прицеплено много хранилищ.

 

#esxtop

d- счетчики esxtop для хранилищ

  • GAVG (Guest Average Latency) — общая задержка при выполнении SCSI-команд от гостевой ОС до хранилища сквозь все уровни работы машины с блоками данных. Это, само собой, самое большое значение, равное KAVG+DAVG.
  • KAVG (Kernel Average Latency) — это задержка, возникающая в стеке vSphere для работы с хранилищами (гипервизор, модули для работы SCSI). Это обычно небольшое значение, т.к. ESXi имеет множество оптимизаций в этих компонентах для скорейшего прохождения команд ввода-вывода сквозь них.
  • QAVG (Queue Average latency) — время, проведенное SCSI-командой в очереди на уровне стека работы с хранилищами, до передачи этой команды HBA-адаптеру.
  • DAVG (Device Average Latency) — задержка прохождения команд от HBA адаптера до физических блоков данных на дисковых устройств

 

u-  Для просмотра очереди на HBA-адаптере нужно переключиться в представление HBA кнопкой <u>:

Ну и если у вас наблюдается большое значение DAVG, то дело, скорее всего, не в хосте ESX, а в SAN-фабрике или дисковом массиве, на уровне которых возникают большие задержки.

 

 

И сами кнопки в режиме работающей esxtop:

c = cpu  
m = memory  
n = network  
i = interrupts  
d = disk adapter  
u = disk device (включая NFS-девайсы)  
v = disk VM  
y = power states    
V = показывать только виртуальные машины  
e = раскрыть/свернуть статистики CPU для конкретного GID  
k = убить процесс (только для службы техподдержки!)  
l = ограничить вывод конкретным GID (см. выше)  
# = ограничить число сущностей (см. выше)    
2 = подсветка строчки (двигает фокус вниз)  
8 = подсветка строчки (двигает фокус вверх)  
4 = удалить строчку из результатов вывода  
f = добавить/удалить колонки
o = изменить порядок колонок
W = сохранить сделанные изменения в файл конфигурации esxtop
? = помощь для esxtop