Запросить информацию по заданиям, используя следующие команды:
- sacct — отображает данные всех заданий (завершившихся/считающихся/ждущих очереди);
- sreport [options] — генерирует отчеты из данных учета Slurm;
- sstat <JobID> — отображает информацию (использование памяти, ЦПУ и т.д) о считающейся задаче по её JobID ;
- seff <JobID> — отображает эффективность использования ЦПУ и памяти завершившейся задачей по её JobID ;
- scontrol show jobs — отображает состояние запущенных задач;
- scontrol show assoc_mgr — отображает текущее содержимое внутреннего кэша slurmctld для пользователей, ассоциаций и/или qos.
sacct
Просмотр задач конкретного пользователя:
sacct -u user
Просмотр задач всех пользователей:
sacct -a
Начало и конец периода:
sacct —start=2018-07-01 —end=2018-07-15
sreport
Примеры использования sreport для создания отчетов:
sreport cluster UserUtilizationByAccount
sreport cluster AccountUtilizationByUser
Показать статистику в виде дерева учетных карточек (accounts):
sreport cluster AccountUtilizationByUser tree
Выбрать один аккаунт
sreport Accounts=extusers
Вывести отчета в виде таблицы с разделителем ‘|’ для дальнейшей обработки скриптами:
sreport -p ...
Выбор диапазонов дат:
sreport ... start=2018-06-01 end=2018-06-30
sreport ... start=`date -d "last month" +%D` end=`date -d "this month" +%D`
Изменение формата даты/времени в заголовке отчета (форматы в man strftime
):
env SLURM_TIME_FORMAT = "%d-%b-%Y_%R" sreport ...
Задание единиц времени, отображаемых в потреблении ресурсов (по умолчанию — минуты):
sreport -t hourper ...
Задание TRES, отображаемых в потреблении ресурсов (по умолчанию — cpu):
sreport -T cpu,mem ...
Пользовательские ресурсы (в том числе gpu):
sreport --tres=GRES/gpu ...
Показать учетные записи пятидесяти самых активных пользователей за 2017 год:
sreport user top start=2017-01-01 end=2017-12-31 TopCount=50 -t hourper --tres=cpu,GRES/gpu
Отчет об использовании кластера:
sreport -t hourper cluster Utilization
Отчет об использовании кластера по пользователям, сгруппированным в ассоциации:
sreport cluster AccountUtilizationByUser start=2019-04-01 end=2019-05-21 --tres=cpu,GRES/gpu