Выдача отчётов в Slurm

Запросить информацию по заданиям, используя следующие команды:

  • sacct — отображает данные всех заданий (завершившихся/считающихся/ждущих очереди);
  • sreport [options] — генерирует отчеты из данных учета Slurm;
  • sstat <JobID> — отображает информацию (использование памяти, ЦПУ и т.д) о считающейся задаче по её JobID ;
  • seff <JobID> — отображает эффективность использования ЦПУ и памяти завершившейся задачей по её JobID ;
  • scontrol show jobs — отображает состояние запущенных задач;
  • scontrol show assoc_mgr — отображает текущее содержимое внутреннего кэша slurmctld для пользователей, ассоциаций и/или qos.

sacct

Просмотр задач конкретного пользователя:

sacct -u user

Просмотр задач всех пользователей:

sacct -a

Начало и конец периода:

sacct —start=2018-07-01 —end=2018-07-15

sreport

Примеры использования sreport для создания отчетов:

sreport cluster UserUtilizationByAccount
sreport cluster AccountUtilizationByUser 

Показать статистику в виде дерева учетных карточек (accounts):

sreport cluster AccountUtilizationByUser tree 

Выбрать один аккаунт

sreport Accounts=extusers

Вывести отчета в виде таблицы с разделителем ‘|’ для дальнейшей обработки скриптами:

sreport -p ... 

Выбор диапазонов дат:

sreport ... start=2018-06-01 end=2018-06-30
sreport ... start=`date -d "last month" +%D` end=`date -d "this month" +%D`

Изменение формата даты/времени в заголовке отчета (форматы в man strftime):

env SLURM_TIME_FORMAT = "%d-%b-%Y_%R" sreport ... 

Задание единиц времени, отображаемых в потреблении ресурсов (по умолчанию — минуты):

sreport -t hourper ... 

Задание TRES, отображаемых в потреблении ресурсов (по умолчанию — cpu):

sreport -T cpu,mem ... 

Пользовательские ресурсы (в том числе gpu):

 sreport  --tres=GRES/gpu ...

Показать учетные записи пятидесяти самых активных пользователей за 2017 год:

sreport user top start=2017-01-01 end=2017-12-31 TopCount=50 -t hourper --tres=cpu,GRES/gpu 

Отчет об использовании кластера:

sreport -t hourper cluster Utilization

Отчет об использовании кластера по пользователям, сгруппированным в ассоциации:

sreport cluster AccountUtilizationByUser  start=2019-04-01 end=2019-05-21 --tres=cpu,GRES/gpu