Данные о последнем обновленном резюме российских соискателей (т.е. 1 резюме = 1 пользователь, что исключает использование дублей), в котором:
- Дата обновления не раньше 1 января 2021 года (каждый год дата будет смещаться на год вперед)
- Указано наличие высшего образования (либо просто «Высшее», либо «Бакалавриат») с датой окончания в предыдущие 2 года (например, для рейтинга 2023 года — данные о выпускниках 2021 и 2022 годов)
- Указан возраст от 18 до 30 лет
В итоговый рейтинг попадают вузы, по которым есть данные не менее чем о 100 выпускниках.
- X1. Популярность вуза в своем регионе:
- Доля числа выпускников вуза от общего числа выпускников вузов одного региона.
- X2. Востребованность выпускников вуза у работодателей:
- Среднее число приглашений на собеседования, полученных одним выпускником вуза от работодателей на hh.ru в предшествующие году составления рейтинга 2 года (например, для рейтинга 2023 года — данные о приглашениях, полученных в 2021 и 2022 годах).
- X3. Относительный уровень ожидаемых зарплат выпускников вуза:
- Отношение медианного значения зарплаты, указанной в резюме выпускников вуза, к медианному значению зарплаты, указанной в резюме выпускников вузов одного региона.
- X4. Величина опыта работы выпускников:
- Среднее число месяцев опыта работы, указанных в резюме у выпускника вуза. Для того, чтобы избежать ложных перекосов и ошибок, мы удалили из анализа те резюме, где опыт работы превышал 144 месяца (12 лет) — эту границу выбрали как максимально возможный промежуток между 18 и 30 годами (возрастные границы выборки).
- X5. Текущая трудоустроенность выпускников:
- Доля числа выпускников, в резюме которых есть хотя бы одно место работы с открытой датой окончания (т.е. у них на момент анализа предположительно есть работа), от общего числа резюме выпускников вуза. Мы идем на сознательное допущение, что соискатели своевременно заполняют опыт работы в своих резюме.
Все показатели по каждому вузу были стандартизированы при помощи нормализации средним (Z-нормализация) по региону:
xiнорм = xi - Xσx ,
где xi — показатель вуза, X — среднее арифметическое показателя по всем вузам одного региона, а σx — стандартное отклонение показателя по всем вузам одного региона.
К первым трем параметрам (популярность вуза, востребованность у работодателей, зарплаты) мы применяем повышающие коэффициенты (2, 1,2 и 1,2 соответственно), к оставшимся двум (опыт работы и текущая трудоустроенность) — понижающие (0,5), т.к. из-за особенностей наших данных они могут не всегда соответствовать реальности.
R = 2×x1норм + 1,2×x2норм + 1,2×x3норм + 0,5×x4норм + 0,5×x5норм + 100