Учёные Университета Лобачевского в Нижнем Новгороде создали экспериментальную систему, способную определять тревогу и стресс по голосу. Разработкой занимаются специалисты кафедры киберпсихологии факультета социальных наук. По итогам пилотного эксперимента точность алгоритма достигла 91,9%.
Система основана на методах машинного обучения и анализе акустических характеристик голоса. Алгоритм учитывает высоту и громкость звучания, тембр, скорость речи и другие параметры, которые меняются при переживании стресса. Эти признаки позволяют модели различать спокойное и напряжённое состояние говорящего, даже если внешне человек старается сохранять обычный тон.
Как пояснила заведующая кафедрой киберпсихологии ННГУ Валерия Демарёва, технология может найти применение в различных сферах. В частности, система поможет отслеживать перегрузку операторов, диспетчеров, медработников и других специалистов, где ошибки на фоне психологического напряжения особенно опасны. Своевременное выявление повышенного стресса позволит вовремя скорректировать график или условия работы.
Исследователи отмечают, что подобные алгоритмы могут использоваться и в банковской сфере. Анализ эмоционального состояния клиента во время разговора способен помочь выявить случаи, когда человек действует под давлением мошенников или введён в заблуждение. Если система фиксирует выраженную тревогу или стресс, это может стать сигналом для дополнительной проверки операции.
В пилотном эксперименте участвовали десять студентов кафедры киберпсихологии. Они записывали фрагменты научной презентации в двух условиях: при выступлении перед комиссией и во время репетиции без аудитории. Затем записи разделили на короткие звуковые фрагменты длительностью около пяти секунд, всего было получено более тысячи отрезков речи для анализа.
Для обработки данных использовали мел-частотные кепстральные коэффициенты — один из распространённых методов описания звукового сигнала. На основе этих параметров алгоритм Gradient Boosting обучили различать стрессовые и нейтральные фрагменты речи. По результатам тестирования точность распознавания составила 91,9%. Учёные подчёркивают, что такой результат получен в контролируемых условиях и требует дальнейшей проверки.
В дальнейшем исследовательская группа планирует расширить выборку участников, добавить новые акустические признаки и проверить работу модели на более разнообразных записях. Проект реализуется при поддержке Российского научного фонда, а результаты уже опубликованы на платформе Springer Nature Link. Это позволит международному научному сообществу оценить подход нижегородских специалистов.
Фото: из открытых источников