Разработанная программа для компьютера помогла обнаружить эти скрытые речевые паттерны. Сначала ученые использовали машинное обучение, чтобы установить нормы для речи здорового человека. Для этого они использовали программу онлайн-бесед с 30 тыс. пользователей сети Reddit, где люди разговаривают на разные темы. Программа переводила произнесенные фразы в формулы, назначая каждому слову место в семантическом пространстве. Также исследователи создали программу для анализа семантической плотности использования слов, это позволило определить, сколько информации содержится в каждом предложении. После формирования базы нормативных данных ученые применили те же методы к диагностическим интервью с 40 пациентами с высоким риском развития психоза, которые были проведены врачами. Затем исследователи сравнили полученные данные с контрольной группой (здоровых людей) и группой риска.
Результаты показали, что у людей, которые чаще употребляли слова исходя из его звучания и слова с аналогичным значением, с большой долей вероятности разовьется психическое заболевание. Сейчас ученые собирают объем данных для изучения различных психоневрологических заболеваний, в том числе деменции.