Создаваемые на основе онлайн-новостей опережающие индикаторы помогают быстрее оценивать и лучше предсказывать динамику основных экономических показателей.
  |   Диана Асонова Эконс

Развитие технологий открыло доступ к огромным массивам оцифрованного текста, от прессы и корпоративной отчетности до комментариев в соцсетях. Современные методы текстового анализа превращают их в ценный источник информации о текущем состоянии дел и настроениях в экономике.

Анализ онлайн-публикаций широко используется в маркетинге и финансах для прогнозирования продаж, динамики акций, таргетирования рекламы и т.д. В экономике на основе этих данных создаются индикаторы, которые помогают оценивать экономическую ситуацию намного оперативнее, чем опросные бенчмарки и тем более статистические показатели. В основе новостных индексов лежит та же общедоступная информация, опираясь на которую рядовые экономические агенты формируют свое мнение о текущем состоянии и перспективах экономики.

Новости и animal spirits

Новости – важный канал влияния на бизнес-циклы, поскольку новости содержат информацию о будущем: на их основе экономические агенты формируют свои представления о перспективах. И, как предполагает одно из объяснений цикличности деловой активности, люди обрабатывают информацию не очень хорошо: если она, по их мнению, свидетельствует, что развитие ситуации благоприятствует росту спроса и инвестиций, – случается бум, который в случае достоверности информации и реализации ожиданий не завершается крахом. Если же агенты ошиблись или были чрезмерно оптимистичны – краха не миновать. Такая точка зрения тесно связана с кейнсианским понятием animal spirits – эмоциями, которые управляют поведением людей и которые можно измерить с помощью опросов потребителей (на этих опросах основываются, например, индексы потребительской уверенности).

Под новостями в экономической теории все это время понимались изменения в наборах любого вида данных, которые экономические агенты используют для формирования своих ожиданий.

Анализ новостей, понимаемых как публикации в прессе, стал полноценно применяться экономистами для диагностики и прогнозирования развития экономической ситуации лишь несколько лет назад. Один из самых известных новостных индексов – индекс неопределенности экономической политики ( economic policy uncertainty index, EPU), созданный экономистами Скоттом Бейкером, Николасом Блумом и Стивеном Дэвисом. Он оценивает частоту упоминаний в статьях 10 ведущих газет США сочетания трех слов, связанных с экономикой, неопределенностью и политикой. Пиковый рост неопределенности, фиксируемый индексом, предшествует снижению в американской экономике инвестиций, выпуска и занятости, описывают создатели индекса в своей работе.

По аналогичному принципу, используя новостные статьи национальной прессы, они построили индексы неопределенности для 24 стран, включая Россию, а также глобальный, рассчитываемый как средневзвешенный индекс по всем оцениваемым странам. Полгода назад Блум совместно с исследователями из МВФ Хайтсом Ахиром и Давиде Фурчери представили новый индекс – мировой индекс неопределенности ( world uncertainty index, WUI) на основе частоты слова «неопределенность» в квартальных отчетах Economist Intelligence Unit по 143 странам. В первом квартале 2019 г. наблюдался рост этого показателя, что может предвещать сокращение роста мировой экономики на величину до 0,5 п.п. в течение года, прогнозируют авторы индекса. МВФ в апреле понизил прогноз роста мировой экономики в 2019 г. с 3,5%, ожидавшихся им в январе, до 3,3%.

Слова – это новые цифры

Развитие методов машинного обучения создало возможность использовать новости – как наиболее высокочастотные данные – в качестве онлайн-индикатора динамики ключевого экономического показателя – ВВП. Для сбора и обработки статистических данных требуется значительное время, даже если события уже произошли. Поэтому для оценки текущей ситуации и прогнозирования на коротких сроках (наукастинг) используются различные косвенные индикаторы, основанные на опросах, но масштабные опросы дорогостоящие и не всегда возможны. Новости же доступны всегда в режиме реального времени.

Экономисты Банка Англии протестировали два новостных индикатора на основе публикаций газеты The Guardian о политике, экономике и бизнесе. Первый построен путем прямого подсчета положительных и отрицательных слов по заранее заданному словарю. Второй учитывает, помимо точных совпадений, еще и семантически близкие слова. Совместив графики с предварительной оценкой поквартальной динамики британского ВВП, ученые обнаружили, что новостные индикаторы, по всей видимости, реагируют на потенциально важные для состояния экономики сигналы. Их значимость для наукастинга сопоставима с ролью специализированных деловых индексов, динамики фондового рынка и других опережающих индикаторов доверия, которые рассматриваются как индикаторы бизнес-цикла. По итогам «эксперимента» в Банке Англии решили расширить пул анализируемых газет, чтобы охватить различные демографические группы.

Исследователи из Федерального резервного банка Сан-Франциско с помощью специального алгоритма проанализировали эмоциональную окраску посвященных экономике США газетных публикаций за 1980–2015 гг. Полученные в результате индексы новостных настроений, по их мнению, служат полезным дополнением к традиционным опросным индикаторам потребительских настроений при прогнозировании экономической активности.

Анализ газетных публикаций позволяет заметно, до 15%, улучшить качество прогнозирования динамики ВВП даже в сравнении с самыми передовыми системами наукастинга, выяснил Лейф Андерс Торсруд из Банка Норвегии. На базе работы Торсруда «Слова – это новые цифры» создан регулярный индекс финансовых новостей для Норвегии FNI – Retriever/CAMP (BI). Он позволяет оперативно отслеживать динамику ВВП и делового цикла.

Банк России с 2019 г. начал рассчитывать свой новостной индекс деловой активности на основе новостных публикаций: как показало исследование, он позволяет в ежедневном режиме отслеживать экономическую ситуацию в стране с достаточно высокой точностью. Индикатор прогнозирует будущие результаты индекса деловой активности PMI – это сам по себе достаточно оперативный ежемесячный индекс, построенный на основе опросов менеджеров по закупкам и тесно коррелирующий с ВВП.