В качестве «инвестиционного советника» ChatGPT оказался намного оптимистичнее в отношении китайских компаний, чем китайский DeepSeek. Прогнозы ИИ зависят от данных, на которых он обучался: недостаток данных может приводить к систематическим ошибкам в оценке активов других стран.
  |   Власта Демьяненко Эконс

Искусственный интеллект произвел революцию в анализе финансовых рынков. Способность больших языковых моделей (LLM – Large Language Models) оптимизировать рутинные процессы, обрабатывать огромные наборы данных и на раннем этапе обнаруживать тренды, незаметные даже искушенным профессионалам, превратила ИИ в востребованный инструмент для управляющих портфелями, профессиональных трейдеров и риск-менеджеров. ИИ «умеет» анализировать корпоративную отчетность и предсказывать доходность акций компаний, их прибыль, дивиденды и будущие инвестиции. Учет этих данных позволяет совершенствовать инвестиционные стратегии и повышать отдачу от вложений.

Однако, несмотря на все свои достоинства, ИИ в роли трейдера несовершенен. Например, LLM-модели «наследуют» некоторые предубеждения и когнитивные искажения, свойственные людям, из данных, на которых обучаются: эффект якоря (сильное влияние первоначальной информации на последующие оценки), гиперболическое дисконтирование (предпочтение немедленного выигрыша более крупному, но отложенному), «переэкстраполяцию» – придание чрезмерно высокой значимости недавним показателям.

ИИ-модели могут систематически завышать оценки акций иностранных компаний – предсказывать более высокие цены и чаще давать рекомендацию «покупать», добавило в копилку когнитивных искажений ИИ новое исследование, которое провели профессор Гарвардской школы бизнеса Чарльз Ван и его соавторы И Сян из Гонконгского политехнического университета и Шон Цао из Университета Мэриленда.

Это явление они назвали «иностранной предвзятостью» (foreign bias). И оно представляет собой полную противоположность свойственной людям «национальной предвзятости» (home bias), когда инвесторы предпочитают активы своей страны, поскольку они им более знакомы и понятны. Причины необъективной оценки зарубежных компаний ИИ-моделями – сугубо «технические»: недостаток обучающих данных, пришли к выводу авторы.

ChatGPT против DeepSeek

Исследователи сравнили прогнозы ИИ-моделей, созданных разработчиками США и Китая – двух мировых лидеров в области ИИ, – в отношении доходности китайских компаний. Авторы использовали две самые прогрессивные ИИ-модели – американский ChatGPT 4.1 и китайский DeepSeek R1.

Обе модели спрогнозировали цены на акции почти 5000 китайских компаний через шесть месяцев (на 31 декабря 2024 г.). Дополнительно ИИ должен был дать инвестиционные рекомендации по каждой бумаге, высказав мнение, следует ли ее покупать, удерживать или продавать. В выборку вошли эмитенты, зарегистрированные на фондовых биржах в Шанхае и Шэньчжэне.

Оказалось, что прогнозы двух моделей существенно различаются – прежде всего тем, что ChatGPT намного более оптимистичен в оценке китайских эмитентов.

Прогнозы цен акций от ChatGPT в среднем превышали прогнозы DeepSeek на 11,6%. ChatGPT также на 1,3 п.п. чаще давал рекомендацию «покупать».

Хотя последнее различие может казаться небольшим, оно сильно повлияло на рекомендации в отношении бумаг, которые LLM покупать не советовали. Львиная доля рекомендаций обеих моделей сводилась к покупке. DeepSeek счел правильным приобретение акций 97,55% фирм выборки и, соответственно, рекомендовал воздержаться от покупки акций оставшихся 2,45% компаний. ChatGPT рекомендовал покупать акции 98,85% фирм и не покупать 1,15% – то есть с его «точки зрения» компаний, в акции которых не стоило инвестировать, было вдвое меньше.

Оптимизм американского ИИ оказался не связан с характеристиками компаний, которые, как правило, влияют на прогнозы. После того как исследователи попросили модели учесть размер, объем прибыли, уровень задолженности и прошлую доходность анализируемых фирм, разница в оценках от ChatGPT и DeepSeek сохранилась. 

Асимметрия информации

Обычно предвзятость LLM-моделей связана с «заимствованием» предубеждений у людей при обучении на созданных людьми данных. Но в данном случае причиной стали различия в информации, на которой обучались модели из двух разных стран, обнаружили Ван и его соавторы.

Финансовые новости ChatGPT «получал» из американских медиа, а DeepSeek – из китайских. Изучив все финансовые новости о китайских компаниях за три года до начала эксперимента из новостной базы RavenPack, на которой обучался ChatGPT, и из базы China Finance News Database (CFND), на которой обучался DeepSeek, исследователи обнаружили существенную асимметрию информации.

Китайские СМИ освещают корпоративные новости очень подробно, и у DeepSeek изначально был доступ практически ко всей имеющейся на тот момент публичной информации о китайских фирмах. В то же время американская пресса не отличается обилием новостей из Китая, а о многих китайских компаниях вообще ничего не пишет. Кроме того, СМИ в США гораздо меньше интересуют негативные новости о китайских компаниях. Все это означает, что набор данных для ChatGPT беднее. По оценкам исследователей, на долю китайских СМИ пришлось 87% всех негативных и 93% позитивных новостей о китайских компаниях.

Когда ChatGPT сталкивается с запросом о китайской компании, о которой у него мало или вообще нет информации, он экстраполирует общие паттерны из своих данных (например, общий тренд роста рынка), вместо того чтобы учитывать специфические риски. Это приводит к более оптимистичной оценке. Кроме того, ChatGPT «не видит» критики – которую публикует китайская пресса, но зачастую игнорирует американская, – что также вносит вклад в формирование более оптимистичного прогноза. «Избыточный» оптимизм ChatGPT возникает именно тогда, когда китайские компании получают непропорционально больше негативного освещения в китайских СМИ по сравнению с американскими, отмечают исследователи.

На то, что оптимизм ChatGPT основан на нехватке данных, указывают и более серьезные, чем у DeepSeek, расхождения в прогнозах с реальными результатами компаний выборки на момент окончания эксперимента 31 декабря 2024 г., отмечают исследователи. У ChatGPT оказалось на 13% больше, чем у DeepSeek, ошибок в ценовых прогнозах, а ошибок в рекомендациях – на 7% больше. Самые серьезные из них касаются компаний с высоким долгом и резкими изменениями стоимости акций – показателями, которые освещаются в местных медиа. Это подтверждает, что главной причиной «иностранной предвзятости» ИИ служит недостаток данных, а не различия в способности моделей их обрабатывать, считают исследователи.

Включение в модель функции веб-поиска, позволяющего узнать об эмитентах больше, снижает предвзятость ChatGPT почти на 80%, но не избавляет от нее полностью. Это говорит о том, что даже доступ к информации в режиме реального времени может лишь частично компенсировать отсутствующие обучающие данные.

Устранение асимметрии

Ситуация полностью меняется, если искусственно устранить асимметрию информации, то есть предоставить ChatGPT тот же объем данных, которым изначально обладает DeepSeek, или, наоборот, лишить DeepSeek информационного преимущества, показали исследователи в трех экспериментах.

В первом из них они снабдили ChatGPT подсказками, содержащими все важные новости о китайских фирмах, опубликованные в китайских СМИ с 2022 г. Это полностью лишило прогнозы и рекомендации ChatGPT избыточного оптимизма, приблизив их к прогнозам и рекомендациям DeepSeek.

Поскольку такая «манипуляция» не изменила веса заложенной в модель информации о китайских эмитентах, результат говорит о том, что на предвзятость ИИ влияет именно доступность данных. Другими словами, относительный оптимизм ChatGPT проистекает от отсутствия китайских новостей в данных для обучения модели, а не из-за недооценки моделью этой информации, уточняют Ван и его соавторы.

Различия в прогнозах ChatGPT и DeepSeek исчезли и при ограничении выборки компаниями, о которых пресса не писала на протяжении трех лет, а также в ходе плацебо-тестов, когда обе модели одновременно обучались на синтетических китайских данных.

Чтобы окончательно убедиться в обоснованности вывода о том, что источником «когнитивного искажения» ChatGPT при оценке китайских активов служит асимметрия информации, исследователи попросили ChatGPT и DeepSeek снова оценить стоимость акций на полугодовом горизонте, но на этот раз – для американских компаний. Деятельность американских эмитентов широко освещается и в США, и в Китае, и различия в прогнозах и рекомендациях американской и китайской LLM-моделей оказались минимальными и статистически незначимыми. Если бы погрешность в расчетах ChatGPT для Китая объяснялась не асимметрией информации, а различиями в моделях, DeepSeek допускал бы такие же ошибки при анализе американских фирм, отмечают исследователи: это подчеркивает, что чрезмерный оптимизм ИИ возникает только в условиях трансграничной асимметрии информации.

Три главных вывода

На основе исследования можно сделать три главных вывода.

Во-первых, новая форма предвзятости ИИ переворачивает традиционные представления о «копировании» моделями человеческого поведения. Если инвесторы в ответ на ограниченность информации демонстрируют «внутреннюю предвзятость», отдавая предпочтение отечественным активам, то ИИ, наоборот, показывает внешнюю предвзятость, чрезмерно оптимистично оценивая иностранные активы. Другими словами, ИИ демонстрирует свои, уникальные предвзятости.

Во-вторых, если люди могут преодолевать асимметрию информации за счет активного поиска информации, то LLM ограничены данными, усвоенными при обучении. То есть чтобы исключить предвзятость ИИ, надо менять массив данных, а не алгоритмы модели: даже идеальная модель будет демонстрировать предвзятость из-за недостатка тренировочных данных.

В-третьих, «иностранная предвзятость» ИИ – фактор, который способен влиять на капитализацию компаний и поведение инвесторов в глобальном масштабе. Чрезмерный оптимизм, который ChatGPT показал в отношении китайских компаний, потенциально не исключен и на других рынках, где большинство новостей выходит не на английском языке. Расхождение финансовых прогнозов LLM, разработанных в разных странах, не исключено и может усиливать трансграничную информационную асимметрию, влияя на инвестиционные решения на глобальном уровне и приводя к ошибкам, которые могут дестабилизировать рынки.

Эти же выводы показывают путь к решению, указывая на важность использования в международных инвестициях не одной, а нескольких мультиязычных LLM-моделей и на критичность наличия локального контекста в данных. ИИ не является нейтральным аналитиком – его прогнозы зависят от информации, на которой он обучался.