Попал в новости — получи кредит

Павел Кобер
9 декабря 2019, 00:00

Банкиры начали использовать искусственный интеллект для анализа сообщений в СМИ о деятельности компаний — действующих и потенциальных заемщиков

ПАВЕЛ КОБЕР
Михаил Шевцов считает отсев искусственным интеллектом фейковых новостей вполне решаемой задачей
Читайте Monocle.ru в

DS-мониторинг (Data Science, наука о данных) все чаще применяют банки для работы с клиентами. К примеру, у Сбербанка около 900 сотрудников по всей стране следят за финансовым состоянием компаний-заемщиков и 300 человек — за сохранностью залогов. Цель финансово-кредитной организации — чтобы модели искусственного интеллекта выполняли примерно 80% этой работы. Таких моделей, позволяющих собирать большие объемы данных, обрабатывать и выдавать результат, в Сбере разработано уже 54. Так, одна из моделей на основе банковских транзакций и финансовой отчетности выявляет контрагентов и отрасли, влияющие на бизнес заемщиков.

Ловцы событий

Свежий тренд — новостной DS-мони­торинг, о котором рассказал на конференции по искусственному интеллекту в екатеринбургском Ельцин Центре директор дивизиона «Цифровой кредитный мониторинг» Сбербанка Михаил Шевцов:

— Банк выдает кредиты большим и малым компаниям. Конечно же, нам нужно смотреть, все ли с бизнесом этих компаний хорошо. Развиваем такое направление, как новостной мониторинг. То есть наша модель представляет новости о компаниях и события, релевантные ухудшению или улучшению их бизнеса. В день проходит миллион новостей, нашим сотрудникам это все нужно перечитывать, но сделать это физически невозможно. Поэтому мы берем несколько новостных лент, привязываем их к кредитным портфелям компаний, потом смотрим, какие события нам нужно «отловить». Таким образом, мы сильно сужаем вал новостей и выдаем только результат.

В начале 2019 года Сбер внедрил в систему онлайн-мониторинга новостей интеллектуальные технологии ABBYY, чтобы автоматически анализировать содержание сообщений на русском языке. На первом этапе это были сообщения СМИ о тысяче с лишним банков-контрагентов. Позднее сфера применения модели была расширена, сегодня она способна охватить 200 тыс. компаний, а в перспективе — практически все 8 млн организаций, числящихся в справочнике Сбербанка. Благодаря этому решению в онлайн-режиме происходят агрегирование и смысловой разбор новостей, классификация их по различным рисковым факторам. Это существенно снизило трудозатраты сотрудников на обработку и структурирование информации, значительно повысило скорость реакции банка на события, в которых замешан тот или иной заемщик.

— Сейчас мы тестируем эту услугу как внешний сервис для клиентов: есть пилот с Московской биржей и еще целым рядом компаний. Планируем потом на этом зарабатывать, — говорит Михаил Шевцов. — В рамках модели новостного DS-мониторинга у нас сегодня уже созданы такие продукты, как приложение для сотрудников (настраиваемая лента новостей, единое окно информации, интеграция с другими системами), канал в Telegram (крупнейшие компании, хэштеги для важных событий, повышение скорости реакции), чат-бот в Telegram

(подписка на новости по компаниям, хэштеги, кастомизация ленты новостей), API для внешних клиентов (настраиваемый поток данных, 60 крупнейших источников, только ключевая информация).

В настоящее время приложение Сбера тестируют более 1700 пользователей. Система обрабатывает в день более 65 тыс. уникальных (не дублирующих друг друга) новостей. Тексты показывают 90-процентную точность моделей поиска событий. При этом точность привязки компании к новости пока невелика — 55%, но по клиентам CIB (крупнейшим компаниям) она составляет 99%.

В ближайшие два года Сбербанк намерен разработать модель новостного DS-мониторинга следующего поколения: она освободит его сотрудников от необходимости в случае появления сообщений об экстраординарных событиях в той или иной компании-заемщике ехать в эту компанию и на месте обсуждать перспективы погашения кредита. Модель будет сама выдавать стратегию по клиенту и расписывать план действий.

— Развивать это направление планируем в Екатеринбурге: подготовка и сопровождение витрин данных, разработка моделей для новостного мониторинга, разработка мобильной версии приложения для смартфона и планшета, — добавил Михаил Шевцов.

Это сказал фараон

Анализ новостей с использованием методов глубокого обучения банкиры пытаются применять не только для отслеживания бизнеса уже имеющихся компаний-заемщиков, но и для привлечения новых. Здесь важно оперативно реагировать на публикующуюся информацию о тех или иных шагах потенциальных инвесторов: их заявления о готовящихся проектах, подборе площадок под строительство, ведении переговоров, подписании соглашения о намерениях и др.

Алгоритм анализа сообщений СМИ для выявления потенциального финансового партнера банка 023_expert_ural_50.jpg
Алгоритм анализа сообщений СМИ для выявления потенциального финансового партнера банка

— Мы работаем совместно с нашими коллегами из новостного мониторинга, — поделилась на той же конференции по искусственному интеллекту сотрудник блока корпоративно-инвестиционного бизнеса Сбербанка Екатерина Патракова. — Они разрабатывают классификаторы и выделяют некие события в новости. Мы опираемся на их разработки и берем от них новости по темам, которые потенциально могут принести нам деньги. К примеру, к нам попала новость о потенциальном контракте или новом инвестпроекте. Далее мы выделяем участников этой сделки и ее сумму, которые описаны в новости. После этого выдаем задачу клиентскому менеджеру, который должен проработать участие банка в качестве финансового партнера, подготовить специализированное продуктовое предложение для клиента. У Сбера много различных видов кредитования, поэтому мы каким-то образом можем поучаствовать в этом проекте. Пока мы тестируем эту систему в течение одного месяца и выставляем небольшое количество задач. Получилось выдать кредитов на 3,6 млрд рублей. В работе задачи еще на 13,5 миллиарда.

По словам Екатерины Патраковой, при анализе новостей в данном случае итоговой задачей является определение ИНН компании, которая заинтересовала банк в качестве потенциального заемщика, ведь менеджер должен четко понимать, к какой конкретно организации ему идти с кредитным предложением. Для этого создается около десятка видов связанных сущностей: упоминаемые в новостях названия компаний, локации, действующие лица и т.д. Также важно понимать из новости роль компании в проекте, выступает ли она инвестором, соинвестором, проектировщиком, застройщиком или оператором. А может, просто решила засветиться на событии, к которому в действительности не имеет прямого отношения.

— Есть важная для нас информация, которую модель пока плохо улавливает, — признается Екатерина Патракова. — Названия компаний и учреждений в новостях иногда весьма вольно сокращаются. Например, Ивановская областная дума сокращается до Ивоблдума, вместо министерства имущественных отношений Московской области — Минмособлимущества, а вместо ООО «ЧайКофеОптом» — ЧКО. Найти такие соответствия в нашем справочнике на 8 млн организаций очень сложно. Поэтому мы обогатили справочник: помимо полной формы названия организации также указываем короткую форму и, если имеется, аббревиатуру.

Другая сложность — обучить программу распознавать именно новости, то есть сообщения только о новых событиях. Нередко попадается относительно свежая информация, содержащая новости месячной и даже годовой давности, которые уже были отработаны сотрудниками банка. Но тут важно не пропустить сообщения, которые в действительности не являются дублем: например, несмотря на то, что пересекаются некоторые сущности (те же компании и действующие лица), названия инвестпроектов разные, к тому же запланированы к реализации в разных регионах.

Но это еще полбеды. Как искусственный интеллект будет фильтровать фейковые и рекламные новости, имеющие целью пиар компаний или дискредитацию конкурентов, содержащие откровенную дезинформацию или только половину правды? Представители банка говорят о неком ранжировании источников информации по степени достоверности. Как это будет выглядеть на практике — большой вопрос, ведь таких источников информации уже сейчас используется свыше 60 тысяч. Причем в этот список включены не только СМИ, имеющие высокую репутацию, но также желтая пресса и каналы в соцсетях. Теоретически ложь должна отсеиваться при сравнении с достаточно большой выборкой новостей, поступающих за последние два-три месяца. Поскольку лгут все по-разному, а правда — всегда одна, как сказал Тутанхамон, который был очень умен. Тоже, кстати, фейк, ведь он умер, не успев вступить во взрослую жизнь.