От больших данных ждут большего

Рынок решений для работы с данными через три года вырастет в два с половиной раза и будет почти полностью занят российскими игроками. Резкий отказ от западного ПО запустил процесс кардинального обновления систем для работы с большими данными, на что бизнес еще долго бы не решился

Рынок решений для больших данных оказался полностью в руках русских разработчиков
Читать на monocle.ru

«То, что происходит сейчас, ― аналог 90-х годов: масса вариантов, все бегают, денег до черта» ― так описал происходящее на российском IT-рынке в целом и на рынке решений для работы с большими данными в частности на IV конференции ArenaDay член совета директоров «Диасофта» Александр Генцис.

Энтузиазм IT-сообщества неудивителен: во-первых, сам рынок решений по хранению и обработке больших данных бурно растет: по прогнозу фонда «Центр стратегических разработок», к 2027 году он достигнет 170 млрд рублей, а среднегодовой темп роста составит 25%. Компании буквально тонут в данных, которые непрерывно копятся: объем неструктурированных данных к 2026 году по сравнению с 2023-м утроится.

Озера данных перелились через край

Уже сейчас банки и другие отрасли, работающие с огромным числом розничных клиентов, владеют внушительными объемами информации: так, у «Почты России» в аналитическом хранилище более 7 петабайт (Пб) данных, у Газпромбанка более 3 Пб. Эти объемы трудно себе представить, но некоторое понимание может дать тот факт, что 1 Пб — это 500 млрд страниц текста, то есть миллиард толстых книг по 500 страниц, больше, чем в десяти самых крупных библиотеках мира, вместе взятых.

И это не пассивно хранящиеся данные, а данные, к которым информационные системы постоянно обращаются. Плюс пользователи ежесекундно добавляют новые данные, и часто исходя из этого нужно что-то менять ― например, пересчитывать остаток денег на банковском счете, когда клиент совершает покупку, или помечать доставленным письмо, которое клиент забрал.

Даже просто поддерживать порядок в этом информационном хозяйстве — сложная задача, для решения которой уже изобретены специальные программы: для «очистки» данных от ошибок, для их каталогизации и т. д.

Во-вторых, российские вендоры сейчас оказались единственными игроками на отечественном рынке: Oracle, SAP и прочие зарубежные компании, предоставлявшие продукты для обработки больших данных, в одночасье ушли с российского рынка. Еще в 2021 году правительство озаботилось тем, чтобы объекты критической информационной инфраструктуры (КИИ) — госорганы, банки, объекты транспорта, связи, здравоохранения, предприятия оборонной, топливной и атомной промышленности и энергетики — были переведены на отечественное ПО, а весной 2022 года тем, кто делает закупки по 223-ФЗ, вообще запретили покупать зарубежное ПО. В итоге доля российских вендоров на рынке решений для больших данных, по оценке одного из крупнейших игроков этого рынка Arenadata, буквально за пару лет вырастет с 66 до 98% (см. график). Впрочем, генеральный директор Группы Arenadata Максим Пустовой не согласен с тем, что импортозамещение ― единственный и главный драйвер рынка. «Уход западных игроков создал дополнительный спрос, ― признает он, ― но у нас нет проектов импортозамещения “лоб в лоб”». В процессе перехода на продукты Arenadata бизнес получает дополнительный функционал, у него есть запросы на эффективность, монетизацию данных, на то, чтобы извлекать из них ценность. Хотя, в принципе, тем, кто не подпадает под определение КИИ, можно не замещать ПО и продолжать жить с умирающими SAP или Oracle; уже образовался и черный рынок «железа» с соответствующим ПО.

Важный фактор ― стоимость российских решений: исполнительный вице-президент Газпромбанка Игорь Ашметков, рассказывая на конференции, как банк строит новую платформу данных, упомянул, что западные серверы несоизмеримо дороже, так что переход на российские решения даст существенную экономию в хранении данных в пересчете на 1 Тб.

Александр Генцис предупреждает: импортозамещение как таковое еще не началось, крупные компании только купили лицензии и собираются начать переход на платформы по хранению данных на основе российских решений. И теперь предстоит перевести корпоративное ПО, «прибитое гвоздями» к Oracle, Microsoft, Teradata, на новые отечественные решения. Тут будет много сюрпризов, и никто на планете еще не решал такой задачи, говорит Генцис.

Неудивительно, что в таких условиях IT-компании демонстрируют бурный рост и одна за другой выходят на IPO (достаточно вспомнить сам «Диасофт» или «Астру»). Arenadata тоже уверенно включают в перечень тех, кто готовится в 2024 году выйти на IPO, хотя сама компания на своей ежегодной конференции для клиентов и партнеров ArenaDay 2024 не подтвердила это намерение. Но представила свои финансовые результаты (+60% роста выручки и +50% чистой прибыли ежегодно в последние два года, оборот 4 млрд рублей, рентабельность 37%) и рассказала инвестсообществу о планах и перспективах (расти вдвое быстрее рынка за счет своей позиции игрока номер один на рынке систем управления базами данных, СУБД, и целого комплекса решений для работы с данными вместо монопродукта).

Кроме Arenadata свои СУБД предлагают Сбер, «Ростелеком» (RT.Warehouse), «Яндекс», Postgres Professional и некоторые другие.

Пора обновиться

Управление данными, информационные системы для этого сегодня такая же необходимая инфраструктура для компаний, как электричество или интернет. Ее можно настраивать и улучшать практически бесконечно, «подкручивая» те или иные параметры. Взрывного роста эффективности работа с данными не принесет ― но, похоже, этого никто и не ждет.

Более того, импортозамещение запустило такое обновление СУБД, на которое бизнес в иных условиях, скорее всего, и не решился бы.

«Крупные банки создавали свои системы по управлению данными в 2005‒2010 годах, и с тех пор не просто многое поменялось — весь мир перевернулся. Но до недавнего времени начинать переход на новые платформы было невозможно именно по причине того, что экономическая эффективность такого перехода была слишком неочевидна, — говорит источник “Монокля” в одном из крупнейших банков. — Получилось, что ситуация с СВО и импортозамещением дала нам шанс сделать новые СУБД фактически с нуля, кардинально переделать Data Lakes (озера данных), а не дорабатывать бесконечно старые решения, где уже накопилось много гнилого и где модернизация уже просто не имела смысла, ведь сколько ты ни прикручивай новые колеса к телеге, двигатель от этого у нее не появится. Хотя в значительной мере бизнес делает работу по оптимизации своих СУБД, потому что не может этого не делать и воспринимает это как своего рода налог».

Торговым сетям управление данными позволяет прогнозировать спрос и грамотно пополнять товарные запасы. Промышленникам ― планировать техобслуживание оборудования и следить за техникой безопасности. Мобильным операторам и банкам ― отслеживать изменения в режиме реального времени, чтобы, условно говоря, подбивать балансы своих клиентов.

К примеру, «Вкусно — и точка» от своей с нуля построенной платформы данных хочет получить возможность анализировать маржинальность и наем, планировать и оптимизировать промокампании и контролировать цены.

«Ретейлеры, объединив данные логистики, маркетинга и продаж в единое хранилище, могут получить синергию и дополнительный рост ключевых показателей, — рассказывает Андрей Жуков, коммерческий директор Arenadata. — Это происходит за счет оптимизации планирования, логистики, ценообразования, прогнозирования спроса и построения глубокой клиентской сегментации». В Arenadata говорят, что их заказчики-ретейлеры благодаря новым решениям вдвое сокращают сроки вывода на рынок новых продуктов и услуг или увеличивают прибыль до 3% за счет скорости и качества решений, которые они могут принимать на основании единого хранилища данных.

«Более точный маркетинг с помощью больших данных довольно избитая история, но, как ни странно, это работает и основной экономический эффект от работы с данными компании получают в продажах и коммуникациях с клиентом, — говорит собеседник “Монокля” в крупном банке. — Сейчас сложилась ситуация, когда все банки предлагают примерно одинаковые продукты, и главное, что может удержать клиента, — сервис. Особенно сейчас, когда с 1 мая исчезнут лимиты на переводы средств через СБП и уйти из банка, если что-то не понравилось, будет очень легко. Поэтому для нас важно в реальном времени отслеживать падение сервисов — платежей, переводов и так далее, чтобы успеть починить что-то еще до того, как нам позвонят клиенты и о проблеме напишут на banki.ru. И хотя посчитать прямые потери, которых мы избегаем, не так просто, это важнейшее направление в борьбе за сервис и клиента, так как рейтинги клиентского опыта — один из главных KPI. Кроме того, с переходом на новую платформу данных мы сократили time to market — время до вывода продукта на рынок, клиентский опыт появляется быстрее, а мы получили возможность сразу понимать эффективность этого продукта. Наконец, новое хранилище данных дешевле в работе, а один сотрудник может иметь больший функционал за ту же зарплату».

На вопрос, в какой точке сейчас находится российский бизнес относительно эффективного использования данных, Максим Пустовой отвечает, что конечная точка — это движущаяся цель. «В прошлом году у всех открылись глаза: есть ИИ, есть языковые модели, — говорит глава Arenadata. — Это дает уже другой контекст извлечения ценности из данных. Если раньше я бы сказал, что компании используют данные на 30 процентов, то теперь все уходит обратно на 10 процентов в связи с появлением новых технологий».