ИТ-компания из Миасса разработала ПО с использованием технологий компьютерного зрения, прорвалась на международный рынок и привлекла многомиллионные инвестиции
Венчурный фонд Национальной технологической инициативы (НТИ; находится под управлением частной инвестиционной компании Kama Flow, работающей с технологическими стартапами) инвестировал 140 млн рублей в российскую компанию 3DiVi Inc — ведущего международного разработчика технологий трекинга тела и лица для сфер интернета вещей (IoT), интеллектуального видеонаблюдения, робототехники и цифровой идентичности (биометрии).
— С развитием технологий распознавания и идентификации рынок сформировал глобальный запрос на надежные и комплексные решения, применимые для различных сфер, — прокомментировал сделку партнер Kama Flow Евгений Борисов. — Компания 3DiVi, являющаяся одним из лидеров в области разработки решений на базе технологий компьютерного зрения, предлагает уникальную платформу с набором инструментов для создания кастомизированных сервисов под любые задачи. Данный продукт способен удовлетворить существующую потребность рынка в системах компьютерного зрения любой сложности со значительным снижением стоимости их разработки и внедрения. Уверены, что проект 3DiVi способен достичь глобального лидерства, поскольку уже на данном этапе показывает отличные результаты и признан не только в России, но и за рубежом.
Компания 3DiVi была создана в Миассе в 2011 году выпускниками Московского физико-технического института. Сооснователей трое: Дмитрий Морозов, Павел Зайцев и Андрей Валик.
— С Павлом Зайцевым я познакомился еще в школе. Он был у нас преподавателем заочной физтехшколы МФТИ, затем стал успешным предпринимателем, создав компанию «Папилон». Компания также из Миасса, сегодня это крупнейший российский поставщик биометрических решений с оборотом более миллиарда рублей в год, — рассказывает Дмитрий Морозов. — Андрей Валик также из «Папилона», он работал там одним из технических руководителей. Тридиви и возникла как спин-офф «Папилона», по сути, все компетенции, первоначальные инвестиции к нам пришли оттуда.
Идея стартапа была простой, и одновременно амбициозной и сверхсложной. В то время (чуть больше десяти лет назад) международный гигант Microsoft вывел на рынок Kinect — бесконтактный сенсорный игровой контроллер, который позволял играть с использованием устных команд и жестов. Этот аксессуар стал мировым хитом, впоследствии попав в Книгу рекордов Гиннесса как самое продаваемое потребительское устройство индустрии развлечений.
— Возник большой ажиотаж, связанный с появлением технологий бесконтактного управления устройствами. Мы понимали, что Microsoft не сможет выйти за границы своей экосистемы, а у конкурирующих экосистем возникнет спрос на аналогичную функциональность. Соответственно наша идея состояла в том, чтобы делать подобные вещи для альтернативных операционных систем, таких как Android и iOS, — поясняет замысел Дмитрий.
К успеху, который был совершенно неочевиден, миасские энтузиасты шли долгих пять лет. И все это время фактически трудились на средства инвестора и различных грантов. Компания 3DiVi разработала собственную уникальную технологию, но российскую разработку на международном рынке никто не ждал. В качестве ее потенциальных покупателей рассматривались американская Intel и китайская Orbbec. Однако в итоге Intel купила за 40 млн долларов израильский стартап с функциональностью, аналогичной миасской разработке.
А китайцы для разработки технологии бесконтактного управления устройствами наняли американскую компанию.
— Но через несколько лет ситуация изменилась, — вспоминает Дмитрий. — Американцы и китайцы осознали, что наше решение по качеству превосходит то, что имеется у них. В 2016 году с нами начали заключать лицензионные соглашения Intel, Orbbec и другие международные компании. У нас пошла выручка, мы вышли на самоокупаемость. С тех пор 3DiVi практически является мировым лидером по технологии трекинга скелета, на уровне Kinect от Microsoft. При этом наша технология наиболее востребована и доступна для покупки, уральскую разработку можно купить в том числе на сайте Intel, на сайтах китайских компаний.
Сейчас в штате 3DiVi работает около 40 программистов, основной офис разработчиков находится в Челябинске, головной офис компании — в Миассе. Есть также представительство в Москве и офис продаж в Калифорнии (продажи ведутся через американского дистрибьютора). В Китае самостоятельно работать также тяжело, поэтому уральцы заключили договор с лидером национального рынка Orbbec.
Больше половины в структуре продаж 3DiVi — экспорт, около 30 — 40 млн рублей в год. Основные покупатели — компании из Японии, Южной Кореи, США. Среди российских клиентов — Ростелеком, ритейлеры, промышленные предприятия, правоохранительные органы. Например, в ритейле интеллектуальная видеоаналитика поведенческой активности человека используется для контроля очередей, анализа траектории движения покупателей, сбора демографических данных о посетителях магазина.
В промышленности решения 3DiVi обеспечивают биометрический контроль доступа работников, в том числе в опасные зоны, контроль выполнения производственных операций, проверяют наличие спецодежды и соблюдение техники безопасности, визуально контролируют качество продукции. На транспорте распознавание лиц и детекция человека применяются для аналитики пассажиропотока, поиска правонарушителей, контроля действий и состояния водителя посредством компьютерного зрения. Для фитнеса и медицинской реабилитации предлагается бесконтактный трекинг тела.
Технологической основой компании является собственная ML-платформа полного цикла, включающая инструментарий DataGen, AutoML, MLOps и используемая для промышленной разработки алгоритмов — от классификации изображений до анализа поведения человека. Одно из перспективных направлений разработки — платформа low-code на базе технологий компьютерного зрения, которая позволяет конечным клиентам в короткие сроки создавать сервисы по распознаванию и анализу поведения человека без привлечения высококвалифицированных специалистов ИТ и data science. По точности систем распознавания и эффективности работы алгоритмов продукты компании (она входит в рейтинг NIST) успешно конкурируют с разработками глобальных лидеров. Технологии 3DiVi защищены международными патентами и имеют необходимые сертификаты соответствия, продукты входят в реестр отечественного ПО.
Для простоты описания продукции 3DiVi Дмитрий использует необычные образы:
— Основной актив нашей компании — разработанная нами технология машинного обучения. Можно сказать, что это некая «плантация». На ней мы «выращиваем» коммерческие алгоритмы, которые сейчас успешно продаем. Это «бревна» — продукты низкой степени обработки, требующие усилий по их интеграции в конечные решения. Наша задача — перейти к продаже «досок», то есть готовых для интеграции программных модулей, которые наши клиенты могут быстро встраивать в решения, требующие трекинга человека. Это может быть распознавание, лиц, жестов, аналитика «безопасного города» и др. Но «доски» — это еще не «табуретки». То есть конечные решения на этом этапе мы пока не продаем, а являемся поставщиками промежуточного уровня.
В наших планах — делать «табуретки», но это не за один-два года.
Инвестиции венчурного фонда НТИ будут направлены на доработку и коммерциализацию платформы low-code для трекинга человека на базе технологий компьютерного зрения. В обмен на эти инвестиции Венчурный фонд приобрел долю компании. Дмитрий считает, что теперь у предприятия неплохие условия для глобальной экспансии:
— Если смотреть на аналогичные ИТ-компании в США, то их капитализация достигает 150 млн долларов. То есть даже в имеющейся организационной структуре мы видим большой потенциал и ставим цель увеличить капитализацию до 100 — 150 млн долларов на горизонте трех-пяти лет. У нас есть понимание, как и куда двигаться. В текущей ситуации мы много усилий тратим на создание широкой продуктовой линейки. Но очень важно эти продукты грамотно упаковать и продать. Здесь есть некоторые ограничения, поскольку на Урале таких компетенций практически нет. Приходится выступать пионерами. За один-два года наша технология, платформа должна стать видимой в 70 — 80 странах. Это программа-минимум.