Согласно некоторым прогнозам, к концу 2022 года объем рынка видеоаналитики в России составит 12,8 млрд рублей, а в целом по миру он должен увеличиться почти на 24% к 2029 году. Но оценивать этот рынок только по финансовым показателям провайдеров услуг, производителей оборудования, создателей решений не совсем корректно, ведь видеоаналитика — инструмент, позволяющий внедрить искусственный интеллект в те сферы, где раньше его использование не представлялось возможным. О том, как эти технологии меняют нашу жизнь сейчас и где они будут применяться уже завтра, «Эксперту» рассказали специалисты компаний «Ланит» и «Экспасофт».
В последние несколько лет технологии компьютерного зрения так сильно развились, что сейчас они находят применение во все новых и новых сферах. Так происходит во многом благодаря общей цифровой трансформации — появлению качественно иных вычислительных мощностей, доступности большего массива данных для обучения моделей и усовершенствованию алгоритмов, на основе которых работают такие системы.
Как рассказал руководитель центра компетенций больших данных и искусственного интеллекта группы компаний «Ланит» Сергей Литвинов, в первую очередь благодаря развитию технологий видеоаналитики меняются подходы к организации промышленной и общественной безопасности — такие системы умеют идентифицировать объекты, отличать друг от друга различные действия, поведенческие паттерны и соответствующе на них реагировать. Например, они понимают, вышел рабочий на строительный объект без каски или просто снял ее, чтобы почесать затылок, машет ли он рукой, чтобы поприветствовать кого-то из коллег, или зовет на помощь в непредвиденной ситуации.
Вообще, как говорит управляющий партнер компании «Экспасофт» Александр Шкилев, сама по себе видеоаналитика — явление не новое, она появилась еще в 90-х годах прошлого века. С тех пор эти технологии активно развиваются, а в последние несколько лет испытывают настоящий бум. При этом появляется много направлений, где их целесообразно использовать. В качестве примера Шкилев приводит охранника, который в силу должностных обязанностей вынужден следить за тем, что происходит на нескольких мониторах одновременно. «Человеческое внимание остается в фокусе примерно 20-30 минут. Бывает и такое, что мы говорим с кем-то по телефону, а уже через несколько минут отвлекаемся на что-то и перестаем понимать, о чем говорит наш собеседник. То же и с охранником, — говорит собеседник «Эксперта». — А стоимость риска в случае, если он упустит какое-то событие, очень высока, особенно если мы говорим о промышленной безопасности — такая халатность может стать причиной техногенной катастрофы».
Это касается и других профессий, например, тех же дальнобойщиков. Уставший водитель может заснуть за рулем и стать причиной ужасной аварии. С нынешними технологиями видеоаналитики контролировать его усталость очень просто: система считывает мимику, движения, определяет уровень концентрации водителя по многим параметрам и сигнализирует о необходимости остановить автомобиль и отдохнуть.
В некоторых отраслях видеоаналитика помогает повысить точность, с которой описываются те или иные качественные показатели. Так, в сталелитейной промышленности использование умных камер помогает на 30% эффективнее выявлять дефекты в готовой продукции, чем если бы это делал человек. Другой вариант — использование таких технологий для дешевой модернизации устаревающего оборудования — станков, сталеплавильных печей и прочего. Камера, направленная на аналоговые панели управления, может заменить установку датчиков: в режиме реального времени оцифровывать показания приборов. Это приводит к повышению точности производства (что крайне важно в машиностроении, например) и качества промышленной продукции на выходе.
Интерес к технологиям видеоаналитики проявляет не только бизнес, но и государство — сейчас оно их использует в том числе для создания системы общественной безопасности совершенно нового уровня, достичь которого усилиями человека попросту невозможно. Александр Шкилев рассказывает, что сейчас Россия — и в особенности Москва — сильно ушла вперед в плане внедрения этих технологий в повседневную жизнь.
«Такую систему достаточно установить, например, в светофор: ИИ понимает, что человек не просто так подошел к пешеходному переходу, а ждет зеленого сигнала — и тогда он его включает. При этом на базе этой же технологии можно делать и более сложные вещи, а конкретно определять конфликтные ситуации — драки, разбой или, например, когда у человека что-то случилось и достаточно подойти к ближайшему светофору и привлечь внимание камеры характерными взмахами рук. Это гораздо эффективнее и быстрее в плане реагирования, чем вызов экстренных служб по телефону», — объясняет он.
Использование подобных технологий в среднесрочной перспективе помогает избежать многих общественно опасных преступлений. Ведь зная, что тебя все равно отследят по камерам и арестуют, мало кто решится провоцировать драку или совершить кражу на улице.
Сергей Литвинов добавляет, что развитием видеоаналитики интересуются не только в крупнейших городах страны, но и в регионах. Проблема лишь в том, что внедрение искусственного интеллекта промышленного уровня — это дорогое удовольствие, которое могут себе позволить далеко не все муниципалитеты. В связи с этим одно из главных нынешних направлений «Ланита» и «Экспасофта» — развитие фреймворка (шаблона программной платформы – прим. «Эксперта»), который уже сейчас позволяет до 25 раз снизить требования к вычислительным ресурсам без потери качества за счет оптимизации нейронных сетей, предназначенных для видеоаналитики. Благодаря этому значительно снижается стоимость внедрения технологий на базе искусственного интеллекта.
Но чтобы обслуживать ту же систему видеоаналитики, в любом случае нужны кадры — без труда огромного количества разработчиков российским компаниям не удалось бы достичь нынешнего уровня, а дальнейшее развитие технологий было бы сильно затруднено. Ссылаясь на результаты международных исследований, Литвинов напоминает, что отечественные специалисты занимают первые места в глобальных рейтингах по компетенциям и навыкам в области ИИ. И сейчас, несмотря на перманентный кадровый голод, количество выпускников профильных вузов растет вместе с числом вакансий в компаниях.
«Каждая компания проводит собственную кадровую политику, но все они стараются выстраивать плотные связи с передовыми институтами и академическим сообществом. Нам постоянно не хватает дата-инженеров и дата-сайентистов, способных перенести в код любую перспективную идею. Из-за этого многие IT-компании переходят от хантинга к модели выращивания перспективных сотрудников, используя для этого собственную экспертизу», — говорит Литвинов.
Александр Шкилев добавляет, что современным специалистам важно не имя компании, в которой они трудятся, а возможность работать с интересными задачами, от решения которых зависит дальнейший вектор развития всей индустрии. По тем же критериям в компаниях и принято оценивать успехи сотрудников.
«Социал-дарвинизм» никто не отменял: выжить на рынке смогут только те, кто в состоянии реализовать свои конкурентные преимущества. Наше — это квалифицированный человеческий ресурс, который мы целенаправленно культивируем в рамках компании — отбираем лучших из лучших и даем возможность реализовать себя в творческом плане», — объясняет Шкилев.
Какими бы развитыми не были технологии видеоаналитики, заменить человека роботом все равно не получится, уверен президент группы “Ланит” Филипп Генс. По крайней мере, в ближайшей перспективе ничего подобного точно не произойдет: никто просто не готов к этому в инфраструктурном плане. Те же дороги общего пользования в своем нынешнем виде предназначены для того, чтобы по ним ходили и ездили люди, а не беспилотники.
К этому же добавляются и этические нормы, игнорировать которые невозможно. Дело в том, что у искусственного интеллекта нет общепризнанной степени ответственности в человеческом понимании, поэтому его сейчас используют больше в качестве системы поддержки при принятии решений человеком.
Тем не менее, основатель группы «Экспасофт» Владимир Дюбанов отмечает, что любая подобная система действует в соответствии с заранее заложенным в нее регламентом и набором правил, нарушение которых в принципе не предусмотрено. Проще говоря, ИИ с машинным зрением будет стабильно качественно просматривать рентгеновские снимки легких и обращать внимание на элементы, сигнализирующие о возможном начале развития опухоли у человека. Причем делать это он будет вне зависимости от времени суток, отсутствия сна и состояния морального климата в семье.
«В то же время у любой, даже самой совершенной системы есть определенная степень риска, устранить которую целиком невозможно. Да, условная Тесла может при стечении непредвиденных обстоятельств сбить человека. Я абсолютно уверен, что таких случаев будет гораздо меньше, чем трагедий, случившихся из-за того, что человек сел пьяным за руль, — говорит Дюбанов. — Но проблема нынешней философско-этической парадигмы в том, что наказать человека за это мы можем, а искусственный интеллект — нет. Как мы его накажем? Посадим в тюрьму эту самую Теслу? Смешно, но уверен, и до таких перегибов тоже дойдёт».
Владимир Дюбанов уточняет, что в целом уже сейчас мы можем говорить об использовании видеокамеры в качестве универсального датчика, который позволяет постоянно навешивать на уже существующие системы новые функции.
«Допустим, ты столкнулся с кейсом, где нужно фиксировать открытие дверцы — с этим может справиться и обычный магнитный замыкатель. Но потом появляется другая задача — убедиться, что конкретному человеку можно входить в эту дверь. Тут уже нужно менять размыкатель на считыватель пропусков. Так вот, установка камеры с самого начала позволяет избавить нас от необходимости постоянной замены датчиков под новые задачи, что, по сути, делает ее универсальным инструментом для внедрения все новых сценариев», — объясняет Дюбанов.
По мнению собеседника «Эксперта», сама по себе видеоаналитика уже может считаться зрелой технологией ввиду того, что бизнес ее давно использует. Так, застройщики переводят в более высокий класс жилье, где есть простейшие функции распознавания лиц в видеодомофоне и открытия шлагбаума через считывание номерного знака автомобиля. Причем встретить такие механизмы можно не только в Москве и Санкт-Петербурге, но и во многих небольших городах нашей страны.
То же — с игрушками, способными воспринимать детские жесты и отвечать на них, или, например, с вертикальными домашними автоматизированными фермами. Такие установки уже сейчас могут выращивать овощи и зелень без участия человека, понимая спелость продуктов и их потребность в поливе с помощью ИИ и встроенных видеокамер. Пока, правда, такие вещи не очень сильно распространены, но уже в самом скором времени, уверен Владимир Дюбанов, мы и представить себе не сможем, как раньше жили без таких устройств — по аналогии с курьерской доставкой, получившей масштабное распространение в пандемию и оставшейся востребованной уже после неё.