В отличие от сотовой связи и интернета использование беспилотников в гражданском секторе не сулит никакой революции в образе жизни людей. Поэтому их внедрение идет так медленно
Совсем недавно в СМИ появилась новость об ошибках, допущенных в ходе нескольких хирургических операций в США из-за сбоев в работе искусственного интеллекта. Последствия для пациентов оказались достаточно серьезными, и они обратились к страховым компаниям. И все же масштаб скандала был несопоставим с теми случаями, когда в прошлые времена ошибки допускали фармацевты.
Общество в целом существенно более лояльно к сбоям в работе искусственного интеллекта, чем общество прошлого века было лояльно к сбоям самых разных систем — фармацевтических, инженерных. И это очень опасно, так как свидетельствует о двух вещах. Во-первых, о том, что мы — неспециалисты — стали очень плохо понимать, что за современные технологии нас окружают. И готовые признать, что это «не нашего ума дело». И во-вторых, апологеты ИИ сегодня абсолютно не готовы работать с рисками своих систем. В результате эти риски на многие порядки выше рисков, заложенных в прошлые технологии — хоть конструкции мостов и электрических станций, хоть использование химии.
Поэтому мы считаем нужным разъяснять самим себе и читателям то, как именно работают новые технологии. О том, что происходит с беспилотным гражданским транспортом, мы говорим со старшим научным сотрудником Федерального исследовательского центра «Информатика и управление» Российской академии наук Дмитрием Добрыниным.
Дмитрий Добрынин — кандидат технических наук, старший научный сотрудник Федерального исследовательского центра «Информатика и управление» РАН, председатель Подмосковного отделения Российской ассоциации искусственного интеллекта.
Область научных интересов — методы представления знаний для систем искусственного интеллекта, интеллектуальная робототехника, шагающие робототехнические системы. Автор нескольких методов интеллектуального анализа данных, основанных на индуктивном выводе. В настоящее время занимается разработками в области интеллектуальной робототехники в ФИЦ ИУ РАН.
— Идея беспилотников, насколько я понимаю, подразумевала решение задач без участия человека, там, куда ему нет доступа.
— Два направления. Первое — то, о чем вы говорите: работа там, где человек не может. Это космос, МЧС, глубокие шахты, подводные работы… Это специальная область, где не важна цена, а важна функциональность. А второе направление — это когда мы хотим облегчить себе жизнь, снизить затраты. Это разного рода беспилотный транспорт, где мы пытаемся заменить человека автоматом. Но оказывается, что напрямую заменить мы не можем.
Эти два направления практически не пересекаются. При проектировании луноходов цена не является определяющей. Там одна деталька — это миллион рублей. Надежность, низкие температуры. Самое главное, чтобы она работала и очень дорогой запуск ракеты оправдался. Другое дело беспилотный грузовой автомобиль. Там на первый план выходит удобство и цена. Если он будет в эксплуатации дешевле, чем с человеком, тогда он нужен. Он груз быстрее доставит, а заказчик меньше заплатит. Но если стоимость доставки будет в три раза больше, чем с человеком, то не сработает.
— Первое направление нас меньше интересует. Сегодня беспилотники широко используются в сельском хозяйстве. Причем это и летательные аппараты, и наземная техника. Но пока это довольно дорого.
— Насчет «дорого» приведу вам простой пример. У меня есть коллега из Санкт-Петербурга Андрей Леонидович Ронжин, директор Федерального исследовательского центра РАН в Санкт-Петербурге. У них есть опытная база под Нижним Новгородом, где они развивают беспилотные технологии обработки полей. Он рассказывал, что в прошлом году были дожди. На одном участке они смогли опрыскать с воздуха поле. И урожай выжил. А там, где такой обработки не было, урожай погиб, потому что наземная техника вязла, было просто болото, а не поле. Смысл в том, в первом случае была получена прибыль, а во втором нет. Вот такой эффект.
— Так все-таки они используются широко?
— Пока нет.
У нас не развито законодательство. Грубо говоря, высоко вам подняться не дадут и далеко улететь тоже не дадут. Если сможете летать низенько над полем, то все хорошо. Если чуть выше — вас считают опасной целью. Кроме того, беспилотники требуют достаточно развитой инфраструктуры. Это обязательный доступ в интернет, к системам позиционирования, то есть ГЛОНАСС или GPS. Им нужны электронные карты, которые кто-то должен составить. Им нужны маршруты полета и прочее-прочее-прочее. То есть это не прямая замена сельхозработников, это просто другая технология.
— Когда вы говорите «беспилотник», вы имеете в виду беспилотный летательный аппарат, а что насчет беспилотного трактора или комбайна? Как здесь с экономикой?
— Компания Cognitive Pilot имеет опыт внедрения беспилотных комбайнов, по-моему, уже десять с лишним лет. Там тоже есть проблемы с законодательством. Например, по полю комбайн может ехать в беспилотном режиме, а по дороге, которая к этому полю ведет, не может. Нужен водитель.
— Механизатор может подъехать к определенному времени и перегнать беспилотный комбайн…
— Ну вот так и происходит.
— Тогда получается, что есть экономия.
— Система управления хорошо работает на прямых участках, проходит повороты, а вот сложные участки распознает не всегда устойчиво, и поэтому человек все равно нужен. Так что комбайнер все равно сидит. При этом скорость уборки выше не в разы. Она выше всего лишь на 15‒20 процентов. Но такой комбайн убирает больше, и комбайнер при этом не устает. Поэтому здесь экономика достаточно чувствительная. Нужно все взвешивать. Нет решений, что мы всех заменим и все будет замечательно.
— А у летающих беспилотников в сельском хозяйстве экономика более очевидная?
— В сельском хозяйстве массового их применения пока нет. Есть только опытная эксплуатация, экспериментальная. Массовое означает, что, например, на юге, их использует треть хозяйств. Я такого просто не вижу.
— Но технология отработана, сами аппараты есть. Почему же они не внедряются массово? Что мешает?
— Все то же законодательство. Летать можно только низко, но не везде и с большими ограничениями. И если вам перед каждым полетом на каждый аппарат нужно оформлять полетное задание, то много ли вы налетаете?
— С марта у нас должна заработать Единая система идентификации БПЛА на базе ГЛОНАСС. Это как-то поможет?
— Эта система внедряется, по-моему, уже лет пять в разных вариантах. Но если все-таки заработает, отлично. Но не ждите мгновенных результатов. Их не будет.
— Автомобильный транспорт. Вопрос, который задает нам читатель: почему «Яндекс» уже восемь лет тестирует беспилотные такси, но они так и не стали массовым явлением?
— Прежде всего, очень высокая цена обслуживания. Чем отличается беспилотный автомобиль от машины с водителем? Есть дорога, светофоры, помехи — другие автомобили, пешеходы. Водитель ведет машину по дороге, ориентируется на знаки и сигналы светофора, препятствия. Он локальный и автономный.
Что касается роя, это фундаментальная проблема построения таких сложных систем. Здесь только наука поможет. Инженеры одни не справятся
Беспилотные такси катаются фактически по картам. Почему? В частности потому, что автомобиль плохо распознает знаки в оптическом режиме, особенно в дождливую погоду или вечером. Более того, применяемые технологии вряд ли достигнут уровня человека по распознаванию знаков в плохой обстановке. Наши исследования по оптическому распознаванию показывают, что если часть знака закрыта грязью или вандалы какие-нибудь линии нарисовали, то процент распознавания с 85 падает до пяти.
— И что, никогда не достигнет человеческого уровня?
— Может, и достигнет, но непонятно когда. А в наших терминах это пока никогда.
— А распознавание других объектов, движущихся?
— С ними тоже не все хорошо. Лидары плохо работают, когда есть осадки. Беспилотные автомобили не видят ям и ухабов. В результате езда происходит в компьютерной программе. Пользователь говорит: «Мне подать беспилотное такси сюда». Оператор в колл-центре передает задачу компьютеру, и он строит маршрут. У них есть цифровая карта со всеми знаками, препятствиями, путями объезда. И, грубо говоря, та система управления, которая стоит на самом такси, реагирует только на местные препятствия. То есть автомобиль держится дороги, не наезжает на другие машины, останавливается перед пешеходами, иногда работает по светофору, и то не всегда.
— То есть и на красный может проехать?
— Может. Из-за этого такие такси требуют хороших дорог, хорошей инфраструктуры, обязательно системы управления из центра. Вопрос: это дешевле, чем обычный водитель?
— Нет, у меня-то вопрос: зачем тогда вообще за это биться? Если система не в состоянии распознать ключевой дорожный знак и сигнал светофора?
— Биться за это нужно по нескольким причинам. Их мало, но они есть. Беспилотные автомобили потенциально менее травмоопасны, так как, например, не бывают пьяными и видят препятствия в основном. И эксперты говорят, что, если они будут хотя бы в два раза реже устраивать дорожные происшествия, чем обычный транспорт, это уже огромный плюс. Никто не стремится к стопроцентной надежности. В массовом масштабе это невозможно.
Наши исследования по оптическому распознаванию показывают, что если часть знака закрыта грязью или вандалы какие-то линии нарисовали, то процент распознавания с 85 падает до пяти
Сейчас у нас катается примерно 200 беспилотных грузовиков по стране, И у них стопроцентная надежность. Но за каждой машиной следят операторы в реальном времени, Если что, ее сразу тормозят. А представьте, что их будет не 200, а 200 тысяч?
— Я как раз все это прекрасно представляю. И не понимаю, зачем люди продолжают над этим работать. Цена беспилотного такси космическая…
— В принципе, она снижается по экспоненте при увеличении парка. Uber доказал, что, если есть инфраструктура и она начинает массово эксплуатироваться, то, если вы гоняете десять такси в городе, это невыгодно. Если сто — тоже. А вот пять тысяч — выгодно. Нет водителей — раз, меньше аварий — два. Ну, возникают, как обычно, побочные проблемы — система управления может дать сбой.
— Мы активно строим автомобильную магистраль от Санкт-Петербурга через всю страну вплоть до Владивостока. Уже дошли до Екатеринбурга. По ней можно запустить массовое грузовое беспилотное движение?
— Его, наверное, и запустят, потому что на грузовиках это наиболее прибыльно. Если убрать водителя — это сразу снижает стоимость перевозки на 12 процентов. А помимо водителя есть экономия топлива десять процентов, пять — износ машины, аварийность ниже.
Но пока человек в кабине присутствует.
— А в будущем?
— А он не нужен там в принципе. Вся трасса Москва — Казань просматривается. Сидят люди за камерами, все видят. Если машина легковая врежется в грузовик или водителю стало плохо и он остановился в неположенном месте, к нему через десять минут подъедет комиссар. Это есть уже сейчас.
То же и с беспилотником будет. Он все время связан с центром, который его отслеживает. Если что-то не так, центр сразу связывается с экстренными службами, поэтому и нужна нормальная инфраструктура: хорошие дороги, связь, камеры и прочее.
— Но в городах мы такого еще долго не построим.
— В городах поэтому никто не прогнозирует бурное развитие беспилотников.
— Тогда я возвращаюсь к своему вопросу. Экономика процесса — так себе. Инвестиции требуются огромные. Зачем люди продолжают это делать?
— Смотрите, изобрели сотовый телефон. Стало возможно звонить из любой точки. И сразу образ жизни резко изменился, революционно. А здесь нет революции. Вы сделали беспилотники, использовали сложные технологии, а отдача маленькая — пять-десять процентов, иногда вообще в минус уходите. То есть расходы есть, а революционного сдвига нет.
— То есть в ближайшее время ждать массы беспилотников на дорогах не стоит.
— В ближайшее время — нет. Может быть только грузовики: к 2028 году Ассоциация беспилотного транспорта планирует одну тысячу грузовиков.
— Для всей России очень немного.
— Да. И здесь проблема не только в том, что нужна дорогая инфраструктура, но и в том, что прогресс в технологиях управления автомобилем без человека очень слабый, в том числе потому, что компании, которые этим занимаются, в науку ничего не вкладывают.
— А должны?
— Ну они же технологий хотят от науки. Значит, должны поддерживать ученых, которые занимаются распознаванием образов, созданием систем управления, созданием датчиков. А сейчас на конференции подходишь к «Яндексу»: «Вы сотрудничаете с наукой?» Они говорят: «Нет. Мы просто покупаем готовых специалистов». То есть мы для них готовим студентов, аспирантов, научных работников. Они потом предлагают им высокие зарплаты. А отдачи нет.
— Но они у себя внутри создают какие-то научные подразделения, которое всем этим занимаются.
— Вы поймите, наука — это не то, что вы сделали в своей фирме. Наука — это то, что везде.
— Наука может помочь в деле распознавания знаков?
— Может. Но нужны исследования, развитие новых методов. Проблема в архитектуре нейронных сетей и в игнорировании технологий, которые не используют нейронные сети. Это, например, логические методы.
Я знаю ребят, которые гоняли машину на соревнованиях типа «Формулы-1». Это были европейские соревнования в беспилотном режиме. Условия такие: они пишут софт, а дальше фирма, которая это организует, ставит его на машину, и она со скоростью под 200 километров в час гоняет по трассе. Вот они говорят, что нейронные сети не работают, потому что не успевают! А успевают только классические алгоритмы управления с небольшими подстройками. То есть старый добрый искусственный интеллект, о котором все давно забыли.
Текстовые ИИ взлетели, собрав со всего интернета все возможные тексты. Но в других областях таких данных нет
— А что такое добрый старый алгоритм?
— О, да это вам целую лекцию нужно читать!
— Коротенько, я сообразительная.
— Ну, смотрите. До 2011 года, до изобретения сетей с глубоким обучением, у нас развивались методы и технологии обработки данных, которые нейросети не использовали: логические методы, деревья решений, ДСМ. Они обеспечивали приемлемый уровень, но прорывов не было. А использование глубоких нейронных сетей позволило, например, в распознавании речи перейти от 80 процентов к 90‒95. Это уровень человека. Старые технологии этого не могли. Но, как выясняется, для них просто не было нужного количества вычислительных мощностей.
Сейчас нейронные сети давят чем? Вычислительной мощностью. За последние двадцать лет эти мощности выросли, по-моему, на четыре порядка. Если сейчас эту мощность наложить на формулы из семидесятых годов, то они будут лучше работать. Просто сейчас никто в эту сторону не идет.
— Вы хотите сказать, что вот эти старые методы могли бы обеспечить прорыв в области распознавания знаков?
— Не только. Но в это нужно вкладывать ресурсы. То есть пробовать, ошибаться.
— Извините, я может быть, идиотский вопрос задам, но чтобы почувствовать, в чем дело… В старых методах более устойчивые алгоритмы?
— Нет. Беда нейронных систем в том, что… Вот у вас есть обучающая выборка. Допустим, четыре точки. Система обучилась и в окрестностях этих точек предсказывает отлично, с высокой вероятностью. Но если реальная точка сильно выбивается за эти окрестности, то ошибка будет большая. Собственно говоря, галлюцинации и все погрешности происходят из-за того, что у нейронки недостаточно данных для плотного обучения. А сделать плотное обучение теоретически невозможно, поскольку для этого нужно экспоненциально большее количество данных. А их просто нет.
Они были в области текстов. Поэтому текстовые ИИ взлетели, собрав со всего интернета все возможные тексты. Но в других областях таких данных нет. А наши методы работают, грубо говоря, не поточечно, а непрерывно.
Интерполяция — это что? Непрерывная функция, которая дифференцируема до какого-то порядка. И она существует в каждой точке вашего интервала. Не в точках, где вы обучались, а в любой точке.
— А как это достигается в ваших методах?
— У нейронной сети совпадение по входным данным. Причем точное совпадение. Сколько данных — столько совпадений. Увеличили сетку — больше данных будет, но все равно дырки остаются. А в классических методах речь идет о совпадении моделей мира. Это зависимости, которые, грубо говоря, переводят реальные зависимости в функции.
— Возьмем дорожный знак. Здесь недостаточно информации для тренировки сети, потому что целый ряд ситуаций, когда знак имеет определенный вид за счет грязи, тумана в сети не заложено, и она обучиться не может. Вы каким образом решаете эту проблему?
— А там используется другой набор признаков для распознавания знака. Если нейронная сеть использует точки, то эти методы сначала переводят изображение в набор так называемых признаков — круглый, квадратный. И это понятие «круглый» слабо зависит от того, смазана у него часть круга или нет. Вот так устойчивость и появляется. Но возникает проблема в подборе самих признаков. Потому что для классических методов эти признаки подбирают люди, и это очень трудоемкий процесс.
— Получается, нужно отодвинуть нейронные сети и перейти на другие методы?
— Наука ничего не выбрасывает. Она все ставит на свои места и правильно масштабирует. Просто сейчас у всех исследователей фокус только на нейронных сетях. Китайцы, например, вот их статьи посмотришь — только нейронные сети.
А на самом деле нейронные сети — это где-то пять процентов методов искусственного интеллекта.
— Мы же конкуренты. Так что, можно сказать, слава богу, если так.
— Может быть. У китайцев, если работа старше двух лет, они считают: «Все, это морально устарело, на конференцию не берем!» У американцев и европейцев лучше. Там школы научные, которые работают довольно долго, и они ценят длинные результаты.
— Беспилотный транспорт, основанный на нейронных сетях, — это тупик. А беспилотный транспорт, основанный на старом добром искусственном интеллекте, может оказаться не тупиком?
— Скорее всего, будет какая-то смесь. Что-то на нейронных сетях, что-то на другом. Но никто не может сказать, что технологии, которые мы называем «старые добрые», дадут эффект. Это же наука, понимаете? Мы не знаем, что получим.
— В итоге мы пришли к тому, что сегодня беспилотный автотранспорт, основанный на нейронных сетях и очень дорогой инфраструктуре, особой перспективы не имеет.
— Проблема в том, что у нас, несмотря на все эти бодрые заявления, нет искусственного интеллекта. Нет систем, которые могут учиться сами, не изобрели. Ну а что вы хотели, если в это сорок лет не вкладывались деньги?
А в нейронные сети Google, Microsoft и прочие вбухали огромные деньги. Oracle должен больше ста миллиардов долларов своим поставщикам из-за контрактов с Open AI, для которого он построил дата-центры. Но Open AI не зарабатывает столько на продаже услуг ИИ, чтобы их оплатить. Так что вот-вот начнется третья зима искусственного интеллекта, и мы все благополучно забудем на некоторое время про нейронные сети. Если же они деньги найдут, то этот хайп продлится какое-то время, но потом, скорее всего, все рухнет.
Пока на всем этом заработал только поставщик графических процессоров — Nvidia.
— Мы видели, как в Китае запускают огромное количество дронов, которые двигаются согласованно. Это рой или не рой?
— Это не рой. Рой должен быть автономным. Грубо говоря, у вас есть группа аппаратов, и они как-то между собой связываются, а с внешним миром связи практически не имеют.
— А в чем тут проблема? Я говорила с одним экспертом, он сказал, что наладить коммуникацию даже между тремя аппаратами сложно.
— Во-первых, ограниченные каналы радиосвязи. Радиочастотные диапазоны не резиновые, для них отводятся довольно узкие участки, в которых нужно передавать информацию. Во-вторых, если вы связываетесь с одним аппаратом, то вы спросили — он ответил. А если у вас их тысяча? Вы спросили, а ответило 999.
Нас сейчас трое. Мы друг другу не мешаем, потому что мы говорим по очереди. Но если нас очень много, то интервал времени, в который вам нужно говорить, будет все время сокращаться. Если нас десять человек в десять раз, если сто — в сто раз. Вопрос: вы успеете передать нужный объем информации за это короткое время? И обработать. Тем более что бортовые мощности ограничены, то есть это не наземная техника, там энергии мало, не очень мощные компьютеры. И очень сложные протоколы связи, чтобы сообщение не потерялось.
Следующая проблема, которая там есть, — фундаментальная. Как из кучи маленьких аппаратиков сделать единое целое, чтобы цели перераспределялись динамически. Часть аппаратов вышла из строя, их выбили либо они недоступны, но рой должен остаться целым, единым. С этим проблема. Поэтому нормальных роев пока ни у кого нет, и слава богу. Потому что это страшная штука.
— Китайцы показывают робособак. Они взаимодействуют между собой или нет?
— Я бы не назвал это роем, скорее это группа. Они просто бегут в одном направлении, заходят на одну цель с разных концов. Либо одни смотрят издалека, наводят, другие подходят и стреляют. Это групповое поведение. Ну и на Земле можно аккумулятор поставить и мощнее компьютер. От этого тоже многое зависит.
То есть можно сказать, что мы пока создать рой не готовы именно технически. И мы, и китайцы никто не готов. Хотя американцы заявляют, что они рой создали, но мне пока слабо верится.
— Хорошо, а этот рой должен базироваться на нейронных сетях или на старом искусственном интеллекте?
— Не знаю. Это пока открытая научная задача.
— А тогда почему американцы говорят, что они сделали?
— Они много чего говорят.
— У нас ответственные товарищи еще в 2017 году заявляли, что через пять лет у нас будет рой.
— Ну у нас каждый год заявляют, что через двадцать лет мы получим управляемый термоядерный синтез. И каждый год эта дата сдвигается на двадцать лет уже с шестидесятых годов.
Еще раз, то, что касается роя, — это фундаментальная проблема построения таких сложных систем. Здесь только наука поможет. Инженеры одни не справятся. Как создать систему, которая состоит из множества маленьких кусочков и остается целой? Технически это более или менее понятно, а с фундаментальной точки зрения — нет.
— А можете как-то на пальцах объяснить, в чем разница между роем людей и группой?
— Если вы в группе уберете часть компонентов, она видоизменится. Рой так не должен себя вести. Если вы уберете даже половину роботов, которые там летают, он должен остаться с теми же целями, с теми же задачами и задачу выполнить.
Теоретические исследования роевого поведения ведутся где-то с семидесятых годов прошлого века. То есть на муравьях пытались понять. Кстати, у них очень простая система. Муравей никаким интеллектом не обладает в принципе, но у него очень много базовых механизмов, которые позволяют им объединяться в большие системы.
Или косяки рыб — это рой. У них там есть временный вожак, когда они меняют направление движения, вожак меняется. То есть плывете на север, у вас один вожак. Плывете на юг — он другой.
— И кто принял решение о развороте?
— А вот неизвестно. Это как раз научная проблема коммуникаций. Но если в военном деле рой все-таки изобретут — это будет скачкообразный рывок. Рой может полностью контролировать большую территорию, рой станет революцией. А беспилотные такси — это не революция. Это эволюция, причем очень медленная.
— У роя будет настоящий искусственный интеллект?
— Полноценный — вряд ли. Но какие-то элементы самообучения, подстройки там должны быть. Я же говорю, проблема фундаментальная, сложная. У нас в России, по-моему, научных статей по теме роя не было вообще. Для того чтобы это сделать, нужно лет десять вести НИОКР. Потом создать опытный образец, обкатать его. Причем этот образец не должен быть один. Их должно быть минимум два-три-четыре. Чем больше, тем лучше. И вот через этот большой срок, десять-пятнадцать лет, вы получите технологию, готовую к масштабированию.