Loading...

Искусственный интеллект и встраиваемые системы - инновации в анализе транспортного движения

Цифровая обработка изображений кардинально изменила нашу способность видеть наш мир - и мир за его пределами - в двух измерениях. Изначально требующие огромных вычислительных мощностей для изображений с низким разрешением, новые разработки в области цифровой обработки изображений дали нам первые изображения Луны в 1960-х годах, изменив наше восприятие естественного спутника Земли. Более поздние достижения в области традиционной обработки цифровых изображений принесли нам технологии, на которые мы привыкли полагаться, от технологий медицинской визуализации до систем машинного зрения в производственных цехах. Несмотря на появившиеся инновации, традиционная обработка цифровых изображений может зайти только так далеко. В то время как применение искусственного интеллекта (ИИ) и более сложных технологий встроенного машинного зрения выводят обработку изображений в цифровых системах на совершенно новый уровень.

В чем преимущества искусственного интеллекта перед традиционной обработкой изображений - и как вы можете использовать его, не будучи экспертом в области искусственного интеллекта? И каковы текущие и будущие применения ИИ и встроенного машинного зрения? В этой статье эти вопросы исследуются более подробно.


ИИ vs традиционная обработка изображений

Если бы вся обработка изображений проводилась в контролируемой среде, например во внутренних помещениях с однородным освещением, формами и цветами, у нас не было бы необходимости в ИИ. Но это случается редко, потому что большая часть обработки изображений происходит в реальном мире - в неконтролируемой среде, такой как уличные пейзажи или в промышленных условиях, в которых объекты разной формы и цвета являются нормой, а не исключением.

ИИ допускает значительные колебания окружающего освещения, угла обзора, дождя, пыли, окклюзии и других факторов окружающей среды, поэтому, если вы снимаете автомобили, движущиеся по улице в течение 24-часового периода, ваше освещение и углы захвата изображения постоянно меняются.

В качестве другого примера представим, что вы - крупный производитель помидоров, и вам нужно упаковать помидоры по три упаковки для распределения на склады продуктового магазина. Помидоры должны быть однородными по форме и цвету, чтобы соответствовать стандартам контроля качества вашего клиента. Только система визуализации на основе искусственного интеллекта может поддерживать большое разнообразие форм и цветов, чтобы идентифицировать только круглые и красные помидоры.

Звучит хорошо, но если вы не являетесь экспертом в области искусственного интеллекта или обработки изображений, как вы достигнете этой цели?


Переход на GUI для обучения нейронных сетей на 2D-объектах

Прошли годы, а не десятилетия, с тех пор как инструменты ИИ с графическим пользовательским интерфейсом (GUI) стали доступны для обучения нейронных сетей на 2D-изображениях. До этого грандиозного достижения обучение нейронных сетей для машинного зрения и инспекции или для интеллектуальных транспортных платформ требовало обширных знаний в области искусственного интеллекта / машинного обучения и науки о данных (Data science), что требовало больших затрат времени и средств для любой компании. К счастью, времена изменились, и инструменты ИИ изменились вместе с ними.

На что следует обратить внимание в инструментах с графическим интерфейсом для ИИ?

    • Сделайте его гибким - найдите инструмент с графическим интерфейсом, который позволит вам добавлять собственные образцы изображений и обучать нейронные сети выполнять классификацию, обнаружение объектов, сегментацию и снижение шума, чтобы вы могли воспользоваться преимуществами большей гибкости и настройки.
    • Сохраняйте локальные данные - используйте инструмент, который позволяет моделировать данные обучения на вашем собственном ПК без подключения к облаку, что обеспечивает более высокий уровень конфиденциальности данных, который сейчас требуется во многих отраслях.
    • Экспорт для вывода - выберите инструмент, позволяющий экспортировать файлы модели в инструмент вывода, чтобы вы могли обрабатывать их в прямом видеопотоке.
    • Интуитивно понятный интерфейс - визуализируйте производительность модели с помощью числовых показателей и тепловых карт.
    • Воспользуйтесь предварительно обученными моделями - сократите усилия по обучению, используя предварительно обученные модели, которые поставляются с вашим программным пакетом.

 

 

Рассмотрим пример. Вам нужно найти и идентифицировать определенные детали оборудования, гайки, винты, гвозди и шайбы, но эти детали скучены на отражающей поверхности с множеством разноцветных ярлыков. Достижение требуемой высокой надежности потребует чрезвычайно много времени при использовании традиционной обработки изображений, но инструмент искусственного интеллекта может предоставить алгоритм обнаружения объектов, который можно легко обучить, используя всего несколько десятков образцов. Этот тип программного обеспечения позволит вам быстрее и проще создать надежную и точную систему определения местоположения и обнаружения, сократив время обучения сотрудников и связанные с этим затраты.

 

Интеллектуальные транспортные системы (ИТС) также хорошо подходят для систем обработки изображений ИИ. Программное обеспечение ИИ можно использовать для обнаружения, сегментации и идентификации транспортных средств и других движущихся и неподвижных объектов с высокой точностью, от управления платными дорогами и мониторинга безопасности дорожного движения до контроля скорости и включения светофора.


Следуйте инструкции

Когда у вас есть программный инструмент ИИ, процесс разработки состоит из нескольких основных этапов. Сначала вам нужно создать данные, а затем отредактировать и изменить набор данных. Вы начнете с получения обучающих изображений и предоставления аннотаций, соответствующих этим изображениям. Как правило, вы импортируете эти изображения из папок в удаленных местах или получаете их из сети или папки на ПК. Вступая в этот процесс, помните, что качество вашей модели зависит от качества наборов данных. Вам также потребуется выбрать графический процессор (ГП) с достаточной мощностью для управления обработкой изображений.

Затем вы пропускаете данные через обучающий модуль, чтобы создать модель.

 

[Обучающее изображение] [Изображение результата]

 

Затем вам нужно провести тестирование модели на основе полученных результатов. Это включает использование матрицы путаницы (confusion matrix) для отображения ложных срабатываний и ложных отрицаний для визуализации тепловой карты, которая показывает активацию вашей нейронной сети. Теперь, когда ваша модель обучена и протестирована, она готова к экспорту в файл модели для использования в приложении обработки изображений.


Подключение и работа со встраиваемыми системами

Как тема, встроенные системы (Embedded vision) объединяет множество различных интерпретаций. Доступны различные варианты, в том числе платформы машинного зрения со встроенным искусственным интеллектом, и каждый пользователь должен взвесить варианты (включая стоимость), прежде чем принимать решение.

Встроенные системы могут включать камеру со встроенным процессором или программируемую логическую матрицу (FPGA), программируемый датчик технического зрения или смарт-камеру, или машину общего назначения с гибким встроенным приложением. Однако, приложения встраиваемого машинного зрения известны своей малой занимаемой площадью, меньшим размером, весом и мощностью (SWAP).

Приложения для встроенного машинного зрения также позволяют сокращать данные с камеры на главный компьютер, уменьшая объем данных, проходящих по каналам. Есть и другие преимущества, в том числе снижение стоимости (поскольку приложениям для встраиваемого машинного зрения не требуются дорогие видеокарты на ПК), а также предсказуемая производительность, работа в автономном режиме (не требуется подключение к сети) и простота настройки. Если вы ищете универсальный продукт, который легко настроить и развернуть в полевых условиях, встроенные системы предлагают ощутимые преимущества.

Встроенное машинное зрение хорошо сочетается с промышленными применениями, такими как проверка на наличие ошибок и идентификация. Как это выглядит в реальном мире?


Наличие ошибок

  • Сопоставление с шаблоном - проверка наличия, позиции
  • Наличие / отсутствие / подсчет признака или детали
  • Размеры элемента или детали
  • Проверка детали или сборки по цвету

 


Идентификация

  • Проверка продукта - считайте коды продуктов, чтобы избежать ошибок в этикетках
  • Проверка маркировки - проверка типа продукта, партии, кодов даты
  • Проверка качества - контрольные отметки, положение этикетки, наличие / отсутствие функции
  • Проверка сборки - история сборки на каждом этапе изготовления
  • Логистика - обеспечение надлежащего прохождения через прием, комплектование, сортировку и отгрузку

 

Независимо от того, используются ли они по отдельности или вместе, ИИ и встроенное машинное зрение знаменуют собой эволюционный скачок в цифровой обработке изображений. Например, приложение для управления дорожным движением, которое включает красный свет и ограничения скорости, использует встроенные системы технического зрения для наиболее эффективного захвата изображений. Затем он использует искусственный интеллект, чтобы помочь устройству надежно работать в различных погодных условиях и условиях освещения. Идёт дождь или снег? Свет яркий или темный? Реализации AI позволяют устройству адаптироваться к неконтролируемым условиям реального мира.

С помощью искусственного интеллекта и встроенного машинного зрения новое поколение технологий обработки цифровых изображений может определять, достаточно ли в автомобиле пассажиров для проезда по полосе, используют ли водители сотовые телефоны в автомобилях или пристегнуты ли водитель и пассажир ремнями безопасности. Такой уровень интеллекта может сделать водителей более внимательными, а также более безопасным передвижение на автомобиле.

Хотя достижения в области сенсорных, обрабатывающих и программных технологий, а также смарт-камер во многом обусловили прогресс, достигнутый в области обработки изображений ИИ и встроенных систем машинного зрения, мы также должны отдать должное развитию ИИ. Edge AI снижает затраты и пропускную способность (поскольку большие объемы данных не отправляются непрерывно в облако для обработки), а также снижает задержку, обеспечивая большую конфиденциальность и повышая производительность приложений.

И это только начало того, чего мы можем достичь с помощью этих новых технологий обработки изображений. Как только мы сможем обеспечить «непрерывное обучение» для машин в полевых условиях, у нас появятся устройства, которые обучаются автоматически во время выполнения. Приспосабливая существующую модель к изменению контекста, непрерывное обучение освобождает команду разработчиков от выполнения обязательного полного переобучения модели в лаборатории, экономя бесчисленное количество рабочих часов. Хорошим примером такого подхода является дрон, летящий на нескольких высотах для наблюдения за дорожным движением. Мы можем обучить исходную модель с изображениями, собранными на одной высоте, например, 10 м. После развертывания в полевых условиях алгоритм непрерывного обучения срабатывает, «адаптируя» модель, когда дрон летит на других высотах. Без непрерывного обучения нам пришлось бы переобучать модель для каждой высоты, достигаемой дроном, чтобы добиться точных характеристик. Но с этим модель реагирует на изменение размера и расстояния, а также на угол обзора транспортных средств. Этот тип обучения технологиям обработки изображений на ходу значительно улучшает функциональность приложений.

Хотите узнать больше об искусственном интеллекте и встроенных решениях для машинного зрения? Посмотрите этот информативный вебинар Бруно Менара, директора по программному обеспечению, Teledyne DALSA.

Нажимая кнопку "Отправить", я даю согласие на обработку моих Персональных данных.