Что и как сверточные нейронные сети — алгоритмы анализа

Что и как сверточные нейронные сети — алгоритмы анализа

3 февраля 2023 г.

Глубокое обучение больше не ограничивается данными и распространилось далеко на другие формы контента. Начиная с обнаружения аномалий в аудиовизуальном контенте и помогая компаниям глубже погрузиться в то, как машины интерпретируют мир, еще многое бросается в глаза, когда дело доходит до сверточных нейронные сети.

Спросите обычного человека о CNN, и, скорее всего, он спутает его с новостным каналом.

Сверточные нейронные сети или CNN являются движущей силой для новая эра машинного обучения, которая позволяет как исследователям, так и отраслям переосмыслить свой подход к интерпретации окружающего мира. Сверточные нейронные сети были созданы как частичное расширение более продвинутых алгоритмов обучения, которые используются в крупномасштабных задачах с большим объемом данных, таких как идентификация, классификация и, в конечном счете, автоматизация.

ЧТО ТАКОЕ СВЕРТОЧНЫЕ НЕЙРОННЫЕ СЕТИ

CNN – это мощные алгоритмы глубокого обучения, которые выполняют задачи как по генерации, так и по классификации выходных данных. Они используются в основном при обработке изображений, искусственный интеллект, распознавание видео, механизмы рекомендаций и программное обеспечение для естественного языка.

Подобно традиционной нейронной сети с узлами и соединения, CNN имеет узлы, которые представляют биты и фрагменты контента. Поскольку отдельные изображения не могут передаваться узлам в одной точке, изображения и аналогичный контент разбиваются на фрагменты с низким разрешением. Подобно человеческому мозгу, где образы мира разбиваются, передаются, повторно собираются и интерпретируются, CNN стилизованы под лобную кору, которая связана с интерпретацией стимулов у людей.

CNN работает так же, как многослойный персептрон, который был разработан для снижения требований к обработке. Все слои CNN имеют несколько сверточных слоев, объединяющих слоев, некоторые полносвязные слои и слои нормализации. Сверточные сети так популярны в отрасли из-за повышенной эффективности, которую они обеспечивают для обработки изображений и обработки естественного языка, что мы увидим в следующих сегментах.

КАК ОНИ РАБОТАЮТ

CNN используют операцию объединения с максимальным слоем объединения, который выбирает максимальное значение из группы признаков введенного контента. Так же, как и сверточный слой, все объединяющие слои настраиваются в зависимости от размера изображения.

Возьмите в качестве примера изображение, которое вставлено на входе. Система разбивает изображение на ряд строк и столбцов, которые перестраиваются и собираются заново по мере прохождения через различные узлы и слои. Эти объединяющие слои помогают уменьшить размерность, сохраняя только важные детали. Но вот в чем загвоздка: даже если ввод сдвинут или изменен относительно его размера в пикселях, ориентации или пространства, система выберет максимальное количество значений. Объединенные слои обычно остаются висящими между последовательными сверточными слоями.

Вот и все, все CNN имеют свертки, которые извлекают признаки из локальных областей введенного контента. Вы найдете комбинацию объединенных, аффинных и перекрестно-связанных слоев. Таким образом, CNN стали основным ресурсом для изучения аудиовизуального контента благодаря своей архитектуре перекрестных ссылок, которая поглощает все мельчайшие детали входных данных и позволяет идентифицировать даже самые отдельные элементы в выходных данных.

Возвращаясь к случаю с изображением, на выходе будет получено одно и то же изображение в некоторых возможных конфигурациях, хотя и с небольшими отличиями от фактического ввода, чтобы их можно было использовать в реалистичных примерах. Пользователи могут быть знакомы с капчами изображений, когда все изображение разделено на фрагменты одинакового размера и требует идентификации определенных элементов. Это один из способов понять, как они работают.

Сверточные нейронные сети похожи на нейронные сети с прямой связью, в которых все слои имеют обучаемые веса и смещения. Функции нейронной сети берутся партиями, как вода, проходящая через фильтр.

Это позволяет системе запоминать изображения небольшими частями и выполнять операции. Опять же, эти преобразования имеют большой порядок, поскольку изображения преобразуются из цветных (RGB или HIS) в оттенки серого. Как только это будет выполнено, любые изменения в значении пикселя будут предупреждать систему о любых изменениях классификации.

ПОЧЕМУ СВЕРТОЧНЫЕ СЕТИ НАСТОЛЬКО ПРЕКРАСНЫ

Хотя отраслевые эксперты спорят о тупиковых недостатках, присущих CNN, они не могут отрицать, что они очень полезно. Прежде чем перейти к хорошему, давайте рассмотрим некоторые причины, по которым CNN имеют плохую репутацию в отрасли:-

Высокая вычислительная стоимость: СНС работают не только с числами и строками, но и с более тяжелыми данными, что значительно увеличивает вычислительные потребности системы. Не секрет, что затраты на разработку программного обеспечения для приложений для обнаружения изображений значительно выше, чем для более простых приложений. Это снова порождает конфликты во время раздачи сети по нескольким десктопам или траты хороших технологий только на один компьютер.

Требования к графическому процессору. Блоки графической обработки являются обязательными для CNN, поскольку для работы с ними требуются большие объемы данных, а потребность в ЦП может увеличиться на 17 % только для одного запуска моделирования.

Обучающие данные. Для начала аналитикам нужно много обучающих данных, если им нужно, чтобы выходные данные соответствовали входным данным. Обычная нейронная сеть, которая работает с числами, требует мегабайт данных, но требования CNN могут достигать гигабайтов и даже терабайтов (1024 гигабайта). Аналитики всегда могут использовать наборы меньшего размера, но имеют недостаток в виде потери согласованности измерений.

Сбор данных. Сбор данных, несомненно, становится более сложным для CNN, если программа требует хороших результатов и проверок.

Проверка данных. – Получение результатов – это лишь часть задачи, но их проверка на соответствие входным данным для проверки точности занимает больше времени, особенно если вы работаете с видео.

Параметрическое отслеживание. Поскольку CNN отслеживает и разбивает все изображение на более мелкие фрагменты, может потребоваться много системных операций, чтобы определить, какая часть изображения, видео или NLP-структуры привела к результату, а какая часть — нет. внести свой вклад.

Тем не менее, CNN являются отличными инструментами, которые дают потрясающие результаты, если они выполняются и хорошо спланированы.

Они используются в таких методах, как обработка сигналов и классификация изображений. Они также переняли методы компьютерного зрения, которые позволили значительно продвинуться в области дронов для аэрофотосъемки, анализа видео, операций Тьюринга, прогнозов погоды и GPS. Они работают так хорошо, потому что они разделяют контент и используют фильтры, подобные ядру, для обнаружения каждого аспекта ввода.

В этом случае фильтр — это просто матрица весов, которая была обучена выявлять выбросы во входных данных и соответствующим образом изменяться по мере запуска симуляций. Эти фильтры перемещают каждую часть входных данных (скажем, изображение в данном случае) и подтверждают, присутствуют ли все функции, которые необходимо идентифицировать, или нет. Эти веса обычно являются размерами элементов, которые представляют местоположение, оттенок и количество пикселей.

Чтобы проверить правильность значений, фильтр выполняет операции между аффинными слоями и производит сумму элементов и среднее значение всех матриц фильтра. CNN используют слои объединения, чтобы уменьшить количество параметров, поскольку они изучают всю парадигму и могут оказаться совершенно нечувствительными и беспристрастными в отношении положения всех элементов. В отличие от обычных нейронных сетей, это позволяет системе использовать саморазвивающийся метод прогрессивного улучшения, т. е. начальные слои изучают низкоуровневые элементы, а более поздние слои изучают более сложные элементы.

ГДЕ ОНИ ИСПОЛЬЗУЮТСЯ

CNN лучше всего подходят для приложений, которым требуется некоторая локальность функций, т. е. случаи использования, когда входные данные грубо различаются по многим входным данным. Они делают это в разных направлениях и строят иерархическую модель с высокоуровневыми функциями.

Благодаря объединяющим единицам они остаются инвариантными к переводу и могут сходиться через фильтры.

  1. Классификация контента. CNN очень важны для онлайн-фильтров, на которые веб-сайты подают в суд, чтобы классифицировать контент в основном по тому, является ли он уместным или неуместным. То же самое относится к случаям обработки естественного языка, когда крупномасштабные тексты и абзацы немедленно оцениваются с помощью скребков, которые сканируют сеть в поисках реальных мнений потребителей. Это важный инструмент для маркетинговых групп и веб-сайтов социальных сетей.

2. Прогнозирование геологических последствий. Отчеты о сканировании и аэрофотосъемке НАСА сопоставляются с параметрическими данными для прогнозирования начала аварий и бедствий задолго до того, как они произойдут. Изображения пострадавших регионов передаются в несколько сетей перцептронов, которые изучают входные данные до и после крупных инцидентов и дают исследователям возможность заглянуть в будущее. Подобные технологии помогают понять влияние антропогенной деятельности, такой как заселение, вырубка лесов и глобальное потепление, путем изучения сканированных изображений за большой период времени.

3. Биосенсоры. Все, что вам нужно, чтобы попасть в высокомасштабную и сильно защищенную область, — это сканирование отпечатков пальцев, которое соответствует базе данных системы, а не утомительная рутинная проверка. Однако биосенсоры становятся все более продвинутыми в идентификации людей не только по отпечаткам пальцев. Активно использовались такие детали, как черты лица, эмоциональные жесты, голосовые команды и глазные данные. Они играют важную роль не только в системах безопасности, но и помогают ученым понять, как машины интерпретируют людей. 4.Технология дронов. Дроны стали отличным подспорьем для человечества при картографировании регионов с высоты птичьего полета и выполнении человеческой деятельности в условиях, которые либо слишком опасны, либо трудны. Дроны и CNN работают настолько хорошо, что нашли успех в сельскохозяйственном секторе, находя людей среди обломков по аэрофотоснимкам, выявляя разливы нефти в обширных океанских пространствах и обнаруживая препятствия на путях движения.

4. Анализ PERT:-PERT — это метод оптимизации, направленный на поиск наилучшего маршрута, который обслуживает максимальное количество остановок за наименьший период с наименьшими затратами. Это шаг вперед по сравнению с логистической и транспортной отраслью, которая отправляет изображения дорог компаниям CNN для изучения наилучших маршрутов и выявления причин задержек. Анализ PERT также является фактором, повышающим эффективность приложений для создания дорожных карт, таких как приложения Google, которые мгновенно обновляют информацию о маршрутах движения.

5. Дизайн и доставка лекарств. Вот небольшой сбивающий с толку факт. Один компонент лекарства может занять до 20 лет, прежде чем его действие будет проверено, отложено на полку и выпущено. Большой проблемой, которая тормозит разработку лекарств, является неспособность и время, необходимое для создания стабильных соединений. Программное обеспечение для обработки изображений, основанное на CNN, играет важную роль в прогнозировании общего результата химической конфигурации и прогнозировании ее сбоев (если таковые имеются), чтобы исследовательские группы не тратили время на некачественные образцы.

ТИПИЧНАЯ ТОПОЛОГИЯ CNN

Слой пула. Это нелинейная система с понижающей дискретизацией, в которой есть некоторые нелинейные функции, похожие на набор функций активации, наложенных друг на друга.

Объединение слоев работает по принципу, согласно которому точное местоположение не так важно, как ближайшее известное местоположение элемента на изображении. Эти слои постепенно уменьшают пространственный размер изображений и в конечном итоге контролируют количество параметров, влияющих на окончательную классификацию. Это делает его отличным инструментом для предотвращения переобучения. Обычно между последовательными сверточными слоями вставляют несколько объединяющих слоев, что обеспечивает большую инвариантность перевода.

Слой ReLU: сокращенно от Rectified Linear Units, слои ReLU помогают применять функции максимума, которые увеличивают нелинейные свойства обученной сети, не мешая слоям свертки. Обычно это очень сложные тангенциальные функции или, что более естественно, типы градиентного спуска.

Полностью связанные слои. Все полностью связанные слои играют важную роль в окончательной доработке таблиц решений и структур, построенных после повторной сборки зашифрованных изображений. Эти слои помогают вычислить эффект функций активации, которые выполняются путем умножения матриц и добавления эффектов смещения в каждом узле.

Уровни потерь. Слои потерь в конечном итоге определяют, как функции смещения и активации будут смещены перед выходными данными, что делает их последним слоем в схеме CNN. Доступны различные функции потерь, специфичные для конкретного объекта. Среди часто используемых алгоритмов слоя потерь — softmax, сигмовидная кросс-энтропийная потеря и Laevenberg Marquardt.

КУДА НАПРАВЛЯЮТСЯ CNN

Самый короткий ответ — везде. CNN — настолько горячая тема в области данных в отрасли, что они быстро догоняют примитивные алгоритмы и даже достигают достаточности самообучения.

Однако компромисс остается в том, что приложения CNN в некотором роде ограничены теми, у кого есть подходящая технология, из-за чрезмерных требований, которые они предъявляют даже к простейшим задачам. Тем не менее, результаты, которые обещают CNN, намного перевешивают требования и служат напоминанием о том, чего можно достичь, имея под рукой правильные инструменты.

Они уже стали популярными в разработке технологий искусственного интеллекта, особенно для взаимодействия роботов с людьми, беспилотных транспортных средств, автоматизированных производственных технологий и множества других отраслей.

Впереди самое время получить немного знаний о том, что может стать постоянным принципом технологий в будущем.


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE