Эпоха искусственного интеллекта и пространственной сети: что все это значит — часть 1
4 января 2023 г.Языковые модели глубокого обучения и когнитивная наука
Что такое мышление?
Первая цель искусственного интеллекта – понять, как люди думают. Первоначальная идея заключалась в том, чтобы объединить интеллектуальный и компьютерный вклад, чтобы узнать о познании.
В 1990-х годах произошел переход от подхода ИИ, основанного на знаниях, к подходу ИИ, основанному на данных, с заменой первоначальных целей типом машинного обучения, называемым глубоким обучением, способным анализировать большие объемы данных и делать выводы из результатов. .
Глубокое обучение — это прогностическая машинная модель, работающая на основе распознавания образов. Некоторые люди считают, что если вы будете просто добавлять в модель все больше и больше данных, то ИИ начнет развиваться сам по себе, в конечном итоге достигнув ОИИ (искусственного общего интеллекта), «Святого Грааля» ИИ.
Эта теория, однако, считается глубоко ошибочной, поскольку эти машины ИИ не способны к «осведомленности» или способности «рассуждать». С машинным обучением/глубоким обучением ИИ не происходит «мышления».
Эти прогностические машины лишены какого-либо реального интеллекта.
Масштабирование в более крупные модели путем добавления все новых и новых параметров, пока эти модели не займут весь Интернет, окажется полезным лишь до определенной степени.
Банк данных большего размера не сможет решить проблему распознавания токсичности в структурах данных, а также не позволит перемещаться по конфиденциальным данным, разрешенной информации, защищенным удостоверениям или интеллектуальной собственности. Большой банк данных не позволяет рассуждать или абстрактно мыслить.
Чтобы ИИ достиг конечной цели ОИИ, мы должны иметь возможность создавать когнитивные модели мира и наносить «смысл» на данные. Нам нужна большая база данных абстрактных знаний, которые могут быть интерпретированы машиной, придающей определенный уровень «осведомленности».
Ньютон против Эйнштейна
Искусственный интеллект на основе моделей для активного вывода — это методология искусственного интеллекта, которая обладает всеми компонентами, необходимыми для достижения прорыва в области искусственного интеллекта, преодолевая все фундаментальные ограничения текущего машинного обучения/ИИ с глубоким обучением.
Разница между искусственным интеллектом машинного обучения и искусственным интеллектом активного логического вывода так же очевидна, как переход от законов всемирного тяготения Ньютона к теории относительности Эйнштейна.
В конце 1800-х физики считали, что мы уже открыли законы, управляющие движением и гравитацией в нашей физической вселенной. Они и не подозревали, насколько наивными были идеи Исаака Ньютона, пока Альберт Эйнштейн не открыл человечеству глаза на пространство-время и целостность существования и реальности.
Вот что сейчас происходит с ИИ.
С помощью модели машинного обучения просто невозможно достичь AGI (искусственного общего интеллекта), но с Active Inference он неизбежен.
Итак, каковы ограничения глубокого обучения?
Искусственный интеллект для глубокого обучения — это просто машины (программы/алгоритмы), состоящие из нейронных сетей, которые со временем становятся более умными (более совершенными) машинами благодаря процессу масштабирования параметров данных в тандеме с количеством обучающих токенов.
По сути, чем больше данных поступает в машину, тем лучше она распознает закономерности, а также генерирует и прогнозирует результаты, которые «кажутся» правильными.
Нейронная сеть, что это такое и как она работает?
Искусственная нейронная сеть (ИНС) — это алгоритм ИИ, состоящий из множества многоуровневых и взаимосвязанных «узлов» обработки, предназначенных для имитации структуры и поведения нейронов человеческого мозга. Узел получает входные данные и обрабатывает их с учетом набора весов и смещений, создавая выходные данные.
Затем эти выходные данные передаются в качестве входных данных другому узлу, при этом процесс повторяется одновременно во всей сети узлов, пока не будет достигнут окончательный результат.
Нейронные сети обучаются с использованием больших наборов данных вместе с алгоритмом оптимизации для уточнения выходных результатов и минимизации ошибок.
Двумя распространенными методами глубокого обучения, используемыми для разработки самых популярных сегодня приложений ИИ, являются модели GAN (MidJourney и DALL.E) и модели Transformer (ChatGPT).
* GAN AI — «Генеративные состязательные сети» — «В основном используется для преобразования текста в изображение, генерации лиц, создания 3D-объектов, предсказания видео и т. д.» — «Состоит из двух нейронных сетей (алгоритмов ИИ), одновременно взаимодействующих друг с другом. Одним из них является «генератор», выдающий случайные примеры искомого элемента.
Другой — «дискриминатор», оценивающий результаты и сравнивающий их с банком данных данных шаблонов, соответствующих критериям, чтобы пройти или не пройти генеративную сеть, которая просто продолжает попытки, пока не сгенерирует проходной ответ.
* Transformer AI — в основном используется для NLP (процессор естественного языка) и CV (компьютерное зрение). "https://en.wikipedia.org/wiki/Wikipedia">Википедия Корпус и Общее сканирование, с возможностью тонкой настройки для конкретных задач.
К настоящему моменту мы все видели и слышали о программах, использующих машины ИИ для глубокого обучения во множестве различных приложений:
<цитата>Создание изображений: DALL.E, MidJourney, Stable Diffusion, Lensa и многие другие
<цитата>Создание 3D: Dream Fusion, Point-E, Anything World
Генерация текста с помощью обработки естественного языка
<цитата>(NLP) и модели больших языков (LLM): ChatGPT, LaMDA, PaLM и другие.
Правда в том, что это всего лишь инструменты. Они не вносят никакого реального вклада в когнитивную науку. Они могут быть очень полезными инструментами, но они также подвержены ошибкам и, в конечном счете, ограничены в области человеческой ценности.
Вопиющая проблема с машинным обучением ИИ
Существующие программы искусственного интеллекта не понимают и не понимают задач, которые они могут выполнять. Это инструменты без понимания, просто прогностические машины, обученные делать одну вещь.
Важно понимать, что эти машины не способны к осознанию или восприятию. Они не понимают данные, они просто хорошо выполняют задачи на основе параметров в рамках программирования алгоритмов.
Машина с искусственным интеллектом, используемая для сканирования МРТ для выявления рака, не знает, что такое МРТ и что такое рак. Его просто научили распознавать шаблоны изображений на основе обширных наборов данных МРТ-изображений, помеченных как «с» и «без» рака.
Он хорошо распознает закономерности в изображениях, но содержание самих изображений и контекст, окружающий решаемую задачу, бессмысленны. Результаты могут быть представлены только в процентах от возможной точности — никогда не 100%.
Другие БОЛЬШИЕ ПРОБЛЕМЫ:
Сингулярные функции
Также важно отметить, что каждая из этих моделей машин уникальна по функциональному назначению. Каждый хорош только в одном.
Для какой бы операции ни была запрограммирована и создана конкретная модель ИИ, будь то создание изобразительного искусства, обработка речи или сканирование МРТ или рентгеновских лучей, каждая из них создана, чтобы оставаться в своей полосе.
ChatGPT не может создать фотографическое или графическое изображение, а DALL.E хоть и создает изображения из текстовых описаний, но не будет писать для вас статьи в блог, отвечать на вопрос или рассказывать анекдот.
Это не разумные или всезнающие сети ИИ, это машины с прогнозирующими моделями, каждая из которых обучается с помощью данных для выполнения заранее определенной задачи.
Со временем эти наборы данных будут все больше и больше перекрываться, но они по-прежнему связаны запросами задач и параметрами, в которых они обучаются.
Обучающие данные быстро устаревают
Для обучения этих систем машинного обучения/глубокого обучения используются большие наборы данных, но из-за присущей им проблемы недостаточного понимания и осведомленности, а также угрозы подвергания системы токсичным или иным образом потенциально опасным данным ни одна из этих обучающих данных является "живым".
Это делается с помощью контролируемого обучения, тщательно курируемого специалистами по обработке и анализу данных.
GPT-2 обучался с использованием 1,5 миллиарда параметров, а GPT-3 обучался с существенно большим числом параметров — 175 миллиардов. Однако это исторические данные. Это не оперативные, изменяющиеся данные в режиме реального времени.
На самом деле ChatGPT-3 обучался на данных только до середины 2021 года, поэтому пользователи, которые полагаются на него, например, для ответов на вопросы о технологиях, получают устаревшие ответы, учитывая темпы ускорения технического прогресса. Большой прогресс происходит в течение одного года.
Необъяснимый путь к результатам
Еще одна огромная проблема с этими машинными моделями прогнозирования заключается в том, что невозможно проверить путь к результатам.
Эти машины обучаются на наборах данных, но нейронные сети настроены на обработку данных в ходе процесса, который является случайным и скрытым в нескольких перекрывающихся входных и выходных данных, пока не будет получен окончательный результат с высокой вероятностью успеха. р>
Это означает, что у нас нет возможности узнать, как именно он работал и как он достиг своих результатов.
Это не представляет проблемы, если вы просите свою модель ИИ выиграть в шахматы. В этом случае не имеет большого значения, как это привело к наилучшему возможному выигрышному ходу. Он просто победил.
Однако, если у вас есть модель ИИ нейронной сети, которая используется в области медицины, и каким-то образом ее обучающие данные были ошибочными или она ошиблась в своем заключении, ошибочно предполагая что-то вроде ампутации ноги или рискованной ненужной операции, то это проблема.
Без понимания того, как модель ИИ пришла к такому решению, невозможно исправить его и предотвратить повторение той же ошибки в будущем.
«Правды» не существует
Имейте в виду, что эти машины глубокого обучения также безразличны к истине. Их не интересует истина. Они не знают истины. Они не способны к абстрактному мышлению.
Эти машины просто обучены выдавать что-то, что очень похоже на «точность», на основе полученных входных данных и случайных последовательностей сопоставления с образцом, которые отфильтровывают вероятность «неудачного» ответа.
Это означает, что с большими языковыми моделями, такими как ChatGPT, они склонны выплевывать чепуху, если она «звучит» правдоподобно и следует правилам, с помощью которых она была обучена. ChatGPT не понимает, что говорит, а только вероятность того, какие слова должны быть следующими.
Чем больше машина обучается на больших наборах данных и взаимодействиях, тем более вероятным становится правильный вывод, но «подходящий» вывод сильно отличается от «точного» вывода, и шансы на точность на основе культивируемой вероятности, которая по своей сути оставляет место для ошибки.
Глубокое обучение натолкнулось на фундаментальную стену.
С помощью этой технологии машинного обучения мы разработали несколько ценных и полезных инструментов для повышения производительности и творчества, но эти инструменты не вносят реального вклада в когнитивную науку, и из-за присущих им ограничений они никогда не смогут достичь AGI на по собственному желанию.
Путь к ОИИ
По словам доктора Гэри Маркуса, ученого и лидера в области искусственного интеллекта, в его прогнозах на 2023 год одним из основных путей продвижения к ОИИ является способность «конструировать внутренние модели того, как работает мир», наряду с «способность понимать вещи на абстрактном уровне».
Далее он предсказывает, что «критическим шагом на оптимальном пути к ИИ, которому мы можем доверять… нам потребуются действительно новые архитектуры, в основе которых лежат явные знания и модели мира».
Введение: Active Inference, KOSM™ и Spatial Web Protocol
По данным VERSES Technologies, компании, занимающейся когнитивными вычислениями, которая специализируется на системах искусственного интеллекта (ИИ) нового поколения, "Пространственная сеть – это открытая, гиперсвязанная, контекстно-зависимая сеть, основанная на управлении, состоящая из людей, машин и и ИИ».
Основная платформа VERSES, операционная система KOSM™, представляет собой «сетевую операционную систему, которая упрощает разработку и развертывание автономных приложений в пространственной сети».
<цитата>KOSM™ позволяет разрабатывать и развертывать новый класс гиперинтегрированных контекстно-зависимых автономных приложений, которые поддерживают межплатформенное взаимодействие между разрозненными аппаратными средствами (например, дронами, датчиками, интеллектуальными устройствами, роботами) и программными системами (например, корпоративными службами). , облачные платформы, мобильные приложения, искусственный интеллект). Он состоит из пяти «модулей потока», которые работают совместно для обработки и синтеза данных, поступающих от различных датчиков IoT и цифровых информационных систем, в согласованную удобочитаемую и машиноисполняемую структуру для целей обеспечения большего интеллекта и автоматизации человека, IoT. , ИИ и роботизированная полевая деятельность. « — VERSES Technologies
Благодаря глобальному моделированию цифровых близнецов ИИ на основе моделей для активного вывода занимает внутреннее представление мира, которое постоянно обновляется в режиме реального времени с помощью данных датчиков и камер, делая выводы (решения) на основе постоянно улучшающейся модели.
В этой следующей эволюции Интернета, Пространственной паутине, также известной как Сеть всего, у вас есть модель (цифровой двойник каждого объекта в каждом пространстве) и у вас есть контекст всего, с чем объект вступает в контакт ( закодированы в модели с помощью HSML, языка программирования контекстных графов Spatial Web Protocol).
Эта новая сеть Web 3.0 становится основой для действительно расширенного существования и совершенно нового поколения искусственного интеллекта и обмена данными.
С помощью HSTP (протокола гиперпространственных транзакций) и HSML (языка гиперпространственного моделирования) контекст кодируется в каждом объекте — человеке, месте или вещи, физической или цифровой, для определения, описания и категоризации различимых и развивающихся черт любого объекта. пользователь, объект, действие или протокол в любой среде, будь то реальная или виртуальная.
В пространственной сети HSML позволяет вычислять контекст на основе определения, записи и отслеживания изменяющихся деталей в физических и цифровых измерениях, социальных измерениях, значениях, культуре, условиях, обстоятельствах. , а также ситуации, будь то геометрические, геополитические или геосоциальные по своей природе.
Кто, что, когда, где, почему и как все объекты и данные в этой новой сети будут автоматически известны и разрешены, что позволит ИИ с уровнем автоматизации адаптивного интеллекта с помощью графа знаний, основанного на классификациях моделирования HSML, < strong>способность различать непредвиденные обстоятельства и взаимосвязи между этими элементами, создавая вычислимый контекст, который легко понять и обработать для каждого объекта в пространстве и во времени.< /p>
Искусственный интеллект Active Inference для «принятия решений» работает во всей экосистеме Spatial Web в виде вложенных иерархий, основанных на принципе свободной энергии, разработанном известным нейробиологом-теоретиком доктором Карлом Фристоном, главным научным сотрудником Verses Technologies и лаборатории искусственного интеллекта VERSES. Исследовательский центр Sensor Fusion.
В 2016 году д-р Фристон занял первое место среди самых влиятельных нейробиологов в мире по версии Semantic Scholar. Он является одним из самых известных и цитируемых ученых в области вычислительной неврологии и искусственного интеллекта.
Кроме того, он является ведущим мировым экспертом в области разработки и применения Active Inference, основанного на биологическом подходе к искусственному интеллекту.
Активный вывод, применяемый к искусственному интеллекту, представляет собой метод понимания разумного поведения, включающий мозг, познание и поведение, смоделированный на основе принципов проектирования, взятых из природы, в отношении того, как мозг, нервная система и тело действуют и реагируют.
ИИ Active Inference в Spatial Web на платформе KOSM™ работает в рамках целостной структуры вложенных пространственных доменов.
Холонскую архитектуру можно описать как нечто, что может быть «целым» само по себе, но также быть частью чего-то большего. Например, человеческое сердце состоит из клеток.
Эти клетки являются «целыми» клетками, но при этом являются «частью» сердца, которое является «цельным» сердцем, но при этом является «частью» человеческого тела.
Каждый компонент существует как целостный элемент, который также является частью всего организма, расположенными как вложенные сущности друг в друга, которые управляются правилами более крупного влияющего организма, и аналогичным образом наследуются и передаются внутренним частям, вложенным в него, с каждым часть, имеющая свои собственные правительственные соображения для своих конкретных внутренних требований.
Кроме того, Active Inference включает в себя принцип марковских одеял на каждом уровне анализа, определяя границы, действующие как разделы для взаимодействия между «внутренними» и «внешними» состояниями отдельной единицы, региона или всей сложной сети, что приводит к самоорганизующаяся система.
Одним из примеров того, как это может происходить в пространственной сети, может быть фабрика, которая является частью цепочки поставок, на которую сырье поступает из разных мест, шахт и т. д. Затем фабрика производит готовую продукцию, которая отправляется в другое место назначения, например распределительный склад.
Точно так же, как этот завод является объектом в более крупной экосистеме глобальной цепочки поставок, каждый объект на заводе принадлежит к его внутренней экосистеме.
У вас есть внутренняя и внешняя экосистемы, которые одновременно работают в соответствии с отдельными внутренними и внешними стандартами, взаимозависимостями и взаимосвязями.
Каждый объект во всей сети Spatial Web является частью взаимосвязанной экосистемы, которая передает непрерывный поток контекста в реальном времени между всеми точками в пространстве и времени.
Этот непрерывный поток взаимодействия и коммуникации учитывает все нюансы и изменения в отношениях между всеми объектами и параметрами, которые ими управляют.
ИИ на основе моделей для активного вывода становится глобальным организмом искусственного интеллекта, состоящим из вложенных ИИ, называемых интеллектуальными агентами, которые обитают в пространственной сети через операционную систему KOSM™, живут в сети и обновляются в режиме реального времени.
По самой своей природе Active Inference AI полностью поддается аудиту, а основы всех его решений полностью известны и точно контролируются.
Кроме того, искусственный интеллект Active Inference внутри KOSM™ имеет доступ ко всей пространственной сети с датчиками и камерами IoT, а также ко всем маркерам контекста, прикрепленным ко всем объектам в любом пространстве и времени. Этот ИИ становится экосистемой интеллектуальных агентов, которые взаимодействуют через HSTP.
Этот Коллективный разум обучается на данных в реальном времени и развивается, принимая решения и обновляя свою внутреннюю модель, основываясь на том, что происходит СЕЙЧАС, а не на исторических наборах данных.
Это недостающая часть головоломки данных, которая приводит нас к искусственному общему интеллекту. Теперь у нас есть модель мира, и теперь у нас есть возможность использовать непрерывные и адаптивные маркеры контекста, позволяющие создать когнитивную модель этого мира, и возможность вычислять осведомленность.
«Впервые в истории, начиная с сегодняшнего дня, у нас есть дорожная карта. AGI теперь возможен». — Дэн Мэйпс, президент и соучредитель, VERSES технологий и директор The Spatial Web Foundation
VERSES Technologies и Spatial Web Foundation готовы помочь нам в этом.
Это первая часть серии из четырех статей под названием «Пространственная сеть и эра ИИ».
Далее, во второй части, мы получим более полное представление об искусственном интеллекте Active Inference и докторе Карле Фристоне, а затем углубимся в тонкости операционной системы KOSM™ в третьей части этой серии. — Наслаждайтесь поездкой!
Чтобы узнать больше о Spatial Web Protocol и эволюции Web 3.0, посетите SpatialWebFoundation.org em>
Оригинал