Минотаврский момент Microsoft
21 апреля 2023 г.Миф о Минотавре
Минотавр из греческой мифологии – это прекрасный пример чего-то, что обладало огромной силой, но также имело фатальную слабость. Минотавр был получеловеком-полубыком, обладавшим огромной силой и свирепостью.
Однако в конечном итоге оно было побеждено афинским героем Тесеем, который использовал против него одну фатальную слабость существа — его неспособность перемещаться по лабиринту, в котором оно было заточено.
Теперь давайте выясним, какое отношение это могущественное греческое мифическое существо имеет к современной Microsoft и как начинающие молодые предприниматели могут найти способы противостоять его почти непреодолимой силе.
Возрождение Microsoft
Когда Сатья Наделла стал генеральным директором Microsoft в 2014 году, он унаследовал компанию, переживавшую застой и изо всех сил пытавшуюся конкурировать в быстро развивающемся технологическом ландшафте.
С тех пор лидерству Наделлы приписывают возрождение Microsoft за счет переключения ее внимания с традиционных операционных систем и программного обеспечения для повышения производительности на облачные вычисления и искусственный интеллект.
Хорошим примером является пакет Office для повышения производительности и то, как он развивался до и после правления Наделлы.
Microsoft Office, впервые представленный в 1989 году, стал краеугольным камнем продуктивности и общения в деловом мире.
Как набор программных приложений, он первоначально включал Word, Excel и PowerPoint, но с тех пор расширился и стал включать другие инструменты, такие как Outlook, Access и Publisher.
Постоянные усилия Microsoft по улучшению и совершенствованию этих приложений позволили ей сохранить доминирующее положение на рынке.
К началу 2000-х годов Microsoft Office стал отраслевым стандартом для создания документов, управления данными и дизайна презентаций, и эта позиция сохраняется и по сей день.
В 2011 году Microsoft представила Office 365, что стало значительным изменением в бизнес-стратегии компании. Переходя на облачную модель подписки. Эта модель помогла Microsoft укрепить доминирующее положение на рынке, а также создала сильный эффект привязки клиентов.
Модель подписки обеспечила Майкрософт стабильный поток доходов и побудила пользователей оставаться в экосистеме, поскольку стоимость перехода на альтернативные решения становилась все более обременительной и менее привлекательной.
Но амбиции Microsoft вышли далеко за рамки Office 365 и облачных вычислений Azure.
Войти в Минотавра
Как мы помним из греческого мифа, Минотавр обладал огромной силой, главным образом потому, что это было существо-гибрид получеловека-полубыка. Если провести аналогию, Microsoft:
* Half Human: человеческий язык и мудрость через эксклюзивную лицензию OpenAI
* Half Bull: компьютерный язык и интеллект благодаря праву собственности на GitHub
Мы углубимся в каждую из этих одинаково мощных половин для более глубокого анализа.
Получеловек — OpenAI и ChatGPT
Стратегические инвестиции Microsoft и ее эксклюзивное лицензионное партнерство с OpenAI, изобретателем ChatGPT, сыграли значительную роль в укреплении позиции компании как доминирующего игрока в области ИИ.
Объявленное в 2019 году партнерство помогло Microsoft использовать передовые исследования OpenAI для разработки новых технологий искусственного интеллекта и их интеграции в свои продукты и услуги.
Это сотрудничество способствовало росту экосистемы искусственного интеллекта Microsoft, что позволило компании предоставлять возможности на основе искусственного интеллекта в своих предложениях, включая службы искусственного интеллекта Azure, Cortana и даже приложения Office 365.
Масштабы и необычайно высокая скорость интеграции OpenAI в Office 365, жемчужине Microsoft в области повышения производительности, красноречиво говорят о стратегической важности OpenAI для Microsoft.
Таким образом, Microsoft теперь захватывает весь человеческий язык, знания и, по крайней мере, некоторую предполагаемую мудрость (что некоторые исследователи Microsoft назвали "искра ОИИ"). Благодаря эксклюзивному лицензионному соглашению с OpenAI у него не будет близких конкурентов.
Вы можете утверждать, что Google и Meta могут бросить вызов монополии OpenAI/Microsoft, но их соответствующие модели больших языков, Bard и LLaMA, похоже, отстают как минимум на одно поколение.
Кроме того, OpenAI превратилась из некоммерческой организации в организацию с ограниченной прибылью. И есть этот забавный предел прибыли при 100-кратном вложении.
Поскольку Microsoft уже вкачал и планирует вкачать в OpenAI более 10 миллиардов долларов, можно смело предположить, что OpenAI не отмежевалась от Microsoft в ближайшее время.
И Microsoft всегда может «инвестировать» больше денег в OpenAI вместо того, чтобы покупать продукты и услуги у OpenAI. Это увековечит симбиоз между OpenAI и Microsoft.
Неудивительно, что группа очень важных людей настолько встревожена, что подписала петицию приостановить все исследования ИИ на следующие 6 месяцев.
Half Bull — GitHub, Codex и Co-Pilot
Приобретение и интеграция GitHub в 2018 году, ведущей платформы для разработки программного обеспечения и совместной работы, еще больше расширили влияние Microsoft на человеческий интеллект в целом.
GitHub — это центр для всех ведущих проектов с открытым исходным кодом, и вы можете считать его агрегированным хранилищем человеческого интеллекта, выраженного на компьютерном языке, который работает для всех в современном мире.
Я хотел бы подчеркнуть значение Кодекса OpenAI, передовой языковой модели, которая оказала глубокое влияние на область разработки программного обеспечения, особенно благодаря ее интеграции с Copilot GitHub.
Codex, который является частью семейства моделей GPT-3, способен понимать и генерировать человекоподобный текст, включая программный код.
Его способность интерпретировать запросы на естественном языке и генерировать точные и контекстуально релевантные фрагменты кода сделали его ценным инструментом для разработчиков.
Copilot от GitHub, использующий возможности Codex, служит помощником по кодированию на основе искусственного интеллекта, который помогает разработчикам писать код более эффективно, предоставляя предложения в реальном времени и автоматически завершая сегменты кода.
Интеграция Copilot с Codex изменила процесс разработки программного обеспечения, сократив время и усилия, необходимые для написания кода, минимизировав количество ошибок и позволив разработчикам сосредоточиться на проектировании более высокого уровня и задачах решения проблем.
После длительного использования GitHub Co-Pilot и недавнего объединения его с ChatGPT v4 я только начал осознавать его огромную мощь и огромный потенциал.
Как менеджер по продукту и соучредитель, теперь я могу концептуализировать идею, написать краткое требование и позволить ChatGPT выдать довольно приличный шаблон.
Затем в Visual Studio Code с GitHub Co-Pilot я могу при необходимости изменить функцию и параметры, немного настроить поток управления и бизнес-логику, и через несколько часов у меня будет полностью рабочий прототип.
Поскольку я не настоящий практикующий инженер-программист, такое прототипирование стоило бы мне 1-2 недель хакерского времени или упрашивания некоторых инженеров-программистов поработать над ним.
И это не так уж далеко от настоящего движения разработки программного обеспечения «без кода», которое будет процветать среди людей, которые даже не понимают основ существующих языков программирования.
Для опытных разработчиков программного обеспечения есть заявления о повышении производительности в 3 или даже 10 раз благодаря сочетанию GitHub Co-Pilot и chatGPT v4.
Эти инструменты могут легко находить шаблоны проектирования из гигантского репозитория GitHub и вписываются в контекст программной системы, над которой в настоящее время работает разработчик.
Это экономит много поисковых запросов в Google, уменьшает набор текста и проверку ошибок, а также автоматизирует большую часть документации и тестирования. Один инженер даже пожаловался, что ему хотелось лишиться одной руки, когда GitHub Co-Pilot отключился на несколько часов.
Потенциальная опасность Минотавра
Миссия Google состоит в том, чтобы «организовать мировую информацию и сделать ее общедоступной и полезной». Для этого Google выполняет рейтинг PageRank на всех веб-сайтах и создает для них гигантский индекс.
Но с большой языковой моделью Microsoft/OpenAI GPT и кодексом GitHub мировая информация может быть сжата до миллиардов и триллионов весов (образно говоря, чисел, имеющих статистическую значимость).
И тут меня осенило, что мы вступили в эпоху Минотавра Microsoft.
Глубоко укоренившиеся отношения Microsoft с OpenAI вызвали опасения по поводу того, что компания может использовать свою объединенную мощь для создания монополии в области искусственного интеллекта.
Языковая модель OpenAI GPT-4 — одна из самых мощных систем искусственного интеллекта в мире на сегодняшний день, а GitHub — крупнейшая в мире платформа для размещения кода.
Если бы Microsoft использовала эти инструменты для подавления конкуренции, это могло бы оказать существенное влияние на развитие ИИ и индустрии высоких технологий в целом.
Важно отметить, что это всего лишь опасения, и нет никаких доказательств того, что Microsoft планирует использовать свою объединенную власть монопольно.
Однако крайне важно осознавать потенциальную опасность такого шага и следить за тем, чтобы Microsoft не злоупотребляла своей властью.
Надежда Тесея (и стартапов)
Инновации на плечах гигантов
Стартапы могут использовать платформы крупных компаний для разработки новых продуктов, используя ресурсы, инфраструктуру и пользовательскую базу, предлагаемые этими платформами. Вот несколько примеров предыдущих историй успеха:
- Apple App Store и Google Play Store. Создавая приложения на этих платформах, стартапы могут получить доступ к огромному рынку пользователей смартфонов, легко распространять свои продукты и получать выгоду от безопасных платежных систем магазинов приложений.
2. Amazon Web Services (AWS). Стартапы могут использовать инфраструктуру облачных вычислений AWS для создания и масштабирования своих приложений, хранения данных и доступа к инструментам расширенной аналитики. Это позволяет им сосредоточиться на инновациях и разработке продуктов, не беспокоясь об инвестициях в собственную ИТ-инфраструктуру и управлении ею.
Используя платформы крупных компаний, стартапы могут получить доступ к ресурсам, инфраструктуре и базам пользователей, которые иначе было бы сложно или дорого приобрести. Это позволяет им сосредоточиться на инновациях и разработке продуктов, увеличивая шансы на успех на конкурентном рынке.
Мы уже являемся свидетелями Кембрийского взрыва инструментов и решений на базе ИИ. Не проходит и дня без шквала объявлений от начинающих стартапов, объединяющих GPT OpenAI с новыми наборами данных (юридическими, финансовыми), другими моделями ИИ (распознавание голоса, распознавание изображений), другими генеративными решениями ИИ (синтез голоса, преобразование текста в текст). изображение и текст в видео) и многое другое.
Обратиться за помощью к Властелину
Один из основных рисков использования сторонних коммерческих платформ заключается в том, что платформа может измениться, умереть или даже конкурировать со своими собственными партнерами по экосистеме. Одним из примеров является противостояние Facebook и Zynga, а другим примером является деплатформизация основных социальных сетей различных идеологий.
Поэтому предприниматели могут найти помощь в необычных местах: правительства и регулирующие органы, чтобы пресечь любое антиконкурентное поведение. И они могли бы извлечь уроки из предыдущих антимонопольных исков в технологическом секторе.
Играть в открытую
Открытый исходный код был надежным и верным оружием в борьбе с большими монолитами с закрытым исходным кодом. Поскольку OpenAI закрыл исходный код своих моделей GPT-3 и GPT-4, Meta сделала нетипичный шаг и открыла исходный код своей собственной большой языковой модели под названием LLaMA для исследовательских целей.
Это, безусловно, самый продвинутый LLM с открытым исходным кодом, в котором можно обучить до 65 млрд весов на основе 1,4 триллиона слов.
Что еще более интересно, Meta также открыла доступ к моделям с весом 7, 13 и 33 миллиарда. Эти меньшие по размеру LLM позволили многим исследовательским группам создать свои собственные модели с тонкой настройкой на основе LLaMA.
Вот лишь некоторые из них: Альпака из Стэнфорда, Викуна и Коала из Беркли, GPT4All и многие другие.
Используя усиленное обучение с помощью обратной связи, эти исследовательские усилия утверждают, что они могут достичь 90-95% производительности коммерческого ChatGPT 3.5 (175 миллиардов весов) всего с 7 миллиардами или 13 миллиардами весов.
Когда у вас есть эти меньшие модели LLM и оптимизированные реализации C++, такие как llama.cpp, вы внезапно можете запускайте эти модели локально на своем ноутбуке. Теперь у вас есть интеллектуальный помощник, работающий локально, который не зависит от облачного сервиса и ничего не стоит.
Модели LLaMA предназначены только для исследований, поэтому их нельзя использовать в коммерческих целях.
LLM с открытым исходным кодом действительно существуют, хотя их масштаб и производительность на несколько поколений отстают от современных коммерческих альтернатив. Тем не менее, многие LLM с открытым исходным кодом появляются как грибы после осеннего дождя.
Если вы внимательно следите за Huggingface и GitHub, вы можете найти многие из них, такие как:
* OpenAI: GPT-2 и GPT-Neo
* Вместе.xyz OpenChatKit
* Nomic-ai GPT4All
Думай за пределами лабиринта
Office 365 может быть собственным лабиринтом Microsoft. Зачем мне это говорить?
Прежде всего, Office 365 критически важен для Microsoft с точки зрения доходов и прибыли (23% от общего дохода в 2022 г. (источник). Microsoft может добавить возможности OpenAI в Office 365, но это может остаться добавочным обновлением, а не фундаментальным изменением.
Это просто потому, что Microsoft не может перевести своих корпоративных клиентов, которые, как известно, не склонны к риску и медленны в изменениях, в новую парадигму слишком быстрыми темпами или слишком драматическим образом. Так что в каком-то смысле Office 365 тоже является оковами Microsoft.
Так где же возможности для молодых стартапов? Если мы немного отступим, то причина, по которой мы создали пакет Microsoft Office, включая Word, Powerpoint и Excel, заключалась в том, что мы могли лучше общаться в бизнес-среде.
Как мы можем изобрести новые способы общения, выходящие за рамки существующих инструментов? Подумайте, как Slack и Notion превзошли электронные письма и как Figma превзошла традиционный творческий пакет Adobe.
Представьте, как новые интерфейсы человек-машина и человек-человек могут работать в бизнес-среде.
Если вы хотите выйти на научно-фантастические территории, вы можете принять во внимание Neuralink Илона Маска, где люди и машины электрически связаны.
Появление таких технологий, как Neuralink Илона Маска, целью которого является установление прямой связи между человеческим мозгом и машинами, открывает захватывающие возможности для переосмысления коммуникации в бизнес-среде.
Вот несколько способов, которыми такая технология потенциально может превзойти традиционные инструменты, такие как пакет Microsoft Office:
- Передача мыслей в текст. С помощью интерфейсов мозг-компьютер (BCI), таких как Neuralink, люди могут передавать свои мысли напрямую в виде текста или визуального контента, минуя клавиатуру или другие устройства ввода. Это может привести к более эффективному и быстрому обмену идеями, сводя к минимуму недопонимание и недопонимание, которые могут возникнуть при использовании традиционных методов.
2. Совместный мозговой штурм: интерфейсы мозг-компьютер могут обеспечить обмен мыслями и идеями в режиме реального времени во время сеансов мозгового штурма, позволяя членам команды одновременно вносить свой вклад и визуализировать концепции. Это может улучшить творческие процессы решения проблем и принятия решений, способствуя созданию более совместной и эффективной рабочей среды.
3. Иммерсивные презентации. Сочетание BCI с технологиями дополненной реальности (AR) или виртуальной реальности (VR) может произвести революцию в бизнес-презентациях. Вместо того чтобы полагаться на традиционные инструменты, такие как PowerPoint, докладчики могут создавать иммерсивные интерактивные приложения, которые задействуют чувства и эмоции аудитории, что приводит к более эффективному изложению сложных концепций и идей.
4. Общение с учетом эмоций: BCI потенциально могут обнаруживать эмоции и психические состояния во время разговоров, позволяя участникам лучше понимать чувства и точки зрения друг друга. Это может повысить эмпатию, облегчить конструктивную обратную связь и способствовать более здоровым рабочим отношениям.
5. Прямая передача знаний: Neuralink и аналогичные технологии могут проложить путь для прямой передачи знаний между людьми или от машин к людям. Это может коренным образом изменить процессы обучения и обучения на рабочем месте, сделав их более эффективными и персонализированными.
Хотя разработка и внедрение таких технологий, как Neuralink, еще предстоит пройти долгий путь, их потенциал для преобразования коммуникаций в бизнес-среде неоспорим.
Предоставляя более прямые, эффективные и чуткие формы общения, интерфейсы мозг-компьютер могут революционизировать то, как мы сотрудничаем, принимаем решения и обмениваемся знаниями на рабочем месте.
Неопределенное будущее
Хотя я воодушевлен и воодушевлен вновь обретенным приростом производительности благодаря комбинации Microsoft OpenAI и GitHub, я также обеспокоен тем, что одна компания может обладать такой большой властью над всем коллективным разумом человечества.
Я надеюсь, что юный Тесей сможет взять в руки меч с открытым исходным кодом и проложить новый путь за пределами лабиринта, чтобы интеллект человечества мог свободно процветать.
n Сноска: все иллюстрации сделаны автором и MidJourney
Оригинал