
Истинная стоимость LLM для предприятий
15 июля 2025 г.Таблица ссылок
Аннотация и 1. Введение
Основные помещения для наших моделей
2.1. Как взимаются LLM
2.2 Анедотальная модель из промышленности
2.3 Выбор затрат в модели
2.4 Почему несколько сценариев
Теоретическая модель решения
3.1 Как смоделировать успех
Модель для коммерческих операций на основе одной транзакции
4.1 Пример использования модели
4.2 Анализ модели
4.3 Обсуждение рентабельности рентабельности по сравнению
Моделирование проблемы бинарной классификации
5.1 Локальный анализ чувствительности
5.2 Глобальный анализ чувствительности методом SOBOL
Связанная работа
Будущая работа
Заключение, ссылки и подтверждения
6 Связанная работа
Как мы уже говорили ранее, большая часть работы по LLM основана на их эффективности под конкретными тестами [Chang et al., 2023, Zhao et al., 2023], игнорируя финансовые аспекты, относящиеся к бизнес -операции.
Наша работа соответствует более широкому дискурсу о возврате инвестиций в технологии искусственного интеллекта. Недавно две статьи пошли по тому же пути, как и наш, но с разными подходами.
Гупта [2024], концептуальный подход к раскрытию ROI, предлагает структурированную структуру, называемую континуумом зрелости ИИ, которая очерчивает уникальность кривой ROI в проектах искусственного интеллекта. Этот континуум сегментирован на три этапа: понимание проблемы и подготовка данных, улучшение модели и максимизация системных возможностей. На первом этапе подчеркивается понимание проблемы, определение показателей успеха и подготовку набора данных, что соответствует начальным шагам в нашей теоретичной модели решения, где мы определяем проблему и рассмотрим затраты и преимущества использования различных LLMS. Второй этап фокусируется на переходе от базовой модели к оптимизированной модели, отражающей наш подход оценки LLMS на основе их эффективности и связанных с ними затрат. Наконец, третий этап включает в себя толкание возможностей системы ИИ к их пределам, аналогично нашему анализу чувствительности и тонкой настройке переменных затрат, чтобы максимизировать рентабельность инвестиций. Гупта [2024] подчеркивает важность поэтапного подхода к разработке ИИ и подчеркивает значительные усилия, необходимые на начальных этапах для обеспечения успешной реализации. Их подход, однако, является чисто концептуальным, в то время как наш основан на теоретической модели.
Shekhar et al. [2024] Обсудите стратегии для оптимизации затрат, связанных с использованием LLM. Их исследование идентифицирует, как и наше, ключевые переменные стоимости, такие как сетевые затраты, затраты на внедрение и периодическая тонкая настройка моделей, которые имеют решающее значение для точной оценки и оптимизации затрат. Они подчеркивают важность рассмотрения как фиксированных, так и переменных затрат в экономической оценке LLMS. Эта работа дополняет наше исследование, предоставляя подробную разбивку компонентов затрат. Кроме того, они подчеркивают влияние стратегий обучения подкрепления и необходимость периодически переработки моделей, соответствующих нашей рекомендации по интеграции больших переменных затрат, включая необходимость периодической точной настройки, в будущей работе. Их подход к оптимизации затрат, хотя и не учитывает выгоды и убытки или различное влияние вероятностей успеха.
7 будущая работа
Будущие исследования должны изучить больше бизнес -сценариев для расширения применимости предлагаемых моделей. Каждая отрасль или бизнес -модель имеет уникальные операционные переменные и проблемы, которые могут повлиять на принятие и успех LLM. Изучая различные контексты, такие как розничная торговля, финансы, здравоохранение и логистика, структура может быть уточнена для удовлетворения конкретных потребностей различных секторов. Это исследование повысит надежность этого теоретичного подхода, гарантируя, что он будет адаптирован и актуально для широкого спектра бизнес-приложений.
Комплексная оценка LLM должна учитывать более широкий спектр переменных затрат. Некоторые из этих аспектов обсуждаются в подразделении 2.3.1. Это включает не только первоначальные фиксированные затраты, связанные с реализацией и использованием, но также и другие задачи, связанные с ИИ, такие как периодическая настраиваемая настройка и расходы на обслуживание, а также дополнительные переменные затраты, такие как сетевые затраты. Будущая работа должна сосредоточиться на разработке моделей, которые включают эти текущие затраты, чтобы обеспечить более точную и реалистичную оценку общей стоимости владения.
Что касается самих моделей, необходимо проанализировать влияние входного размера на вероятность успеха в отношении различных стратегий быстрого. Это будет означать моделирование P, и его изменения, функцию P, влияя на анализ чувствительности. Это позволило бы включить быструю техническую оценку в нашу модель, поскольку подсказка с нулевым выстрелом за один ход была бы гораздо меньшей транзакцией, чем многоворотливая смешанная стратегия со многими агентами [Sahoo et al., 2024, Li et al., 2024].
Динамическая оценка доходов и затрат проекта с течением времени имеет важное значение для принятия инвестиционных решений. Будущая работа должна сосредоточиться на разработке моделей, которые рассчитывают текущую стоимость будущих денежных потоков, принимая во внимание стоимость денег с течением времени. Это включает в себя выступление доходов и потоков затрат на протяжении всего жизненного цикла проекта и дисконтирование их до текущей стоимости. Включая такие методы, как чистая приведенная стоимость (NPV) и внутренняя норму прибыли (IRR), модели могут предоставить более точную картину долгосрочной финансовой жизнеспособности и прибыльности инвестиций LLM [Park, 2013].
8 Заключение
Это исследование подчеркивает важность рассмотрения конкретных бизнес -параметров, таких как прибыль, убытки и вероятность успеха, при оценке доходов и ROI для LLM.
Этот анализ показывает, что важно оптимизировать P и T для одной и той же бизнес -операции при выборе LLM, всегда принимая во внимание C, хотя он довольно мал, поскольку все эти значения оказывают сильное влияние как на доходы, так и на рентабельность инвестиций.
Наши результаты подчеркивают, что для предприятий, стремящихся оптимизировать свои технологические инвестиции, особенно при развертывании современных языковых моделей, крайне важно учитывать не только прямые затраты, но и более широкие экономические последствия эффективности моделей и показателей успеха. Например, мы показываем, что для некоторых деловых задач с небольшими транзакциями и большими успехами быстрое сжатие может принести негативные финансовые результаты. Этот подход предоставляет более нюансированную структуру, которая может руководить стратегическими решениями, гарантируя, что инвестиции соответствуют ожидаемой финансовой прибыли.
Эта статья способствует продолжающемуся дискурсу о вычислительных финансах путем уточнения методов, используемых для оценки технологических инвестиций, особенно в области искусственного интеллекта.
Будущие исследования должны рассмотреть возможность расширения этих анализов, включающих более сложные модели и более широкий спектр операционных контекстов для дальнейшей проверки и повышения надежности наших выводов.
Ссылки
Кристофер М. Бишоп. Распознавание и машинное обучение (информационная наука и статистика). Springer-Verlag, Berlin, Heidelberg, 2006. ISBN 0387310738.
Юпенг Чанг, Сюй Ванг, Джидонг Ванг, Юань Ву, Лини Ян, Кайджи Чжу, Хао Чен, Сяоюан Ю, Кункси Ванг, Идонг Ванг, Вей Ю, Юэ Чжан, И Чанг, Филипп С. Ю, Цяньг Ян и Синси. Опрос о оценке крупных языковых моделей, 2023.
Грабриэль Фрам. Рациональный выбор и стратегический конфликт: субъективистский подход к игровому решению и теории. De Gruiter, Berlin, 2019.
Анудж Гупта. AI LOGULITY Continuum: трехэтапная структура для понимания возврата инвестиций (ROI) в ИИ. SSRN Electronic Journal, 2024. ISSN 1556-5068. DOI: 10.2139/SSRN.4754694. URL http://dx.doi.org/10.2139/ssrn. 4754694.
Джон Херман и Уилл выпит. Салиб: библиотека Python с открытым исходным кодом для анализа чувствительности. Журнал программного обеспечения с открытым исходным кодом, 2 (9), 1 2017. DOI: 10.21105/ joss.00097. URL https://doi.org/10.21105/joss.00097.
Такуя Иванага, Уильям Ашер и Джонатан Герман. На пути к Salib 2.0: продвижение доступности и интерпретации анализа глобальной чувствительности. Моделирование социально-экологических систем, 4: 18155, 5 2022. DOI: 10.18174/SESMO. 18155. URL https://sesmo.org/article/view/18155.
Huiqiang Jiang, Qianhui Wu, Chin-Yew Lin, Yuqing Yang и Lili Qiu. Llmlingua: сжатие подсказок для ускоренного вывода моделей крупных языков. В материалах конференции 2023 года по эмпирическим методам обработки естественного языка, страницы 13358–13376. Ассоциация вычислительной лингвистики, декабрь 2023a. doi: 10.18653/v1/2023.emnlp-main.825. URL https://aclanthology.org/2023.emnlp-main.825.
Huiqiang Jiang, Qianhui Wu, Xufang Luo, Dongsheng Li, Chin-Yew Lin, Yuqing Yang и Lili Qiu. Longllmlingua: ускорение и улучшение LLM в сценариях длинных контекстов посредством быстрого сжатия. Arxiv Preprint, ABS/2310.06839, 2023b. URL https://arxiv.org/abs/2310.06839.
Рави Кишор Кодали, Ятендра Прасад Упрети и Лакшми Боппана. Большие языковые модели в AWS. В 2024 году 1 -я Международная конференция по робототехнике, инженерии, науке и технологиям (RESTCON), страницы 112–117, 2024. DOI: 10.1109/RESTCON60981.2024.10463557.
Junyou Li, Цинь Чжан, Янбин Ю, Цянь Фу и Дехенг Йе. Больше агентов - это все, что вам нужно, 2024.
Openai. Openai Pring. https://openai.com/pracing, 2024.
Чжуоши Пан, Цяньхуи Ву, Хуицян Цзян, Менглин Ся, Сюфанг Луо, Юэ Чжан, Цинвей Лин, Виктор Рюле, Юцин Ян, Чин-Лин, Х. Вики Чжао, Лили Циу и Донгмеи Чжан. Llmlingua-2: перегонка данных для эффективного и верного сжатия с агровой задачей, 2024.
Чан С. Парк. Основы инженерной экономики. Пирсон, 3 издание, 2013.
Институт управления проектами. Руководство по руководству по управлению проектами (Guide PMBOK®). Институт управления проектами, Ньютаун-сквер, Пенсильвания, 7 издание, 2021 год. ISBN 978-1628256642.
Пранаб Саху, Аюш Кумар Сингх, Шрипарна Саха, Виния Джайн, Самрат Мондал и Аман Чадха. Систематический обзор быстрого разработки в моделях крупных языков: методы и приложения, 2024.
Андреа Салелли, Стефано Тарантола, Франческа Камполонго и Марко Ратто. Анализ чувствительности на практике: руководство по оценке научных моделей. John Wiley & Sons, 2004.
Андреа Салелли, Марко Ратто, Терри Андрес, Франческа Камполонго, Джессика Карибони, Дебора Гателли, Микаэла Сайсана и Стефано Тарантола. Глобальный анализ чувствительности: праймер. Wiley-Interscience, 2008.
Леонард Дж. Сэвидж. Основы статистики. Dover Publications, Нью -Йорк, 2 Edition, 1954.
Шиваншу Шехар, Таниш Дюбей, Койель Мукерджи, Апаурв Саксена, Атхарв Тиаги и Нишант Котла. К оптимизации затрат на использование LLM, 2024.
Илья М Собол. Глобальные индексы чувствительности для нелинейных математических моделей и их оценки Монте -Карло. Математика и компьютеры в моделировании, 55 (1-3): 271–280, 2001.
Уэйн Синь Чжао, Кун Чжоу, Джуни Ли Ли, Тиани Тан, Сяолей Ванг, Юпенг Хоу, Ингчян Мин, Бейхен Чжан, Джуни Чжан, Зикан Донг, Ифан Дю, Чен Ян, Юшуо Чен, Зини Чен, Джинхао Джианг, Ренг -Жин, Зини Лик, Хенг, Джингао, Джуанг, Жинган, Жинган, Жинган, Пейю Лю, Цзянь-Юн Ни и Джи-Ронг Вэнь. Обзор крупных языковых моделей, 2023.
Зихуай Чжао, Венки Фан, Джиатонг Ли, Юньцин Лю, Сяоуей Мей, Ики Ван, Чжэн Вэнь, Фей Ван, Сяньгю Чжао, Джилиан Тан и Цин Ли. Рекомендованные системы в эпоху крупных языковых моделей (LLMS), 2024.
Благодарности
Эта статья была написана с помощью различных инструментов искусственного интеллекта для частично генерирования кода, найти ссылки и проверить стиль и грамматику. Среди используемых LLM были Google Assistant для Google Colab, Google Search Lab Ai, Openai Catgpt-4o, Microsoft Co-Pilot для Visual Studio Code и Writeful. Все авторы имеют английский как свой второй язык.
Это исследование было частично финансировано Координаткой De Aperfeiçoamento de Pessoal de Nível Superior - Brasil (Capes) - финансовый код 001 ».
Авторы:
(1) Джеральдо Xexéo, Programa de Engenharia de Sistemas E Computação - Coppe, Universidade Federal Do Rio De Janeiro, Бразиль;
(2) Филипе Брайда, Destamento de Ciência da Computação, Universidade Federal Rural Do Rio de Janeiro;
(3) Маркус Паррейс, Programa de Engenharia de Sistemas e Computação - Coppe, Universidade Federal Do Rio de Janeiro, Бразил и Координадория де Энгенхария де Продушен - Coenp, Cefet/RJ, Unidade Nova Iguaçu;
(4) Пауло Ксавье, Programa de Engenharia de Sistemas E Computação - Coppe, Universidade Federal Do Rio de Janeiro, Бразил.
Эта статья есть
Оригинал