
Как я построил свое первое приложение для ИИ: история, стоящая за фотофиксом
25 июля 2025 г.Как и многие разработчики, мне какое -то время было любопытно. Я играл с CHATGPT, проверил несколько фото инструментов ИИ и читал слишком много тем о «создании следующего стартапа ИИ в выходные».
Но я хотел выйти за рамки игры. Я хотелСоздайте что -нибудь реальное, с реальными пользователями. Вот какФотофиксродился, мое первое приложение с AI, которое занимает низкокачественное или размытое изображения и превращает их в нечто более четкое, более острее и готовое к высококлассным.
СПОЙЛЕР: Это была не плавная поездка.
Идея
Я хотел что -то мертвые для пользователя:
- Загрузите изображение (может быть размытым, низким разрешением, шумным)
- Пусть AI улучшит и высококлассену (2K или 4K)
- Загрузите результат
Конечно, такие инструменты уже существуют. Но я не строил его, чтобы конкурировать. Я хотелпонять процессТестируйте различные модели, экспериментируйте с хостингом и узнайте, что нужно, чтобы отправить реальный продукт искусственного интеллекта.
Стек
Я построил как бэкэнд, так и фронт сNuxt.jsПолем Это помогло мне двигаться быстро, остаться в одном репо и избежать переполнения архитектуры.
Некоторые из технических вариантов:
- Фронт/бэкэнд: Nuxt.js
- Хостинг: Docker Containers наDokloy
- Хранилище: CloudFlare R2
- CDN: Cloudflare
- ГПУ вывод: В конце концов, я приземлился наModal.com
- Модели пробовали: Репликационные модели → Реал-эсрган → другие модели с открытым исходным кодом → Пользовательские веса LLM
Ранние попытки: боли в API
Сначала я использовал Replicate, чтобы справиться с тяжелой работой. Это был самый быстрый способ прототипа, просто отправьте изображение, верните улучшенную версию.
НоЗадержка убивала UXПолем Холодные запуска, модельные вращения и медленный вывод означал, что пользователи ждали 30+ секунд. Это было не надежно, и я не контролировал базовое поведение модели.
Так что я нырнул глубже.
Собираясь с открытым исходным кодом (и немного провалится)
Я начал экспериментировать сМодели с открытым исходным кодомнравитьсяРеал-эсрган, самостоятельно их с помощью контейнеров GPU наModal.comПолем
Первая версия сработала, но:
- Результаты были ... Мех.
- Холодные старты все еще были проблемой.
- И загрузка весов модели в контейнеры на каждом старте была болезненно медленной.
Я подумал: «Почему бы просто не держать вес в объеме?»
Оказывается: все еще медленно.
Оптимизация уровня докера
В конце концов, я обнаружил изменение игры:Встроение веса модели непосредственно в изображение DockerПолем Таким образом, былЗагрузка с нулевым весом во время холодного стартаПолем Просто загрузите контейнер и идите.
Это сократило время началасущественно-от 25-30 секунд до 5 секунд.
Графические графические процессоры (намного больше, чем я думал)
Я также играл с различными вариантами графического процессора.
Вы бы подумалиA100Было бы лучшим, верно? Оказывается, не обязательно для моделей изображений.
АNvidia L40sдал мне лучшую производительность для рабочей нагрузки PhoteFix по улучшению изображений:
- Более быстрый холод начинается
- Более быстрый вывод
- Более низкая стоимость за обработанное изображение (в некоторых настройках)
Именно тогда все, наконец, начало щелкать.
Конечный продукт
ФотофиксСейчас живет и работает. Пользователи могут загрузить изображение и получить расширенную версию всего за несколько секунд. Это лучше всего подходит для:
- Выполнение фотографий профиля
- Восстановление старых картинок
- Очистка скриншотов низкого разрешения
Это небольшой инструмент, но он работает. И я построил его с нуля - Backend, Frontend, AI Orchestration и развертывание.
Уроки извлечены
Вот что я подобрал по пути:
- API великолепны для начала, но ограниченыПолем В конечном итоге вы захотите больше контролировать задержку, производительность и поведение модели.
- Оптимизация холодного старта имеет большое значениеЕсли вы используете без сервера графические процессоры. Предварительно выпейте веса в изображение.
- Не все графические процессоры созданы равнымиПолем Проверьте различные типы для вашей конкретной рабочей нагрузки.
- Доставка - лучший учительПолем Я узнал больше построения этого, чем из любого курса ИИ или в блоге.
Что дальше
Я сейчас:
- Экспериментирование с моделями с учетом лица для более умного улучшения
- Добавление поддержки для обработки партии
- Изучение потокового + предварительного просмотра
- Возможно, выпустить меньшую версию с открытым исходным кодом для разработчиков
PhoteFix далеко от идеального, но этоМое первое настоящее приложение ИИ, и это живое. Я использую это сам. Другие тоже используют это. И это важно.
💡 Хотите проверить это?
👉https://photfix.com
📫 Получите обратную связь или хотите сотрудничать? Пинг меня.
Оригинал