Как я построил свое первое приложение для ИИ: история, стоящая за фотофиксом

Как я построил свое первое приложение для ИИ: история, стоящая за фотофиксом

25 июля 2025 г.

Как и многие разработчики, мне какое -то время было любопытно. Я играл с CHATGPT, проверил несколько фото инструментов ИИ и читал слишком много тем о «создании следующего стартапа ИИ в выходные».

Но я хотел выйти за рамки игры. Я хотелСоздайте что -нибудь реальное, с реальными пользователями. Вот какФотофиксродился, мое первое приложение с AI, которое занимает низкокачественное или размытое изображения и превращает их в нечто более четкое, более острее и готовое к высококлассным.

СПОЙЛЕР: Это была не плавная поездка.


Идея

Я хотел что -то мертвые для пользователя:

  1. Загрузите изображение (может быть размытым, низким разрешением, шумным)
  2. Пусть AI улучшит и высококлассену (2K или 4K)
  3. Загрузите результат

Конечно, такие инструменты уже существуют. Но я не строил его, чтобы конкурировать. Я хотелпонять процессТестируйте различные модели, экспериментируйте с хостингом и узнайте, что нужно, чтобы отправить реальный продукт искусственного интеллекта.


Стек

Я построил как бэкэнд, так и фронт сNuxt.jsПолем Это помогло мне двигаться быстро, остаться в одном репо и избежать переполнения архитектуры.

Некоторые из технических вариантов:

  • Фронт/бэкэнд: Nuxt.js
  • Хостинг: Docker Containers наDokloy
  • Хранилище: CloudFlare R2
  • CDN: Cloudflare
  • ГПУ вывод: В конце концов, я приземлился наModal.com
  • Модели пробовали: Репликационные модели → Реал-эсрган → другие модели с открытым исходным кодом → Пользовательские веса LLM

Ранние попытки: боли в API

Сначала я использовал Replicate, чтобы справиться с тяжелой работой. Это был самый быстрый способ прототипа, просто отправьте изображение, верните улучшенную версию.

НоЗадержка убивала UXПолем Холодные запуска, модельные вращения и медленный вывод означал, что пользователи ждали 30+ секунд. Это было не надежно, и я не контролировал базовое поведение модели.

Так что я нырнул глубже.


Собираясь с открытым исходным кодом (и немного провалится)

Я начал экспериментировать сМодели с открытым исходным кодомнравитьсяРеал-эсрган, самостоятельно их с помощью контейнеров GPU наModal.comПолем

Первая версия сработала, но:

  • Результаты были ... Мех.
  • Холодные старты все еще были проблемой.
  • И загрузка весов модели в контейнеры на каждом старте была болезненно медленной.

Я подумал: «Почему бы просто не держать вес в объеме?»
Оказывается: все еще медленно.


Оптимизация уровня докера

В конце концов, я обнаружил изменение игры:Встроение веса модели непосредственно в изображение DockerПолем Таким образом, былЗагрузка с нулевым весом во время холодного стартаПолем Просто загрузите контейнер и идите.

Это сократило время началасущественно-от 25-30 секунд до 5 секунд.


Графические графические процессоры (намного больше, чем я думал)

Я также играл с различными вариантами графического процессора.

Вы бы подумалиA100Было бы лучшим, верно? Оказывается, не обязательно для моделей изображений.
АNvidia L40sдал мне лучшую производительность для рабочей нагрузки PhoteFix по улучшению изображений:

  • Более быстрый холод начинается
  • Более быстрый вывод
  • Более низкая стоимость за обработанное изображение (в некоторых настройках)

Именно тогда все, наконец, начало щелкать.


Конечный продукт

ФотофиксСейчас живет и работает. Пользователи могут загрузить изображение и получить расширенную версию всего за несколько секунд. Это лучше всего подходит для:

  • Выполнение фотографий профиля
  • Восстановление старых картинок
  • Очистка скриншотов низкого разрешения

Это небольшой инструмент, но он работает. И я построил его с нуля - Backend, Frontend, AI Orchestration и развертывание.


Уроки извлечены

Вот что я подобрал по пути:

  • API великолепны для начала, но ограниченыПолем В конечном итоге вы захотите больше контролировать задержку, производительность и поведение модели.
  • Оптимизация холодного старта имеет большое значениеЕсли вы используете без сервера графические процессоры. Предварительно выпейте веса в изображение.
  • Не все графические процессоры созданы равнымиПолем Проверьте различные типы для вашей конкретной рабочей нагрузки.
  • Доставка - лучший учительПолем Я узнал больше построения этого, чем из любого курса ИИ или в блоге.

Что дальше

Я сейчас:

  • Экспериментирование с моделями с учетом лица для более умного улучшения
  • Добавление поддержки для обработки партии
  • Изучение потокового + предварительного просмотра
  • Возможно, выпустить меньшую версию с открытым исходным кодом для разработчиков

PhoteFix далеко от идеального, но этоМое первое настоящее приложение ИИ, и это живое. Я использую это сам. Другие тоже используют это. И это важно.


💡 Хотите проверить это?
👉https://photfix.com

📫 Получите обратную связь или хотите сотрудничать? Пинг меня.


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE