ai machine-learning docker image-processing llm nuxt photfix free-ai-image-upscaler ai-image-upscaler

Как я построил свое первое приложение для ИИ: история, стоящая за фотофиксом

25 июля 2025 г.

Как и многие разработчики, мне какое -то время было любопытно. Я играл с CHATGPT, проверил несколько фото инструментов ИИ и читал слишком много тем о «создании следующего стартапа ИИ в выходные».

Но я хотел выйти за рамки игры. Я хотелСоздайте что -нибудь реальное, с реальными пользователями. Вот какФотофиксродился, мое первое приложение с AI, которое занимает низкокачественное или размытое изображения и превращает их в нечто более четкое, более острее и готовое к высококлассным.

СПОЙЛЕР: Это была не плавная поездка.

Идея

Я хотел что -то мертвые для пользователя:

Загрузите изображение (может быть размытым, низким разрешением, шумным)
Пусть AI улучшит и высококлассену (2K или 4K)
Загрузите результат

Конечно, такие инструменты уже существуют. Но я не строил его, чтобы конкурировать. Я хотелпонять процессТестируйте различные модели, экспериментируйте с хостингом и узнайте, что нужно, чтобы отправить реальный продукт искусственного интеллекта.

Стек

Я построил как бэкэнд, так и фронт сNuxt.jsПолем Это помогло мне двигаться быстро, остаться в одном репо и избежать переполнения архитектуры.

Некоторые из технических вариантов:

Фронт/бэкэнд: Nuxt.js
Хостинг: Docker Containers наDokloy
Хранилище: CloudFlare R2
CDN: Cloudflare
ГПУ вывод: В конце концов, я приземлился наModal.com
Модели пробовали: Репликационные модели → Реал-эсрган → другие модели с открытым исходным кодом → Пользовательские веса LLM

Ранние попытки: боли в API

Сначала я использовал Replicate, чтобы справиться с тяжелой работой. Это был самый быстрый способ прототипа, просто отправьте изображение, верните улучшенную версию.

НоЗадержка убивала UXПолем Холодные запуска, модельные вращения и медленный вывод означал, что пользователи ждали 30+ секунд. Это было не надежно, и я не контролировал базовое поведение модели.

Так что я нырнул глубже.

Собираясь с открытым исходным кодом (и немного провалится)

Я начал экспериментировать сМодели с открытым исходным кодомнравитьсяРеал-эсрган, самостоятельно их с помощью контейнеров GPU наModal.comПолем

Первая версия сработала, но:

Результаты были ... Мех.
Холодные старты все еще были проблемой.
И загрузка весов модели в контейнеры на каждом старте была болезненно медленной.

Я подумал: «Почему бы просто не держать вес в объеме?»
Оказывается: все еще медленно.

Оптимизация уровня докера

В конце концов, я обнаружил изменение игры:Встроение веса модели непосредственно в изображение DockerПолем Таким образом, былЗагрузка с нулевым весом во время холодного стартаПолем Просто загрузите контейнер и идите.

Это сократило время началасущественно-от 25-30 секунд до 5 секунд.

Графические графические процессоры (намного больше, чем я думал)

Я также играл с различными вариантами графического процессора.

Вы бы подумалиA100Было бы лучшим, верно? Оказывается, не обязательно для моделей изображений.
АNvidia L40sдал мне лучшую производительность для рабочей нагрузки PhoteFix по улучшению изображений:

Более быстрый холод начинается
Более быстрый вывод
Более низкая стоимость за обработанное изображение (в некоторых настройках)

Именно тогда все, наконец, начало щелкать.

Конечный продукт

ФотофиксСейчас живет и работает. Пользователи могут загрузить изображение и получить расширенную версию всего за несколько секунд. Это лучше всего подходит для:

Выполнение фотографий профиля
Восстановление старых картинок
Очистка скриншотов низкого разрешения

Это небольшой инструмент, но он работает. И я построил его с нуля - Backend, Frontend, AI Orchestration и развертывание.

Уроки извлечены

Вот что я подобрал по пути:

API великолепны для начала, но ограниченыПолем В конечном итоге вы захотите больше контролировать задержку, производительность и поведение модели.
Оптимизация холодного старта имеет большое значениеЕсли вы используете без сервера графические процессоры. Предварительно выпейте веса в изображение.
Не все графические процессоры созданы равнымиПолем Проверьте различные типы для вашей конкретной рабочей нагрузки.
Доставка - лучший учительПолем Я узнал больше построения этого, чем из любого курса ИИ или в блоге.

Что дальше

Я сейчас:

Экспериментирование с моделями с учетом лица для более умного улучшения
Добавление поддержки для обработки партии
Изучение потокового + предварительного просмотра
Возможно, выпустить меньшую версию с открытым исходным кодом для разработчиков

PhoteFix далеко от идеального, но этоМое первое настоящее приложение ИИ, и это живое. Я использую это сам. Другие тоже используют это. И это важно.

💡 Хотите проверить это?
👉https://photfix.com

📫 Получите обратную связь или хотите сотрудничать? Пинг меня.

Оригинал

Как я построил свое первое приложение для ИИ: история, стоящая за фотофиксом

Идея

Стек

Ранние попытки: боли в API

Собираясь с открытым исходным кодом (и немного провалится)

Оптимизация уровня докера

Графические графические процессоры (намного больше, чем я думал)

Конечный продукт

Уроки извлечены

Что дальше

Recent Post

Когда ИИ становится посредником в семейных спорах о наследстве

Конец общей аннотации в здравоохранении: визуализация сердца показывает, почему

5 Рабочие процессы агента AI для повторяемого успеха (включен код)

Почему OCR борется со страницами с несколькими колоннами

Все, что я узнал (трудный путь) как начинающий основатель AI SaaS

Categories