Тема пришла из обсуждения на Reddit: пользователи r/technology спорили о том, как разработчик смог заменить базу данных SQLite размером 3 ГБ на FST (finite state transducer) размером 10 МБ. Пост набрал 4 тысячи голосов за день — значит, задело.
Как это вообще случилось
Разработчик смог уменьшить размер базы данных в 300 раз благодаря использованию FST. Это был словарь для финского языка.
«FSTs are wildly underused for read-heavy lookup workloads. The size reduction is impressive but the real win is query speed when your access pattern is just "does this key exist and what's its value."» — jeebus87
Почему это важно
Это показывает, что существуют эффективные методы сжатия данных, которые можно применять в различных приложениях.
Анализ рынка: что уже существует
В России
- Нет аналогов замены баз данных на FST.
За рубежом
- BurntSushi's fst Rust crate — используется для создания FST.
Незакрытая ниша: нет русскоязычного сервиса для сжатия баз данных.
💡 Идеи для предпринимательства
Сайты
- Сервис сравнения эффективности сжатия баз данных — можно сравнить разные методы сжатия.
Мобильные приложения
- Телеграм-бот для сжатия баз данных — присылает уведомление когда база данных сжата.
Бизнес-идеи
- Консультации по сжатию баз данных — платная услуга.