Тема пришла из обсуждения на Reddit: пользователи r/technology спорили о том, как разработчик смог заменить базу данных SQLite размером 3 ГБ на FST (finite state transducer) размером 10 МБ. Пост набрал 4 тысячи голосов за день — значит, задело.

Как это вообще случилось

Разработчик смог уменьшить размер базы данных в 300 раз благодаря использованию FST. Это был словарь для финского языка.

«FSTs are wildly underused for read-heavy lookup workloads. The size reduction is impressive but the real win is query speed when your access pattern is just "does this key exist and what's its value."» — jeebus87

Почему это важно

Это показывает, что существуют эффективные методы сжатия данных, которые можно применять в различных приложениях.

Анализ рынка: что уже существует

В России

  • Нет аналогов замены баз данных на FST.

За рубежом

  • BurntSushi's fst Rust crate — используется для создания FST.

Незакрытая ниша: нет русскоязычного сервиса для сжатия баз данных.

💡 Идеи для предпринимательства

Сайты

  • Сервис сравнения эффективности сжатия баз данных — можно сравнить разные методы сжатия.

Мобильные приложения

  • Телеграм-бот для сжатия баз данных — присылает уведомление когда база данных сжата.

Бизнес-идеи

  • Консультации по сжатию баз данных — платная услуга.

Читайте также