4 плюса и минусы 2024 года: издание Vector Database
31 января 2024 г.Если ваши рекомендации останутся такими же и в 2024 году, вы делаете это неправильно (с уважением).
Вот краткий обзор того, что будет и что будет в мире векторных баз данных в 2024 году.
1. Один тип рекомендаций отсутствует; сбалансированный набор
❌ Выход: предлагать только 1 тип поиска типа Топ-К. Не поймите меня неправильно, top-K является основой векторного поиска, но иногда он дает рекомендации слишком похожих элементов, что влияет на качество рекомендаций. Тот факт, что кто-то слушает Адель в грустные дни, не означает, что они хотят слушать ее постоянно.
✅ В: Включение поиск по диапазону обеспечивает более ✨сбалансированный✨ набор результатов, позволяя вам определить диапазон расстояний для сходства векторов. Сбалансированные рекомендации помогают избежать слишком похожих или слишком разных вещей.
2. Дополнительные шаги по нормализации векторов отсутствуют, использование косинусного сходства доступно
❌ Выход: сделать дополнительный шаг 👎для нормализации вектора для измерения сходство (определение предложений или фраз, передающих друг другу схожие значения) или родство в различных областях.
✅ В: Косинусное подобие позволяет легко нормализовать вектор за один шаг 👍
3. Обновление данных в несколько этапов исключено; Использование Upsert для беспрепятственного выполнения задач уже доступно
❌ Недостаток: неэффективное обновление данных в базе данных в рамках разочаровывающего 😡двухэтапного процесса: удалить, затем вставить. Это не может обеспечить атомарность данных и удобство работы.
✅ В: Upsert упрощает процесс обновления: если данных в системе нет, они вставляются; если он существует, он обновляет его. 😀
4. Триада поставщиков облачных услуг (AWS, GCP и Azure) присутствует
❌ Выход: векторные базы данных недоступны в триаде поставщиков облачных услуг: AWS, GCP и Azure.
✅ В: Базы данных Vector, доступные у 3 основных облачных провайдеров 🌟 (включая GCP Marketplace) и 8 регионов Северной Америки, Европы и Азии 👀 АКА Zilliz Cloud.
Мир, в котором векторная база данных доступна на всех трех облачных платформах, больше не является воображением. Это верно и для Zilliz Cloud.
Если вы хотите попробовать поиск по диапазону, повышение и косинусное сходство (на любой из трех облачных платформ), начните здесь.
1 февраля также состоится вебинар, посвященный этим и другим функциям. Зарегистрируйтесь здесь.
Также в Discord будут проводиться вопросы и ответы в прямом эфире. Присоединяйтесь к нам здесь.
н
Оригинал