Введение в Chat2Query: генератор SQL на основе искусственного интеллекта
23 марта 2023 г.Мы рады представить вам Chat2Query (бета-версия) , революционный генератор запросов на естественном языке на основе Pre-trained Transformer 3 (GPT-3), технологии, лежащей в основе ChatGPT и TiDB, распределенная база данных SQL.
С Chat2Query вам не нужно быть экспертом по SQL, чтобы извлекать ценную информацию из ваших данных. Просто задайте вопрос, и инструмент искусственного интеллекта сделает все остальное, сгенерировав мощный SQL-запрос для получения информации. Объединив OpenAI и TiDB, мы используем ИИ для обновления базы данных и помогает в изучении данных, предоставляя полезную информацию в режиме реального времени для мгновенных бизнес-решений.
В этом посте мы покажем вам, как начать работу с Chat2Query на основе искусственного интеллекта, и изучим ценную информацию с помощью примеров наборов данных и ваших собственных наборов данных.
Больше, чем просто еще один генератор SQL на основе ИИ
Да, существует несколько генераторов SQL на базе ИИ, которые могут помочь пользователям генерировать SQL-запросы, не обладая обширными знаниями языка SQL. Однако эти инструменты ИИ лучше всего подходят для создания простых запросов. Это означает, что они могут не подходить для более сложных задач или производственного использования.
Chat2Query использует:
- GPT3 от OpenAI, ведущая в отрасли модель преобразования естественного языка в код и технология, лежащая в основе вирусного ChatGPT.
- TiDB Cloud Serverless Tier — служба базы данных гибридной транзакционной и аналитической обработки (HTAP), которая позволяет разработчикам развертывать свою инфраструктуру в масштабе наиболее экономичным способом без управления серверной инфраструктурой.
Используя эти две технологии, Chat2Query может обрабатывать даже самые сложные запросы и предлагать анализ динамических наборов данных в режиме реального времени.
Изучение примеров использования
В следующих примерах мы используем Chat2Query для создания двух запросов к разным наборам данных:
Запрос к набору данных Netflix – назовите 10 лучших фильмов Netflix.
Запрос к набору данных Web3 — в каком месяце прошлого года был получен наибольший объем
Начало работы с Chat2Query
Chat2Query — это встроенная функция TiDB Cloud Serverless Tier. Для начала вы можете предпринять следующие шаги:
Шаг 1. Войдите в свой кластер Serverless Tier.
Зарегистрируйте учетную запись TiDB Cloud, используя свою электронную почту, учетную запись Google или учетную запись GitHub. Ваш кластер Serverless Tier будет создан автоматически менее чем за 20 секунд, и вы будете перенаправлены в интерфейс Chat2Query.
Шаг 2. Подготовьте наборы данных.
Вы можете использовать примеры наборов данных для быстрого изучения Chat2Query или исследовать свои собственные наборы данных.
==Использование примеров наборов данных==
По умолчанию вы будете запрашивать таблицу sample_data
с четырьмя предустановленными наборами данных — github_events
, global_fortune_500
, imdb_movie_ratings
и sold_car_orders
.
==Использование ваших наборов данных==
- Для начала подготовьте целевые наборы данных. Если у вас его нет, вы можете получить его на бесплатных веб-сайтах для хранения наборов данных, таких как Kaggle.
2. На вкладке Схемы нажмите ...
справа от целевой базы данных и нажмите Импорт данных, чтобы начать импорт набора данных либо в локальном формате CSV или из Amazon S3. В нашем случае мы используем eth-usdt
, набор данных о цене криптовалюты Ethereum/Tether в формате CSV.
3. Следуйте инструкциям, чтобы настроить источник и цель импорта и начать импорт. Время, необходимое для этого, зависит от размера данных. По завершении импорта отображается окно сведений об импорте.
Шаг 3. Изучите статистику с помощью Chat2Query.
- Создайте запрос. В редакторе Chat2Query введите «– ваш вопрос» и нажмите Ввод, чтобы искусственный интеллект сгенерировал запрос в SQL.
- Просмотрите запрос. Нажмите клавишу Tab, чтобы принять SQL-запрос, или отредактируйте его перед принятием.
- Выполните запрос. В правом верхнем углу экрана нажмите кнопку воспроизведения. Результаты запроса отображаются внизу страницы.
- Вы сразу же увидите журналы запросов и результаты в нижней части страницы. Пример вывода см. в разделе Изучение примеров использования .
Безопасность и конфиденциальность
Конфиденциальность и безопасность пользовательских данных — наш главный приоритет. Мы понимаем, что наши пользователи доверяют нам защиту своей информации, и мы серьезно относимся к этой ответственности. В качестве службы запросов в TiDB Cloud Chat2Query требуется доступ только к схеме вашей базы данных для генерации SQL, а не к вашим фактическим данным.
Ограничения
Являясь бета-версией, Chat2Query все еще находится в разработке, и его можно улучшить.
Поэтому следует помнить о двух ограничениях:
- SQL, сгенерированный ИИ, не всегда корректен на 100 % и может нуждаться в дополнительной настройке.
- Chat2Query имеет ограниченную поддержку операторов SQL. Операторы DDL, такие как
CREATE TABLE
иDROP TABLE
, пока не поддерживаются.
Начните работу с Chat2Query сегодня
You can obtain early access здесь. Мы хотели бы услышать ваши отзывы, чтобы мы могли сделать этот инструмент запросов еще лучше.
Тем временем Chat2Query находится в стадии быстрого развития. Подпишитесь на нас в Твиттере, чтобы быть в курсе его прогресса.
Есть вопрос или комментарий к статье? Посетите форум TiDB
Также опубликовано здесь
Оригинал