Эти данные Google Maps, раскрытые специалистом по данным, невероятны

Эти данные Google Maps, раскрытые специалистом по данным, невероятны

12 января 2023 г.

Google Карты — это замечательный продукт, который приносит людям большую пользу. Сегодня я решил поделиться своим мнением о том, как кто-то может создать такой продукт с нуля.

Хотя верно то, что поиск включает в себя как разработку, так и науку о данных, многие компании могут недооценивать важность науки о данных в поиске. Поиск — это не только создание технической инфраструктуры для обработки и возврата результатов по заданному запросу, но и понимание и предвидение потребностей и предпочтений пользователей, а также использование данных для адаптации поискового опыта к конкретным пользователям.

Как специалист по данным, я считаю персонализацию поиска и ранжирование сложной и интересной задачей. Мы привлекаем внимание пользователей, изучая: поисковые запросы пользователей, прошлую историю поиска и данные о кликах.

Этот информационный бюллетень ответит на все ваши вопросы о:

* Какие данные требуются? * Необходимость ранжирования и релевантности на картах? * Почему появляется конкретный результат?

Отказ от ответственности: пожалуйста, напишите в Директ, прежде чем размещать эту стратегию на других платформах, так как она полностью оригинальна для меня и не была скопирована. Я не поддерживаю какой-либо бренд; приведенные примеры предназначены только для обучения. Используя эту концепцию, любой может создавать свои собственные карты с нуля.

Если кому-то нужна консультация, свяжитесь со мной по адресу ЗДЕСЬ

Почему такой результат и как?

Что мы ищем: я живу в Гуруграме и ищу «Эйфелеву башню, Париж»

Давайте начнем вводить «EI» на Картах и ​​проанализируем. По запросу мы получили перечисленные ниже первые 5 результатов.

Рис. 1. Анализ поиска

Почему результатов всего пять? Поиск зависит от ранжирования и релевантности. Цель алгоритма — получить желаемый пользователем результат с минимальной длиной запроса. С другой стороны, больше контекста для алгоритма предпочтительнее усилий по прокрутке длинного списка результатов, возвращаемых запросом «ei».

Fig1. Search Analysis

Причина этого результата: здесь активируются сигналы популярности и контекста. Карты Google распознают мое местоположение и отображают пять самых популярных мест, которые посещали или на которые нажимали люди, ранее набравшие «ei». Все результаты находятся недалеко от меня (см. рис. 1). Запрос «eif» ставит Эйфелеву башню на 3-е место из-за более высокого показателя популярности. (см. рис.2)

Fig.2 Popularity and Distance-Based Search

Как построить поиск на основе местоположения пользователя?

Что у нас есть?

* Мы знаем местоположение пользователя * Местоположение всех зарегистрированных объектов — магазинов, кафе, ресторанов, отелей и т. д.

Наивный подход

С помощью формулы гаверсинуса рассчитайте расстояние между широтой/долготой пользователя и другими местоположениями в пределах города или почтового индекса. (см. рис.3)

Fig.3 Haversine Formula

На уровне GMaps, где есть миллиарды объектов и миллионы пользователей, этот подход не масштабируется.

Разумный подход с DS Intelligence

Fig.4 Bangalore into sub-entity clusters

* Когда пользователь подключается к сети, просто проверьте его широту и долготу и ранжируйте объекты на основе популярности в кластере. Этот подход добавляет в результаты поиска элементы, основанные на расстоянии и популярности. *

ПС. Некоторые из вас могут спросить, можно ли это сделать в Elastic Search. Ознакомьтесь с геосортировкой

Fig.5 ES Geo-Sorting

Как сделать поиск более контекстным или персонализированным?

Чтобы сделать поиск более контекстным или персонализированным, вы можете рассмотреть возможность использования подходов на основе данных, которые учитывают конкретные потребности или предпочтения пользователя. Например, если г-н Вольф ищет рестораны и сделал несколько запросов, связанных с ресторанами, в течение короткого периода времени или за один и тот же сеанс, вы можете отдать приоритет показу ему результатов, персонализированных для его местоположения, а также учитывать его прошлую историю поиска. Это может включать в себя ранжирование ближайших к нему ресторанов выше в результатах поиска и предоставление ему вариантов, адаптированных к его вкусам или предпочтениям или его предыдущим посещениям разных мест.

Используя подходы на основе данных, вы можете предоставить г-ну Вольфу более релевантные и целевые результаты поиска, а не просто полагаться на популярные критерии или критерии, основанные на расстоянии.

Кто-то может спросить: Шаурья, вы говорили об аспекте популярности в поиске, но какие существуют другие способы определения местоположения как популярного?

  • Количество просмотров/кликов за последний месяц.
  • Количество людей, посетивших место за последний месяц.
  • Кросс-платформенный прокси: анализ транзакций Google Pay, магазин считается популярным, если объем транзакций высок.

Рекомендации по прошлым кэшированным поискам

Ни одна модель Data Science не может сравниться по простоте с хорошо представленными историческими данными (см. рис. 6) с алгоритмами кэширования: LFU (наименее часто используемые) или LFU с динамическим старением (см. ссылку ниже, чтобы получить подробную информацию о LFU с динамическим старением). объяснение).

Ознакомьтесь с моим блогом здесь: https://shauryauppal.medium.com/thinking-data-strategies-in-fintech-universe-building-payments-recommendation-system-for-google-95c746e3dd0e

Fig. 6 Cached Search

Обобщение нашего анализа

1. Мы обсудили, почему в списке результатов поиска отображается 5 результатов

2. Ранжирование результатов на основе рейтинга популярности и расстояния

3. Геосортировка в Elastic Search

4. Персонализация в поиске на основе исторической категории запросов

5. Как определить объект как популярное место?

6. Рекомендации на основе кеширования прошлых поисковых запросов и посещенных мест

<цитата>

Спасибо всем, кто подарил мне эту награду

Noonies Tech 2022

<цитата>

Подпишитесь, подпишитесь на меня или поддержите меня LinkedIn если вы нашли это полезным, прочитайте. Чтобы узнать больше обо мне, посетите: здесь

<цитата>

Я ищу интересную роль ведущего / старшего специалиста по данным. Если у вас есть что-то для меня, давайте свяжемся по адресу Shauryauppal00111@gmail.com< /p>


Повторная публикация из моего информационного бюллетеня: Здесь и Здесь


Оригинал