Как очистить и проверить адресные данные «без использования кода»
18 марта 2022 г.Сегодня данные стали одним из величайших активов организации.
Независимо от того, хотите ли вы спланировать путь клиента или спрогнозировать будущее бизнеса, данные — это основной ингредиент, который поможет достичь успешных результатов.
Вот почему владельцы бизнеса вкладывают средства в разработку пользовательских решений для поддержания чистоты своих данных, особенно в базе данных клиентов или контактов.
Но поскольку несколько сотрудников компании работают с набором данных контактов, манипулируют им и используют его, он вскоре наполняется несоответствиями и неточностями. Затем ожидается, что ИТ-персонал компании создаст собственное решение, которое волшебным образом избавит вас от всех ошибок, присутствующих в базе данных.
Программирование каждого решения с нуля
Хотя можно написать код для очистки и стандартизации наборов данных, это определенно неэффективное решение — учитывая количество ресурсов (времени, людей и денег), необходимых для его реализации.
С учетом стоимости ежегодного обслуживания и модернизации это в 2-3 раза дороже, чем внедрение существующих решений.
Это напоминает мне о том, что один из моих друзей-кодеров недавно сказал мне: в какой-то момент жизни каждый разработчик понимает, насколько непродуктивно кодировать каждое решение вручную. Иногда более эффективно адаптировать существующие решения, доступные на рынке — библиотеки с открытым исходным кодом или коммерческие продукты, — чем создавать решения с нуля.
В этом блоге я объясню некоторые общие термины и шаги, связанные с очисткой и проверкой адресов, присутствующих в базе данных клиента. Это определенно поможет вам понять, на что обращать внимание при выборе существующего решения, доступного на рынке. Давайте начнем.
Общая терминология
Прежде чем мы углубимся в детали процесса, в этой области используются некоторые общие термины, давайте сначала рассмотрим их и посмотрим, что они означают.
Стандартизация адресов
Стандартизация адресов (также известная как нормализация адресов) означает обновление формата адреса в соответствии с авторитетным стандартом (например, стандартом адресации USPS в США).
Этот процесс гарантирует, что адреса представлены в приемлемом формате — включая правильное написание, аббревиатуры, геокоды, а также дополнены значениями ZIP+4.
Подтверждение адреса
Подтверждение адреса (также известное как проверка адреса) — это процесс сопоставления стандартизированных адресов с авторитетной базой данных (например, USPS в США) и проверка того, что эти адреса реальны, т. внутри страны для доставки почтой.
Разница между ними
Иногда оба эти термина используются взаимозаменяемо, но между ними есть разница.
Адреса должны быть сначала стандартизированы, чтобы соответствовать приемлемому формату. После стандартизации они теперь готовы к проверке, чтобы проверить, являются ли эти адреса реальными и действительными.
Процесс стандартизации и проверки адресов
В этом процессе участвуют следующие этапы:
- Адреса профилирования
Перед выполнением каких-либо действий с базой данных адресов важно оценить ее текущее состояние.
Вот где профилирование адресов может быть очень полезным. Он идентифицирует записи, которые содержат неполную или отсутствующую адресную информацию, а также те, которые не соответствуют стандартному шаблону.
Профилирование адресов выявляет потенциальные возможности очистки и стандартизации, присутствующие в вашем наборе данных. Кроме того, этот отчет о профиле обычно создается снова в конце процесса, чтобы сравнить начальный и конечный отчеты, чтобы увидеть, есть ли еще ошибки в наборе данных.
- Анализ адресов
Стандартизация адресов USPS начинается с разбора каждого адреса на его подкомпоненты. Это важно, поскольку адреса в основном хранятся в виде одного поля в наборе данных. И выполнение проверок для всего поля не так точно, как для его частей. По этой причине один адрес обычно разбивается на номер улицы, название улицы, почтовый индекс, почтовый индекс, направления, город, штат и округ.
- Геокодирование
На этом этапе широтный и долготный геокоды вычисляются для всех адресов. Кроме того, в зависимости от вычисленных геокодов, вы также можете узнать 5-значные почтовые индексы и 4-значные маршруты доставки.
- Реконструкция адресов
Как только вся эта информация вычислена и стандартизирована, уже не время переформатировать и реконструировать адреса в требуемом формате. Это можно сделать, а затем сохранить в базе данных или, при необходимости, вычислить в режиме реального времени, когда и как это необходимо.
Примером такого форматирования является стандарт адресации USPS, который требует, чтобы адрес доставки занимал три строки: первая содержит имя получателя, вторая содержит почтовый адрес, а третья содержит город, штат и почтовый индекс.
- Подтверждение адресов
Когда адрес имеет все необходимые компоненты, теперь вы можете проверить его достоверность в любой авторитетной базе данных, чтобы узнать, является ли адрес фактическим местоположением, доступным для отправки по почте.
Помимо верификации, такие базы данных также могут сообщить тип адреса — жилой или служебный — и некоторые другие второстепенные детали.
Заключение
И вот он, 5-этапный процесс без кода для очистки и проверки ваших адресных данных. Реализация такого решения с нуля может быть очень сложной задачей, и на повышение точности результатов могут уйти годы.
Сегодня в отрасли существует множество инструментов проверки адресов, в том числе некоторые из них сертифицированы CASS — название сертификата, которое USPS присваивает поставщикам программного обеспечения, предлагающим услуги по точной стандартизации и проверке адресов.
Такие инструменты определенно могут повысить эффективность работы вашей команды и дать им возможность создавать исключительные условия для клиентов, используя правильную и точную информацию о местоположении.
Также опубликовано здесь
Оригинал