ИИ может проверить ваш идентификатор за считанные секунды - вот как это работает

ИИ может проверить ваш идентификатор за считанные секунды - вот как это работает

25 июля 2025 г.

Хотя искусственный интеллект появился в мире относительно недавно, большинство людей и компаний по -прежнему используют его главным образом в виде вопросов и ответов в CHATGPT. Для многих это то, что связано с концепцией «Использования ИИ». Это также подтверждается данными McKinsey, согласно которому более 75% предприятий уже экспериментируют с ИИ, но почти 60% ограничиваются использованием генеративных моделей для основных задач - написания текстов, анализа данных или работы с кодом.

Поэтому CHATGPT является лишь одним из многочисленных услуг искусственного интеллекта, созданного для ответа на вопросы, редактировать тексты и генерировать изображения. И одного этого достаточно, чтобы произвести впечатление на любого обычного пользователя.

Многие ведущие компании в мире начали создавать свои собственные модели и продукты ИИ для практического применения. Это дало предприятиям возможность интегрировать искусственный интеллект в свои процессы и повысить эффективность эксплуатации. Например, согласно PWC, компании, которые интегрировали ИИ в ключевые процессы, сокращают эксплуатационные расходы на 20–40% и повышают производительность на 30%.

Запросы компании могут варьироваться. Некоторым нужен чат -бот ИИ, который отвечает клиентам 24/7, охватывает до 80% типичных запросов и передает разговор оператору только тогда, когда вопрос слишком специфичен. Согласно статистике IBM, предприятия, которые внедрили чат -боты искусственного интеллекта, сократили рабочую нагрузку на операторов до 70% и сократили время ожидания клиентов на 90%. Для предприятий это означает значительное ускорение обслуживания и возможность оптимизировать затраты на поддержку.

Есть финансовые компании, которые должны периодически проводить проверку пользователей. Это должно быть отмечено сразу же: полноценный модуль проверки является сложным технологическим решением, но предприятия могут реализовать его отдельные части. Например, проверка документов может быть интегрирована не только в финансовые услуги, но и в работу регистраторов доменных имен или поставщиков коммунальных услуг. Рынок решений KYC (знает вашего клиента) в 2024 году достиг 12,4 млрд долларов и, согласно прогнозам, будет расти на 22% в год. Основными водителями являются нормативные требования, борьба с отмыванием денег и предотвращение мошенничества.

Теперь, если действие требует проверки документа, необходимо не только загрузить файл, но и извлечь из него информацию и сохранить данные в профиле клиента и базу данных компании. Ранее это требовало, чтобы попросить пользователя вручную ввести все данные и дополнительно загрузить документ. Теперь этот процесс может быть автоматизирован: система извлекает необходимую информацию самостоятельно без дополнительных запросов клиенту. По данным Deloitte, OCR Technologies и аналитика искусственного интеллекта сокращают время для проверки документов с 5–10 минут до нескольких секунд и уменьшают количество ошибок на 80%. Этот подход особенно актуален для финансовых учреждений и услуг, где скорость и точность обработки данных имеют решающее значение.

Скриншот из официальной службы AI Document Document Document:
https://cloud.google.com/document-ai

Затем мы рассмотрим, как реализовать подобное решение с использованием Google Cloud, используя AI Vertex AI и службы AI Document. Это универсальный подход, который может быть адаптирован для компаний в различных секторах.

Давайте разберем его шаг за шагом, используя пример Google Cloud: Vertex AI и документ AI.

Ниже приведен глоссарий, чтобы лучше понять цель каждой услуги:

Документ AI API- Используется для автоматического чтения и распознавания данных из документов (идентификаторы, паспорта, счета). Это позволяет получать структурированные данные в формате JSON без ручного ввода. Основной целью является автоматизация KYC/KYB, обработка счетов и проверка документов.

Vertex AI API- Разработано для создания, обучения и развертывания моделей искусственного интеллекта. Это позволяет использовать ML для анализа, оценки, обнаружения аномалий и прогнозирования. Основной целью является реализация пользовательской логики ИИ: от борьбы с мошенничеством до персонализированных рекомендаций.

Интеграция документа AI и AI Vertex в вашем проекте: шаг за шагом

1) Создать облачный проект Google

Если проект еще не был создан, добавьте его в Google Cloud, настройте биллинг и создайте учетную запись услуг с правами доступа к необходимым услугам.

Связь:Cloud.google.com/document-ai

Включить две основные услуги:

  • Документ AI API
  • Vertex AI API

Затем вам необходимо настроить документ AI, чтобы система правильно считывала документы.

  1. Создайте процессор процессора документа идентификатора типа (подходит для обработки паспортов и водительских лицензий)
  2. Выберите регион, в которой вы работаете (США или ЕС).
  3. После создания вы получите идентификатор процессора. Скопируйте его - потребуется для выполнения запросов через API.

Далее, ваш сайт может иметь свой собственный интерфейс, где пользователи будут загружать документы. Форматы могут быть:JPEG, PNG, PDF.

Рабочий механизм выглядит так:

  1. Бэкэнд вашего сайта получает файл от пользователя.
  2. Затем он отправляет этот файл в документ AI API.
  3. В органе запроса файл передается в формате Base64.

Пример запроса:

POST https://documentai.googleapis.com/v1/projects/{project_id}/locations/{location}/processors/{processor_id}:process 

Документ ИИ обрабатывает эти данные и возвращает их в формате JSON:

  1. Текст OCR (распознанный текст из документа)
  2. Структурированные данные: имя, фамилия, дата рождения, номер документа, дата истечения срока действия.

Пример ответа JSON от документа AI

+ Entities:
! First Name: John (confidence 0.99)
! Last Name: Doe (confidence 0.98)
! Date of Birth: 1990-01-01 (confidence 0.97)
! Document Number: X1234567 (confidence 0.96)
! Expiry Date: 2030-12-31 (confidence 0.95)

Что мы получили в JSON?

First Name: John
Last Name: Doe
Date of Birth: 1990-01-01
Document No: X1234567
Expiry: 2030-12-31

С полученными данными вы уже можете работать и добавить их в базу данных. Например, вы можете сохранить его в профиле клиента, чтобы вам больше не нужно было просить их ввести эту информацию. Но вам не нужно останавливаться на этом.

Скриншот из официальной службы AI Document Document Document:
https://cloud.google.com/document-ai

Мы можем дополнительно обработать эти данные и выполнить проверку. На практике есть случаи, когда ИИ не распознает определенные элементы. Например, ответ от документа AI может не включать фамилию, даже если она присутствует в документе. Это происходит - иногда модели ИИ пропускают определенные поля.

Чтобы избежать ситуации, когда кажется, что все завершено, но на самом деле данные отсутствуют, необходимо проверить, заполняются ли все ключевые поля. После получения организаций из документа AI (имя, фамилия, дата рождения, номер документа, дата истечения срока действия) убедитесь, что ни одно из них не пусто. Если система обнаруживает отсутствующие значения, вы можете инициировать отмену документа и заполнить пропущенные поля.

- required_fields = ["first_name", "last_name", "date_of_birth", "document_number"] 
+ for field in required_fields:  
! if field not in extracted_data or not extracted_data[field]:
# raise ValueError(f"Missing required field: {field}")

Или для вашего сервиса важно, чтобы пользователю было не менее 18 лет. В противном случае вы не можете предоставить доступ к Сервису.

Например, вы можете проверить дату рождения (в формате yyyy-mm-dd) и убедиться, что возраст составляет> 18 лет (или другой установленный порог).

- from datetime import datetime
+ dob = datetime.strptime(extracted_data["date_of_birth"], "%Y-%m-%d")
! age = (datetime.now() - dob).days // 365
# if age < 18:
# raise ValueError("Client must be over 18.")

На этом этапе вы в основном проверяли статические данные, полученные с использованием ИИ.

2) Использование AI Vertex

Но вы можете пойти еще дальше и использовать модуль Vertex AI, так как до этого момента вы работаете только с AI Document AI для сканирования и распознавания документов.

Скриншот из официальной службы AI Vertex:
https://cloud.google.com/vertex-ai/generative-ai/docs/learn/overview

Например, следующим шагом является оценка клиента на основе параметров. У вас могут быть дополнительные данные, такие как IP -адреса или страны, из которых вы не можете регистрировать пользователей из -за внутренних политик или нормативных ограничений.

Отправка данных в AI Vertex AI для оценки:

- from google.cloud import aiplatform endpoint = aiplatform.
+ Endpoint(endpoint_name="projects/your-project/locations/us-central1/endpoints/123456789") 
! response = endpoint.predict(instances=[{ 
! "document_number": "X1234567", 
! "age": 32, 
! "country": "UK", 
! "upload_time": 2.5 }])
# print(response)

На этом этапе Vertex AI уже имеет все данные, полученные из документа AI:

Данные из документа (Document Ai Вывод)

  1. Имя и фамилия (обнаружение аномалий, дублирующие учетные записи).
  2. Дата рождения (для возрастных ограничений и профиля риска).
  3. Номер документа (уникальность и шаблон).
  4. Дата истечения срока действия (проверка достоверности).
  5. Страна эмиссии (страны высокого риска).

But you also provide information that your system collects about the client. Below is a limited amount of information. It can be much more, or less, depending on the needs.

File metadata

  1. Загрузите время (подозрительное время, например, ночь).
  2. Формат файла (JPEG, PNG, PDF)
  3. Количество попыток загрузки (признак мошенничества).

Поведенческие данные пользователя

  1. Скорость заполнения формы (слишком быстро → подозрение бота)
  2. IP -адрес и геолокация (совпадать со страной документа)
  3. VPN или прокси (знак сокрытия).

Система конечных точек вершины AI, которая развертывается как модель ML/AI, анализирует данные и возвращает прогноз. Это не жесткая логика, а комбинация данных, алгоритма и статистической модели, которая дает результат на основе обучения.

Например, ответ может выглядеть так:

risk_score = 0.12.

Правила принятия решений:

If risk_score < 0.2 → approve.
If 0.2 ≤ risk_score < 0.5 → review.
If risk_score ≥ 0.5 → reject.

Затем, в зависимости от настроек вашего веб -сайта или приложения, вы отображаете результат для клиента, и структурированные данные записываются в базе данных компании (PostgreSQL, MySQL, Firestore или что -то еще).

Вы также можете:

  • Измените статус клиента в профиле.
  • Отправить уведомления о толчке или электронной почте.

Это пример того, как одна модель ИИ может использоваться для решения бизнес -задач и ускорения процессов как для компании, так и для ее клиентов.

Модели ИИ еще не охватывают все реальные сценарии, но новые решения появляются каждый месяц. Следите за обновлениями. То, что уже доступно, может быть эффективно использовано в работе. Все ограничено только вашими потребностями и творчеством.

Ниже приведены примеры моделей ИИ и способов их использования:

Openai (Chatgpt, GPT-4/4o)

  • CHATGPT API - Интеграция AI Chat в приложения (поддержка, автоматизация).
  • Помощники API - пользовательские помощники для деловых задач.
  • Интерпретатор кода - анализ сценариев данных и питонов (финансовая аналитика, панели мониторинга).

Google Cloud AI (Vertex AI)

  • Document AI - Подбор документов (KYC, контракты, заявления).
  • Automl - Строительные модели без кода (оценка, прогнозы).
  • AI HUB-готовые модели (обнаружение мошенничества, кредитная оценка).

AWS AI Services

  • Textract - OCR от PDFS (счета, финансовые документы).
  • Постижение - Анализ текста (обзоры, настроение).
  • SAGEMAKER - обучение пользовательских моделей (управление рисками, прогнозы).

Microsoft Azure AI (Copilot)

  • Интеллект документов - признание форм и отчетов.
  • Azure Open Service - GPT в облаке для предприятий.

Антроп (Клод)

  • Claude API - чат, генерация текста, анализ данных (юридические документы, соответствие).

Огненные блоки

  • AI Analytics - Мониторинг транзакций, AML, защита от мошенничества в крипто.

Docusign AI

  • Интеллектуальная идея - анализ контрактов и рисков.

Salesforce Einstein AI

  • Einstein GPT - прогнозирование продаж, CRM Automation.

Искусственный интеллект перестал быть просто тенденцией и стал реальным инструментом для бизнес -оптимизации. От автоматизации проверки клиентов до прогнозирования рисков и персонализации услуг - ИИ предлагает компаниям возможность сэкономить время, снизить затраты и повысить точность. Такие примеры, как Google Cloud, с его AI Vertex AI и службами AI Document, показывают, что реализация таких решений больше не является прерогативой технологических гигантов - он доступен для компаний любого размера и отрасли. Ключ должен начать с четкой стратегии и правильного набора инструментов.

Игорь Николаев, лидер технического продукта в Fintech и AI


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE