Исследование Тайваня считает, что ИИ может помочь аудиторам с выборкой больших данных

Исследование Тайваня считает, что ИИ может помочь аудиторам с выборкой больших данных

13 июня 2025 г.

Авторы:

(1) Гуан-и-Йи Шеу, Департамент инновационных приложений и управления/бухгалтерского учета и информационной системы, Чанг-Юнг Христианский университет, Тайнан, Тайвань и этот автор внесли одинаковый вклад в эту работу (xsheu@hotmail.com);

(2) Наи-ру-Лю, факультет бухгалтерского и информационной системы, Христианский университет Чанг-Юнг, Тайнан, Тайвань (110B17727@mailst.cjcu.edu.tw).

Примечание редактора: это часть 1 из 3 исследования, в котором изучается, как выборка с AI может помочь аудиторам обрабатывать большие наборы данных. Прочитайте остальное ниже.

  • Аннотация и 1. Введение
  • 2. Обзор литературы
      1. Наивный байесовский классификатор
  • 4. Результаты
      1. Дискуссия
      1. Выводы и ссылки

Абстрактный: Аудиторы Тайваня пострадали от обработки чрезмерных данных аудита, включая данные аудита. Это исследование продвигает методы выборки путем интеграции машинного обучения с выборкой. Эта интеграция машинного обучения помогает избежать смещения отбора проб, сохранять случайность и изменчивости, а также целевые образцы Ricker. Сначала мы классифицируем данные, используя наивный классификатор Байеса в некоторые классы. Затем используется пользовательский, основанный на пользователях или гибридный подход для проведения аудиторских доказательств. Индекс репрезентативности является основным показателем для измерения ее репрезентативности. Пользовательский подход выбирает данные, симметричные вокруг медианы класса в качестве аудиторских доказательств. Это может быть эквивалентно комбинации денежных и переменных выборки. Подход, основанный на элементах, представляет асимметричную выборку на основе апостериорных вероятностей получения рискованных образцов в качестве аудиторских доказательств. Это может быть идентична комбинации нестатистических и денежных выборков. Аудиторы могут гибридизировать эти подходы на основе пользователей и элементы, чтобы сбалансировать репрезентативность и рискованность при выборе аудиторских доказательств. Три эксперимента показывают, что выборка с использованием интеграции машинного обучения обладает преимуществами рисования беспристрастных образцов, обработки сложных моделей, корреляций и неструктурированных данных, а также повышения эффективности в выборке больших данных. Тем не менее, ограничениями являются вывод точности классификации алгоритмами машинного обучения и диапазоном предыдущих вероятностей.

1. Введение

Аудиторы Тайваня недавно пострадали от обработки чрезмерных данных, включая данные аудиторских доказательств. Это аудиторское доказательство относится к информации для поддержки выводов аудиторов или выводов об этих чрезмерных данных. Аудиторы желают помощи от новых технологий, таких как алгоритмы машинного обучения или роботы программного обеспечения, при завершении отбора проб. Перегрузка отбора проб, чрезмерных данных, заставляет Тайвань из малых и средних бухгалтерских фирм, которые нуждаются в большем количестве молодых аудиторов, чтобы помочь бухгалтерам. Они даже просят университетов Тайваня предоставить превосходным студентам бухгалтерского учета в качестве потенциальных сотрудников.

В этом исследовании разрабатывается наивный байесовский классификатор (например, [1]) в качестве инструмента отбора проб. Он используется, чтобы помочь аудиторам генерировать аудиторские доказательства из огромного объема данных. Например, предприятия используют системы планирования ресурсов предприятия или управления информацией для управления данными бухгалтерского учета. Они выводят колоссальное количество данных каждый день. По экономическим причинам аудит всех данных практически невозможно. Аудиторы полагаются на методы отбора проб для создания аудиторских доказательств. Это обозначает, что аудиторы проверяют менее 100 % данных; Тем не менее, риск выборки будет происходить соответственно. Это подразумевает вероятность того, что выводы аудиторов, основанные на выборках, могут отличаться от вывода, сделанного по всем данным.

В предыдущем исследовании [2] было предложено применять алгоритм классификации для снижения риска отбора проб при выборе аудиторских доказательств. Это опубликованное исследование построило нейронную сеть для классификации данных по некоторым классам и генерировать аудиторские доказательства из каждого класса. Если результаты классификации являются точными, соответствующие аудиторские доказательства являются репрезентативными.

Тем не менее, у нас могут быть интеллектуальные требования при выявлении аудиторских доказательств. Например, финансовые счета, принимающие частые транзакции, рискованны в проблеме отмывания денег. Преступники могут иметь эти финансовые счета для получения черных денег. Аудитор будет благодарен за выборку таких рискованных финансовых счетов, как аудиторские доказательства. Мы выбираем наивного байеса классификатора, чтобы выполнить эти разумные требования создания аудиторских доказательств, поскольку он обеспечивает отношения между участниками в классе. Другие альтернативные алгоритмы классификации не могут обеспечить аналогичные отношения.

Многие опубликованные исследования (например, [3-5]) пытались интегрировать машинное обучение с выборкой; Тем не менее, исследовательский интерес большинства не был аудитом. Их цель состояла в том, чтобы разработать уникальные методы отбора проб для повышения производительности алгоритмов машинного обучения в решении конкретных проблем (например, [3]). Некоторые исследования (например, [4]) предложили выборку с машинным обучением в аудитоне; Более того, только некоторые исследователи (например, [5]) действительно внедрили выборку на основе машинного обучения в аудит.

Это исследование начинает получать аудиторские доказательства, добавляя некоторые столбцы к данным для хранения результатов классификации наивного классификатора Байеса. Следующее классифицирует данные в некоторых классах. Ссылаясь на существующие методы отбора проб, мы затем реализуем пользовательский, основанный на пользователях или гибридный подход для привлечения аудиторских доказательств. Индекс репрезентативности [6] является основным показателем для измерения, является ли аудиторские доказательства репрезентативными. Пользовательский подход привлекает образцы, симметричные вокруг медианы класса. Это может быть эквивалентно комбинации методов монетарной и переменной выборки [7]. Подход на основе элементов обозначает асимметричную выборку на основе апостериорных вероятностей для выявления более рискованных образцов. Это может быть эквивалентно комбинированию не статистических и денежных методов выборки [7]. Аудиторы могут гибридизировать эти подходы на основе пользователей и элементов, чтобы сбалансировать репрезентативность и рискованность при выборе аудиторских доказательств.

Остальная часть этого исследования имеет пять разделов. В разделе 2 представлен обзор соответствующих исследований в этом исследовании. В разделе 3 показана интеграция наивного байеса -классификатора с выборкой. В разделе 4 представлены три эксперименты для тестирования полученных работ в разделе 3. Раздел 5 обсуждает результаты эксперимента. Основываясь на двух предыдущих разделах, в разделе 6 перечислены выводы этого исследования и заключительные замечания.

Эта статья естьДоступно на ArxivПод атрибуцией-некоммерческими показателями 4.0 Международная лицензия.


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE