Ошибка базовой ставки: почему ваша самая умная модель все еще ошибается

Ошибка базовой ставки: почему ваша самая умная модель все еще ошибается

30 июня 2025 г.

«Проблема не в данных. Это то, как мы игнорируем скучные части этого».

Являются ли модели искусственного интеллекта столь же точными, как говорит проверка проверки? Почему модель с точностью прогнозирования 99% затопила ваш почтовый ящик ложными сигналами тревоги и превращает ваш прекрасный день в кошмар отладки?

Смущенный?
Добро пожаловать вБазовая ставка ошибки- предвзятость, которая приводит к тому, что как людей, так и машины не связаны с вероятностью, когда мы упускаем из виду контекст, в котором существуют данные.


Что такое базовая ставка?

Давайте быстро рассмотрим, что на самом деле является ошибкой базовой ставки.

Абазовая ставкаявляется общей вероятностью события -доУчитывая новые доказательства. Абазовая ставка ошибкипроисходит, когда эти основные вероятности игнорируются, и мы сосредоточены только на новых доказательствах.


Пусть математика говорит

Представьте себе ситуацию, когда заболевание поражает1 из 1000люди. Вы, будучи гением, разрабатываете тест, который99% Точно:

  • Если кто -тоимеетЗаболевание, тест положительный в 99% случаев (настоящий положительный)
  • Если кто -тонеесть заболевание, тест отрицательный 99% случаев (настоящий негатив)

Теперь предположим, что кто -то проверяетположительныйПолем Какой шанс у них на самом деле болезнь?

Вопреки интуиции, этоне 99%Полем Вот почему:

Из 1000 человек:

  • 1 человекНа самом деле есть заболевание → Тест, вероятно, ловит его →1 настоящий положительный
  • 999 человекНет заболевания → 1% из них проверяют положительный →~ 10 ложных срабатываний

Итак, среди тех, кто проверяет положительный результат:

  • Общее количество положительных средств = 1 (true) + 10 (false) = 11
  • Вероятность факта иметь заболевание = 1/11 ≈ 9%

👉 Несмотря на тест, который «точен 99%», ваш шанс быть больным.9%, потому что болезнь такая редкая.

Что1-в-1000являетсябазовая ставка- И игнорировать это приводит к массовому неправильному толкованию.


Почему люди влюбляются в это

Твист? Это не просто математическая проблема - этоПроблема с мозгомПолем

ПсихологиДаниэль КанеманиАмос Тверскиобнаружил, что когда мы оцениваем вероятность, мы подсознательно заменяем жесткие вопросы на более простые. Вместо того, чтобы рассчитать, мы спрашиваем:

«Насколько хорошо эта ситуация соответствует моему ментальному стереотипу?»

Таким образом, когда тест точен 99%, наш мозг говорит:
«Звучит как матч!»
... и мы предполагаем, что результат должен быть правдой.

Этот ярлык называетсяРепрезентативность эвристика, и это заставляет нас игнорировать скучную, статистическую базовую скорость.


Инженер -лауэр CONUNDRUM

Этот эффект был классно продемонстрирован черезИнженер -лавейер ПроблемаПолем

Участникам сказали:

  • Есть70 адвокатови30 инженеровв комнате.
  • Джек естьинтровертированоВнаслаждается математическими головоломками, илюбит электроникуПолем

Затем спросил: «Какова вероятность того, что Джек является инженером?»

Хотя базовая ставка предполагает30% шанс, большинство людей сказали80–90%-звукикак инженер. Описание кажется репрезентативным, поэтому соотношение 70/30 игнорируется, хотя это более мощный предиктор.


Как это терпит неудачу в реальном мире

** Прогнозы AI \ Вы создаете модель, которая помечает дефектные продукты с точностью 95%. Но если только0,1%Из предметов на самом деле дефектные, большинство оповещений будут ложными положительными. Операции могут перейти в режим паники - ничего.

** Планирование цепочки поставок \ Риски поставщика системы поставщика. Но если только1 из 500Поставки фактически откладываются, большинство предупреждений будут ложными, даже если система технически «точная».

And it happens across a wide range of domains: fraud detection, medical testing, threat alerts, anomaly monitoring—the list goes on.


Решение: Байеса на помощь

Математически,Теорема БайесаПомогает противостоять базовой ставке. Это обновляет наши убеждения, объединяя базовые ставки с новыми доказательствами:

P (a∣b) = p (b) p (b∣a) / p (a)

Где:

  • P (a ∣ b): Вероятность возникновения заболевания, получившего положительный тест
  • P (B ∣ A): Вероятность положительного тестирования, если у вас есть заболевание
  • P (а): Базовая скорость (предварительная вероятность)
  • P (B): Общая вероятность положительного тестирования (True + ложные срабатывания)

Теорема Байеса заставляет нас сбалансироватьЧто мы знаемсчто мы видим- Чем -то человеческая интуиция имеет тенденцию пропустить.


Последние мысли

Мы живем в мире, движимом прогнозами - от ИИ до здравоохранения до логистики. Но цифры, независимо от того, насколько сложны, ничего не значат без правильногоконтекстПолем

И иногда самое мощное понимание заключается в скучной, сдержанной вероятности, которую мы слишком быстро игнорировали.


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE