
Ваши очки могут разливать конфиденциальные секреты на видеозвонках
7 августа 2025 г.Авторы:
(1) Ян Лонг, Электротехника и компьютерные науки, Университет Мичигана, Энн Арбор, США (yanlong@umich.edu);
(2) Чэнь Ян, Колледж электротехники, Университет Чжэцзян, Ханчжоу, Китай (yanchen@zju.edu.cn);
(3) Шилин Сяо, Колледж электротехники, Университет Чжэцзян, Ханчжоу, Китай (xshilin@zju.edu.cn);
(4) Шиван Прасад, Электротехника и компьютерная наука, Мичиганский университет, Энн Арбор, США (shprasad@umich.edu);
(5) Вениюан Сюй, Колледж электротехники, Университет Чжэцзян, Ханчжоу, Китай (wyxu@zju.edu.cn);
(6) Кевин Фу, электротехника и компьютерные науки, Мичиганский университет, Энн Арбор, США (kenfu@umich.edu).
Таблица ссылок
Аннотация и I. Введение
II Модель и фон
Iii. Веб -камера заглядывает через очки
IV Познаваемость и факторы размышлений
V. Cyberspace Textula Target Lebrameibility
VI Признание веб -сайта
VII. Дискуссия
VIII. Связанная работа
IX. Заключение, подтверждение и ссылки
Приложение A: Информация о оборудовании
Приложение B: модель угла просмотра
Приложение C: Поведение платформы видеоконференций
Приложение D: Анализ искажений
Приложение E: Веб -текстовые цели
Абстрактный-Личное видеоконференция стала новой нормой после того, как Covid-19 вызвал сейсмический сдвиг от личных встреч и телефонных звонков к видеоконференциям для ежедневных коммуникаций и конфиденциального бизнеса. Видео утечки участников на экране, потому что очки и другие рефлексивные объекты невольно обнажают частичное содержимое экрана. Используя эксперименты по математическому моделированию и людям, в этом исследовании исследуется степень, в которой появляющиеся веб -камеры могут протекать узнаваемую текстовую и графическую информацию, блестящую из отражений очков, захваченных веб -камерами. Основной целью нашей работы является измерение, вычисление и прогнозирование факторов, ограничений и порогов узнаваемости по мере развития технологии веб -камеры в будущем. Наша работа исследует и характеризует жизнеспособные модели угроз, основанные на оптических атаках с использованием многократных методов супер-разрешения на последовательностях видео кадров. Наши модели и экспериментальные результаты в контролируемой лабораторной настройке показывают, что можно реконструировать и распознавать с более чем 75% точности на экране текстах, которые имеют высоту до 10 мм с веб-камерой 720p. Мы также применяем эту модель угроз к веб -текстовому содержимому с различными возможностями злоупотребления, чтобы найти пороговые значения, при которых текст становится узнаваемым. Наше пользовательское исследование с 20 участниками предполагает, что современные веб-камеры 720p достаточно, чтобы противники реконструировали текстовый контент на веб-сайтах с большим фондом. Наши модели также показывают, что эволюция в сторону 4K -камеры будет чаевые на пороге утечки текста для реконструкции большинства текстов заголовка на популярных веб -сайтах. Помимо текстовых целей, тематическое исследование по распознаванию набора данных в закрытом мире на 100 лучших веб-сайтов с 720p веб-камеры показывает максимальную точность распознавания 94% с 10 участниками даже без использования моделей машинного обучения. Наше исследование предлагает краткосрочные смягчения, включая программный прототип, который пользователи могут использовать для размытия областей очков своих видеопотоков. Для возможной долгосрочной защиты мы выступаем за индивидуальную процедуру тестирования отражения, чтобы оценить угрозы в различных условиях и оправдываем важность соблюдения принципа наименее привилегии для чувствительных к конфиденциальности сценариев.
I. Введение
Онлайн-видео-звонки стали повсеместными в качестве метода удаленного общения, особенно после того, как недавняя пандемия Covid19, которая вызвала практически универсальную политику работы от дома в основных странах [24], [27], [31] и сделала видеоконференцию для компаний и школ для приспособления к межличностному общению даже после пандемии [6], [15], [43], [51].
В то время как видеоконференция предоставляет людям удобство и погружение визуальных взаимодействий, он невольно раскрывает конфиденциальную текстовую информацию, которая может использоваться злонамеренной партией, действующей в качестве участника. Каждое видео
Экран участника может содержать личную информацию. Собственная веб -камера участника может запечатлеть эту информацию, когда она отражается на очках участника и невольно предоставлять информацию для противника (рис. 1). Мы называем эту атаку как атаку для мочщика веб -камеры. Кроме того, возможности противника будут продолжать расти с улучшением разрешения, частоты кадров и многого другого. Таким образом, важно понять последствия и ограничения атак веб-камеры в современных и возможных будущих условиях.
Предыдущая работа показывает, что аналогичные атаки, использующие оптическое отражение от близлежащих объектов в контролируемых настройках, могут быть возможными, такие как наблюдение за чайниками на столе с высокими цифровыми камерами рефлекса с одним линзом (DSLR) и телескопами на расстоянии [25], [26]. Однако задача и характеристика мочивания с использованием более повсеместных веб-камеров качественно различаются из-за более низких изображений современных веб-камеров. Изображения веб-камера более низкого качества вызваны уникальными типами искажений, а именно снимком и шумом ISO из-за недостаточного светового приема, и вызывают новые методы повышения изображения. Кроме того, необходимы новые математические модели и рамки анализа, чтобы понять модель угроз модели атак веб -камеры. Наконец, эта новая модель угроз требует выделенной оценки, чтобы прояснить потенциальные угрозы и смягчения для среднего пользователя видеоконференции.
Существует много типов средств массовой информации, которые могут протекать из -за оптических размышлений, включая текст и графику. Мы сосредотачиваемся на утечке текста в этой работе, поскольку она является естественной отправной точкой для измеримой узнаваемости и моделирования фундаментальной базовой линии утечки информации, но также дает представление о утечке не текстовой информации, такой как вывод отображаемых веб-сайтов посредством распознавания графического содержания на экране. Мы стремимся ответить на следующие три основных вопроса: Q1: Каковы основные факторы, влияющие на способность заглянуть в веб -камеру? Q2: Каковы физические ограничения способности противника в наши дни и предсказуемое будущее, и как противники могут расширить пределы? Q3: Каковы соответствующие угрозы для заглядывания веб -камеры против целей киберпространства и возможных смягчений против угроз?
Чтобы ответить на Q1, мы предлагаем упрощенную, но разумно точную математическую модель для размера пикселей отражения. Модель включает в себя такие факторы, как разрешение камеры и расстояние стеклянного экрана, и позволяет прогнозировать пределы мощности веб-камеры по мере развития камеры и видео технологий. Используя индекс структурного сходства сложного вветы в качестве объективного метрики для узнаваемости отражения, мы также предоставляем полуколичественный анализ для других физических факторов, включая интенсивность света окружающей среды, которые влияют на отношение сигнал / шум отражений.
Чтобы ответить на Q2, мы анализируем искажения на изображениях веб-камеры и предлагаем многократную реконструкцию супер-разрешения для эффективного улучшения изображений для расширения пределов. Затем мы собираем данные отражения очков в оптимизированных лабораторных средах и оцениваем пределы узнаваемости отражений как через краудсорсинговых работников на моделях Amazon Mechanical Turk, так и оптических моделей распознавания символов. Оценка показывает точность более 75% при распознавании текстов, которые имеют физическую высоту 10 мм с веб -камерой 720p
Чтобы ответить на Q3, мы сосредоточимся на веб-текстовых целях, чтобы создать эталон, который обеспечивает значимые сравнения между современными и будущими обзорами веб-камеры. Сначала мы сопоставляем ограничения, полученные из модели и оценок с веб-текстовым контентом, обследовав предыдущие отчеты по размеру веб-текста и вручную проверку шрифтов на 117 веб-сайтах с большим фондом. Затем мы проводим исследование пользователя с 20 участниками и играем в игру ChallengerSponse, в которой один автор выступает в качестве противника, чтобы сделать вывод HTML -содержания, созданного другими авторами. Результаты исследования пользователя показывают, что современные веб-камеры 720p могут заглянуть в тексты на 117 веб-сайтах с большим фондом, а в будущих веб-камерах 4K, как предсказывается, представляют угрозы для текстов заголовка с популярных веб-сайтов. Мы исследовали основные факторы, позволяющие проще заглянуть в пользовательское исследование, анализируя корреляцию между точностью распознавания противника и несколькими факторами. Мы обнаружили, например, пользовательские параметры, в том числе соотношение масштабирования браузера, играют более важную роль, чем расстояние стеклянного экрана. Помимо текстов, мы также изучили выполнимость распознавания веб-сайтов с помощью графического контента с 10 участниками и наблюдали точность до 94% при распознавании набора данных в закрытом мире из 100 лучших веб-сайтов.
Наконец, мы обсуждаем возможные краткосрочные смягчения, включая регулирование освещения окружающей среды и размытие стеклянной области в программном обеспечении. Мы также представляем долгосрочные решения после процедуры оценки индивидуального отражения и принципа наименьшей привилегии. Таким образом, цель этой работы состоит в том, чтобы предоставить теоретическую основу и эталон для изучения возникающих угроз для мочания веб -камеры с помощью развивающихся технологий веб -камеры и разработки инфраструктуры видеоконференций энергетики. Мы суммируем наш основной вклад:
∙ Наша работа количественно определяет ограничения и основные факторы, которые прогнозируют степень утечки информации от взгляда веб -камеры, используя теоретическое моделирование и эксперименты. Эта характеристика помогает предсказать будущие неизвестные уязвимости, связанные с ограничениями развивающихся технологий веб -камеры, которые еще не существуют.
∙ Стандартный центр на веб -текстовые целевые показатели, которые позволяют сравнить угрозы для мочания веб -камеры. Наша методология сравнительного анализа основана на соглашениях о дизайне веб-текста и исследовании пользователей с 20 участниками на современных камерах, так что в ближайшие годы можно применять контрольный показатель как к гипотетическим, так и к появляющимся камерам.
∙ Анализ о краткосрочных смягчениях, включая использование программных размывающих фильтров и изменение физических настроек, а также возможную долгосрочную защиту путем упреждающего тестирования и следования принципу наименьшей привилегии. Наш анализ исследует потенциальную эффективность и методы реализации различных мер защиты.
Эта статья есть
Оригинал