PolyThrottle: Энергоэффективный анализ нейронных сетей на периферийных устройствах: экспериментальные результаты
3 апреля 2024 г.:::информация Этот документ доступен на arxiv под лицензией CC BY-NC-ND 4.0 DEED.
Авторы:
(1) Минхао Ян, Университет Висконсин-Мэдисон;
(2) Хонги Ван, Университет Карнеги-Меллон;
(3) Шиварам Венкатараман, myan@cs.wisc.edu.
:::
Таблица ссылок
- Абстрактное и amp; Введение
- Мотивация
- Возможности
- Обзор архитектуры
- Формулировка задачи: двухфазная настройка
- Моделирование помех в рабочей нагрузке
- Эксперименты
- Выводы и amp; Ссылки
- А. Подробности об оборудовании
- Б. Результаты экспериментов
- C. Арифметическая интенсивность
- Д. Анализ предикторов
B РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТА
В этом разделе мы дополнительно продемонстрируем компромисс между частотой памяти и максимальной частотой графического процессора, представив массив результатов. Эти результаты подчеркивают интересное наблюдение о том, что модели энергопотребления различаются для одной и той же модели, работающей на разных устройствах. Более того, даже для пары устройств одной модели на картину оптимизации может существенно влиять размер партии. Это подчеркивает сложность оптимизации энергопотребления и необходимость адаптивной структуры, которая могла бы принять во внимание эти факторы. На рисунках 6–12 показаны модели энергопотребления EfficientNet и Bert на Jetson TX2 и Orin при различных размерах партий. В таблице 7 показаны оптимальная частота процессора и соответствующее снижение энергопотребления при предварительной обработке изображений.
Оригинал