![Влияние недавних сбоев в работе центров обработки данных в Австралии на бизнес и снижение рисков](https://www.techrepublic.com/wp-content/uploads/2023/09/tr-2023-09-22-Guy-Danskine-Managing-Director-Equinix-Australia2.jpeg)
Влияние недавних сбоев в работе центров обработки данных в Австралии на бизнес и снижение рисков
26 сентября 2023 г.Недавний сбой в центре обработки данных в Сиднее затронул несколько поставщиков облачных услуг и предприятия, включая Bank of Queensland и Jetstar. После этого и других инцидентов клиенты облачных сервисов вполне могут задаться вопросом, может ли с ними случиться то же самое — и как смягчить последствия до того, как это произойдет.
Можно ли управлять рисками физических центров обработки данных?
TechRepublic поговорил с Нам Дже Чо, директором по архитектуре решений AWS в Австралии и Новой Зеландии, и Гаем Данскином, управляющим директором поставщика центров обработки данных Equinix Australia, которые оба сидят в ложе, чтобы стать свидетелями внедрения облака в регионе.
Чо и Данскин рекомендовали ряд стратегий, в том числе учет географического разнообразия, обеспечение встроенного резервирования, поиск лучших практик управления центрами обработки данных и рассмотрение преимуществ рисков, связанных с гибридной мультиоблачной инфраструктурой.
Посетите АВС Посетите Эквиникс
Перейти к:
- Отключения центров обработки данных в Австралии показывают, что некоторые риски все же сохраняются
Доверие к облаку по-прежнему стимулирует расширение облачной инфраструктуры
Провайдеры разрабатывают облако для снижения рисков центров обработки данных
Что могут сделать клиенты, чтобы максимизировать отказоустойчивость своего облака?
Будущее облаков обеспечит гибкость и отказоустойчивость клиентов
Отключения центров обработки данных в Австралии показывают, что некоторые риски все же сохраняются
В августе 2023 года австралийским организациям напомнили, что риски облачных вычислений действительно существуют. Удар молнии в электрическую инфраструктуру в 18 милях от центра обработки данных в Сиднее вызвал провал напряжения в электросети, в результате чего часть охладителей системы охлаждения объекта отключилась от сети.
Azure, Oracle и NetSuite пострадали из-за сбоя в дата-центре в Сиднее
Как сообщил пострадавший поставщик облачных услуг Microsoft Azure в отчете после инцидента, пока технические специалисты работали над устранением проблемы, температура в центре обработки данных выросла до уровня, превышающего эксплуатационные пороговые значения. Затем пришлось обесточить часть вычислительных устройств и устройств хранения данных, чтобы снизить температуру и предотвратить повреждение оборудования.
Инцидент затронул облачных клиентов, начавшийся около 10:30 UTC и продолжавшийся до 22:40 UTC. В течение некоторого времени у клиентов Bank of Queensland возникали проблемы с приложением банка, а банковские операции неправильно отражались на счетах клиентов. Тем временем у клиентов Jetstar возникли проблемы со входом в систему, управлением бронированием и регистрацией на рейсы.
SEE: Предприятия Австралии и Новой Зеландии также сталкиваются с необходимостью оптимизировать облачные стратегии.
Azure оказалась не единственной затронутой службой. Поскольку это был общий центр обработки данных, сбои также повлияли на услуги Oracle Cloud и NetSuite.
Сбои в работе, подобные Google в Мельбурне в 2021 году, повышают устойчивость
Местные облачные клиенты беспокоятся и о других сбоях в работе центров обработки данных. Всего через месяц или около того после запуска нового региона в Мельбурне в 2021 году облачные службы Google в Юго-Восточной Австралии2 отключились на 1 час 30 минут из-за проблем с временным напряжением.
В заявлении по поводу инцидента компания Google заявила, что «основной причиной проблемы было переходное напряжение на фидере сетевого оборудования, вызывающее перезагрузку оборудования. Чтобы решить эту проблему, трафик в регионе Австралия-Юго-Восток2 был временно перенаправлен».
В недавнем отчете Forrester «Состояние облаков в Австралии и Новой Зеландии» говорится, что такие инциденты, как этот сбой, а также экологическая неопределенность побуждают организации рассмотреть возможность пересмотра своих стратегий снижения рисков.
«В период глобальной пандемии, сбоев в работе облачных систем в 2021 году, таких как сбой в работе Google в Мельбурне, пожаров и наводнений в Австралии и землетрясений в Новой Зеландии, предприятия отдают приоритет устойчивости», — сообщает Forrester.
По словам Forrester, снижение рисков может включать «повышение осведомленности о рисках, использование нескольких зон доступности (AZ) для высокоприоритетных рабочих нагрузок, снижение рисков поставщиков за счет набора навыков работы с несколькими облаками или построения сценариев против потенциальных рисков».
Доверие к облаку по-прежнему стимулирует расширение центров обработки данных
AWS обслуживает сотни тысяч предприятий по всей Австралии и Новой Зеландии, включая Atlassian, NAB и агентства государственного сектора, такие как Австралийское статистическое бюро и Министерство образования Западной Австралии. Equinix также пользуется доверием клиентов в важнейших отраслях, включая здравоохранение, финансовые услуги и правительство.
Клиентам такого уровня необходимо иметь облачное обслуживание круглосуточно и без перебоев.
Представитель Danskine из Equinix Australia заявил, что организации понимают, что центры обработки данных и облака играют основополагающую роль в поддержке их бизнеса. Данскин добавил, что масштабируемость, надежность и экономичность облачных технологий и инфраструктуры — это то, что позволяет организациям эффективно работать в условиях все более цифровой экономики.
«Надежная цифровая инфраструктура имеет основополагающее значение», — сказал Данскин. «Это позволяет организациям объединять пользователей, клиентов и сотрудников, повышает безопасность данных и позволяет им адаптироваться к меняющимся требованиям рынка».
Этот спрос стимулирует рост Equinix. У него 51 центр обработки данных в регионе Азиатско-Тихоокеанского региона, в том числе 22 в Австралии, расположенные в Сиднее, Мельбурне, Брисбене, Канберре, Перте и Аделаиде.
Компания также инвестирует более 1 миллиарда австралийских долларов (645 миллионов долларов США) в 13 проектов, в рамках которых будут построены новые центры обработки данных в Австралии, Индии, Японии и Корее, а также расширены мощности в Индонезии и Малайзии.
«Мы всегда ищем подходящие возможности для расширения в соответствии с требованиями клиентов и рынка, чтобы обеспечить наилучшую поддержку текущих и будущих требований», — сказал Данскин.
Тем временем AWS инвестирует 13,2 миллиарда австралийских долларов (8,44 миллиарда долларов США) в инфраструктуру с 2023 по 2027 год по всей Австралии и строит новый регион в Окленде с тремя зонами доступности.
Инвестиции, подобные инвестициям AWS и Equinix, лежат в основе того, что Forrester назвал «новым масштабом использования общедоступных облаков» в Австралазии. Организации, которые в настоящее время переходят в облако, ожидают, что в течение следующих двух лет в облаке будет находиться в среднем 46% рабочих нагрузок.
Поскольку цифровая трансформация по-прежнему остается приоритетом, Дэнскин заявил, что предприятия доверяют центрам обработки данных и облаку в обеспечении инфраструктуры, необходимой для стимулирования инноваций, поддержки высокого уровня доступности и «стимулирования роста в мире, управляемом данными».
Провайдеры разрабатывают облако для снижения рисков центров обработки данных
Несмотря на высокий уровень доверия, в Danskine заявили, что рынок не свободен от рисков.
«После пандемии многие организации работают с меньшим количеством сотрудников, поэтому вероятность сбоя системы, даже при автоматизированном удаленном мониторинге и профилактическом обслуживании, возросла», — сказал Данскин.
Один из способов борьбы с этим риском — обеспечить организациям резервирование электропитания, чтобы снизить последствия сбоя системы.
SEE: Эта политика управления рисками поможет поддержать устойчивость вашей организации.
«В Equinix мы в стандартной комплектации предоставляем полностью резервированную электрическую и механическую инфраструктуру нашим клиентам в центрах обработки данных по всему миру», — сказал Данскин.
AWS фокусируется на зонах доступности, чтобы снизить риск простоя
Снижение рисков — центральная функция проектирования для поставщиков облачных услуг и центров обработки данных. Например, AWS, как и другие поставщики облачных услуг, предлагает несколько зон доступности во всех своих регионах. Это означает, что приложение может быть разделено по разным географическим регионам.
![](https://www.techrepublic.com/wp-content/uploads/2023/09/tr-2023-09-22-Nam-Je-Cho-headshot.jpeg)
«Аризоны физически разделены значительным расстоянием, многими километрами, хотя все они находятся в пределах 100 километров (60 миль) друг от друга», — сказал Чо из AWS. «Каждая зона доступности имеет независимое питание, охлаждение и физическую безопасность и подключена через резервные сети со сверхнизкой задержкой.
«Если приложение распределено по зонам доступности, компании лучше изолированы и защищены от таких проблем, как перебои в подаче электроэнергии, естественные погодные явления и многое другое».
Сервисы, управляемые в нескольких зонах доступности, такие как Amazon Relational Database Service и Amazon Elastic Kubernetes Service, позволяют клиентам выбирать, в каких зонах доступности они будут развертывать.
«Если в одной зоне доступности происходит инфраструктурное событие, происходит управляемый автоматический переход на вторую зону доступности и восстановление после сбоя при необходимости практически без перебоев в обслуживании», — сказал Чо. «Наши клиенты выполняют критически важные рабочие нагрузки, развертывая рабочие нагрузки с архитектурами с несколькими зонами доступности и/или несколькими регионами для достижения высокой доступности».
Equinix стремится к постоянному совершенствованию управления центром обработки данных
Equinix продолжает изучать способы повышения эксплуатационной целостности и безопасности своих центров обработки данных (рис. A). Одним из примеров является то, что критическое техническое обслуживание всегда проводится минимум двумя квалифицированными инженерами, которые дважды проверяют работу друг друга.
Рисунок А
![](https://www.techrepublic.com/wp-content/uploads/2023/09/tr-2023-09-22-Equinix-Data-Centre-in-Sydney-Australia-770x513.jpeg)
Когда клиенты решают использовать свою программно-определяемую платформу межсетевых соединений Equinix Fabric для подключения к своим облакам, SaaS и сетевым провайдерам, компания Danskine заявила, что всегда рекомендует настраивать два физических порта.
«Компании могут положиться на них для обеспечения дополнительной отказоустойчивости при подключении к тысячам глобальных конечных точек или собственной ИТ-инфраструктуре на платформе Equinix», — сказал Данскин. «Компании могут создавать взаимосвязанные сценарии обеспечения непрерывности бизнеса и аварийного восстановления, отвечающие их потребностям».
Что могут сделать предприятия, чтобы максимизировать устойчивость своего облака?
Время безотказной работы облаков и центров обработки данных приближается к 100%. Время безотказной работы Equinix по всему миру составляет >99,9999 % в 250 центрах обработки данных, а AWS обеспечивает доступность на уровне 99,999 %. Но есть способы, которыми клиенты могут снизить риск сбоя в работе центра обработки данных, помимо зависимости от времени безотказной работы своих провайдеров.
Используйте географическое разнообразие
Географическое разнообразие является основополагающей особенностью современных облачных сервисов и должно считаться важным для всей критически важной инфраструктуры. Подобно множеству зон доступности, предлагаемых в регионах AWS, такое распространение географического риска может происходить через несколько центров обработки данных, сопоставление приложения с несколькими облачными регионами или развертывание рабочей нагрузки через контейнеры.
Ищите резервирование сети
Резервированная сеть может поддерживать полную работу во время сбоя в обслуживании и обеспечивать техническое обслуживание в полете. В Equinix заявили, что предприятия должны обеспечить резервирование в отдельных сетевых компонентах, дополняющих друг друга и общую конструкцию, чтобы в случае сбоя его воздействие было минимальным, пока предпринимаются усилия по восстановлению.
Обеспечьте регулярное планирование и тестирование.
Equinix утверждает, что регулярное тестирование имеет решающее значение. Он тестирует критически важные системы каждые две недели при максимальной нагрузке и ежегодно проводит «тестирование темных площадок», во время которого намеренно отключает площадки от основного источника питания, чтобы гарантировать, что резервные системы заработают и будут работать должным образом. Forrester также рекомендует пересмотреть элементы рисков и непрерывности облачных стратегий.
Примите гибридную мультиоблачную стратегию
Организации все чаще используют независимую от облачных технологий цифровую инфраструктуру для достижения таких преимуществ, как инновации, экономическая эффективность и устойчивость. Объединение нескольких облаков с прилегающими к облаку локальными средами может предоставить предприятиям важные преимущества в области безопасности и непрерывности бизнеса, повышая устойчивость организаций.
СМ.: Узнайте все, что вам нужно знать о мультиоблачном и гибридном облаке.
Используйте управляемый сервис
AWS предлагает ряд управляемых сервисов, которые позволяют организациям работать внутри региона и за его пределами без необходимости самостоятельно разрабатывать характеристики для нескольких зон доступности. Поскольку AWS по умолчанию заботится об этом, если возникает проблема в определенной зоне доступности, она будет решена от имени клиента в рамках модели общей ответственности.
Будущее облаков обеспечит гибкость и отказоустойчивость клиентов
Недавние сбои в работе центров обработки данных не замедлят реализацию облачных стратегий. Danskine утверждает, что гибридное мультиоблако становится предпочтительной архитектурой для многих, поскольку это универсальная инфраструктурная стратегия. А согласно пятому ежегодному индексу корпоративных облаков Nutanix, респонденты в Австралии ожидают увеличения использования этой модели более чем в пять раз до 43% проникновения к 2026 году.
«Этот подход обеспечивает гибкость выбора между публичными и частными облаками, оптимизируя производительность и экономическую эффективность», — сказал Данскин. «Это также повышает устойчивость за счет резервирования и возможностей аварийного восстановления и обеспечивает соблюдение нормативных требований в принимающей стране, обеспечивая безопасность и суверенитет данных».
Нам Дже Чо из AWS заявил, что нет никаких сомнений в том, что регион «находится в середине тектонического перехода к облакам». Причина номер один, по которой наши клиенты переходят к облаку и внедряют инновации, — это гибкость и скорость, с которой они могут изменить качество обслуживания клиентов».
Оригинал