Влияние недавних сбоев в работе центров обработки данных в Австралии на бизнес и снижение рисков

Влияние недавних сбоев в работе центров обработки данных в Австралии на бизнес и снижение рисков

26 сентября 2023 г.
AWS и Equinix предлагают рекомендации по гибридным и мультиоблачным стратегиям, которые помогут снизить риски центров обработки данных в свете недавнего сбоя в работе в Австралии, от которого пострадали Bank of Queensland и Jetstar.

Недавний сбой в центре обработки данных в Сиднее затронул несколько поставщиков облачных услуг и предприятия, включая Bank of Queensland и Jetstar. После этого и других инцидентов клиенты облачных сервисов вполне могут задаться вопросом, может ли с ними случиться то же самое — и как смягчить последствия до того, как это произойдет.

Можно ли управлять рисками физических центров обработки данных?

TechRepublic поговорил с Нам Дже Чо, директором по архитектуре решений AWS в Австралии и Новой Зеландии, и Гаем Данскином, управляющим директором поставщика центров обработки данных Equinix Australia, которые оба сидят в ложе, чтобы стать свидетелями внедрения облака в регионе.

Чо и Данскин рекомендовали ряд стратегий, в том числе учет географического разнообразия, обеспечение встроенного резервирования, поиск лучших практик управления центрами обработки данных и рассмотрение преимуществ рисков, связанных с гибридной мультиоблачной инфраструктурой.

Посетите АВС Посетите Эквиникс

Перейти к:

    Отключения центров обработки данных в Австралии показывают, что некоторые риски все же сохраняются Доверие к облаку по-прежнему стимулирует расширение облачной инфраструктуры Провайдеры разрабатывают облако для снижения рисков центров обработки данных Что могут сделать клиенты, чтобы максимизировать отказоустойчивость своего облака? Будущее облаков обеспечит гибкость и отказоустойчивость клиентов

Отключения центров обработки данных в Австралии показывают, что некоторые риски все же сохраняются

В августе 2023 года австралийским организациям напомнили, что риски облачных вычислений действительно существуют. Удар молнии в электрическую инфраструктуру в 18 милях от центра обработки данных в Сиднее вызвал провал напряжения в электросети, в результате чего часть охладителей системы охлаждения объекта отключилась от сети.

Azure, Oracle и NetSuite пострадали из-за сбоя в дата-центре в Сиднее

Как сообщил пострадавший поставщик облачных услуг Microsoft Azure в отчете после инцидента, пока технические специалисты работали над устранением проблемы, температура в центре обработки данных выросла до уровня, превышающего эксплуатационные пороговые значения. Затем пришлось обесточить часть вычислительных устройств и устройств хранения данных, чтобы снизить температуру и предотвратить повреждение оборудования.

Инцидент затронул облачных клиентов, начавшийся около 10:30 UTC и продолжавшийся до 22:40 UTC. В течение некоторого времени у клиентов Bank of Queensland возникали проблемы с приложением банка, а банковские операции неправильно отражались на счетах клиентов. Тем временем у клиентов Jetstar возникли проблемы со входом в систему, управлением бронированием и регистрацией на рейсы.

SEE: Предприятия Австралии и Новой Зеландии также сталкиваются с необходимостью оптимизировать облачные стратегии.

Azure оказалась не единственной затронутой службой. Поскольку это был общий центр обработки данных, сбои также повлияли на услуги Oracle Cloud и NetSuite.

Сбои в работе, подобные Google в Мельбурне в 2021 году, повышают устойчивость

Местные облачные клиенты беспокоятся и о других сбоях в работе центров обработки данных. Всего через месяц или около того после запуска нового региона в Мельбурне в 2021 году облачные службы Google в Юго-Восточной Австралии2 отключились на 1 час 30 минут из-за проблем с временным напряжением.

В заявлении по поводу инцидента компания Google заявила, что «основной причиной проблемы было переходное напряжение на фидере сетевого оборудования, вызывающее перезагрузку оборудования. Чтобы решить эту проблему, трафик в регионе Австралия-Юго-Восток2 был временно перенаправлен».

В недавнем отчете Forrester «Состояние облаков в Австралии и Новой Зеландии» говорится, что такие инциденты, как этот сбой, а также экологическая неопределенность побуждают организации рассмотреть возможность пересмотра своих стратегий снижения рисков.

«В период глобальной пандемии, сбоев в работе облачных систем в 2021 году, таких как сбой в работе Google в Мельбурне, пожаров и наводнений в Австралии и землетрясений в Новой Зеландии, предприятия отдают приоритет устойчивости», — сообщает Forrester.

По словам Forrester, снижение рисков может включать «повышение осведомленности о рисках, использование нескольких зон доступности (AZ) для высокоприоритетных рабочих нагрузок, снижение рисков поставщиков за счет набора навыков работы с несколькими облаками или построения сценариев против потенциальных рисков».

Доверие к облаку по-прежнему стимулирует расширение центров обработки данных

AWS обслуживает сотни тысяч предприятий по всей Австралии и Новой Зеландии, включая Atlassian, NAB и агентства государственного сектора, такие как Австралийское статистическое бюро и Министерство образования Западной Австралии. Equinix также пользуется доверием клиентов в важнейших отраслях, включая здравоохранение, финансовые услуги и правительство.

Клиентам такого уровня необходимо иметь облачное обслуживание круглосуточно и без перебоев.

Представитель Danskine из Equinix Australia заявил, что организации понимают, что центры обработки данных и облака играют основополагающую роль в поддержке их бизнеса. Данскин добавил, что масштабируемость, надежность и экономичность облачных технологий и инфраструктуры — это то, что позволяет организациям эффективно работать в условиях все более цифровой экономики.

«Надежная цифровая инфраструктура имеет основополагающее значение», — сказал Данскин. «Это позволяет организациям объединять пользователей, клиентов и сотрудников, повышает безопасность данных и позволяет им адаптироваться к меняющимся требованиям рынка».

Этот спрос стимулирует рост Equinix. У него 51 центр обработки данных в регионе Азиатско-Тихоокеанского региона, в том числе 22 в Австралии, расположенные в Сиднее, Мельбурне, Брисбене, Канберре, Перте и Аделаиде.

Компания также инвестирует более 1 миллиарда австралийских долларов (645 миллионов долларов США) в 13 проектов, в рамках которых будут построены новые центры обработки данных в Австралии, Индии, Японии и Корее, а также расширены мощности в Индонезии и Малайзии.

«Мы всегда ищем подходящие возможности для расширения в соответствии с требованиями клиентов и рынка, чтобы обеспечить наилучшую поддержку текущих и будущих требований», — сказал Данскин.

Тем временем AWS инвестирует 13,2 миллиарда австралийских долларов (8,44 миллиарда долларов США) в инфраструктуру с 2023 по 2027 год по всей Австралии и строит новый регион в Окленде с тремя зонами доступности.

Инвестиции, подобные инвестициям AWS и Equinix, лежат в основе того, что Forrester назвал «новым масштабом использования общедоступных облаков» в Австралазии. Организации, которые в настоящее время переходят в облако, ожидают, что в течение следующих двух лет в облаке будет находиться в среднем 46% рабочих нагрузок.

Поскольку цифровая трансформация по-прежнему остается приоритетом, Дэнскин заявил, что предприятия доверяют центрам обработки данных и облаку в обеспечении инфраструктуры, необходимой для стимулирования инноваций, поддержки высокого уровня доступности и «стимулирования роста в мире, управляемом данными».

Провайдеры разрабатывают облако для снижения рисков центров обработки данных

Несмотря на высокий уровень доверия, в Danskine заявили, что рынок не свободен от рисков.

«После пандемии многие организации работают с меньшим количеством сотрудников, поэтому вероятность сбоя системы, даже при автоматизированном удаленном мониторинге и профилактическом обслуживании, возросла», — сказал Данскин.

Один из способов борьбы с этим риском — обеспечить организациям резервирование электропитания, чтобы снизить последствия сбоя системы.

SEE: Эта политика управления рисками поможет поддержать устойчивость вашей организации.

«В Equinix мы в стандартной комплектации предоставляем полностью резервированную электрическую и механическую инфраструктуру нашим клиентам в центрах обработки данных по всему миру», — сказал Данскин.

AWS фокусируется на зонах доступности, чтобы снизить риск простоя

Снижение рисков — центральная функция проектирования для поставщиков облачных услуг и центров обработки данных. Например, AWS, как и другие поставщики облачных услуг, предлагает несколько зон доступности во всех своих регионах. Это означает, что приложение может быть разделено по разным географическим регионам.

Нам Дже Чо, директор по архитектуре решений AWS в Австралии и Новой Зеландии

«Аризоны физически разделены значительным расстоянием, многими километрами, хотя все они находятся в пределах 100 километров (60 миль) друг от друга», — сказал Чо из AWS. «Каждая зона доступности имеет независимое питание, охлаждение и физическую безопасность и подключена через резервные сети со сверхнизкой задержкой.

«Если приложение распределено по зонам доступности, компании лучше изолированы и защищены от таких проблем, как перебои в подаче электроэнергии, естественные погодные явления и многое другое».

Сервисы, управляемые в нескольких зонах доступности, такие как Amazon Relational Database Service и Amazon Elastic Kubernetes Service, позволяют клиентам выбирать, в каких зонах доступности они будут развертывать.

«Если в одной зоне доступности происходит инфраструктурное событие, происходит управляемый автоматический переход на вторую зону доступности и восстановление после сбоя при необходимости практически без перебоев в обслуживании», — сказал Чо. «Наши клиенты выполняют критически важные рабочие нагрузки, развертывая рабочие нагрузки с архитектурами с несколькими зонами доступности и/или несколькими регионами для достижения высокой доступности».

Equinix стремится к постоянному совершенствованию управления центром обработки данных

Equinix продолжает изучать способы повышения эксплуатационной целостности и безопасности своих центров обработки данных (рис. A). Одним из примеров является то, что критическое техническое обслуживание всегда проводится минимум двумя квалифицированными инженерами, которые дважды проверяют работу друг друга.

Рисунок А

Дата-центр Equinix SY5 в Сиднее. Изображение: Эквиникс

Когда клиенты решают использовать свою программно-определяемую платформу межсетевых соединений Equinix Fabric для подключения к своим облакам, SaaS и сетевым провайдерам, компания Danskine заявила, что всегда рекомендует настраивать два физических порта.

«Компании могут положиться на них для обеспечения дополнительной отказоустойчивости при подключении к тысячам глобальных конечных точек или собственной ИТ-инфраструктуре на платформе Equinix», — сказал Данскин. «Компании могут создавать взаимосвязанные сценарии обеспечения непрерывности бизнеса и аварийного восстановления, отвечающие их потребностям».

Что могут сделать предприятия, чтобы максимизировать устойчивость своего облака?

Время безотказной работы облаков и центров обработки данных приближается к 100%. Время безотказной работы Equinix по всему миру составляет >99,9999 % в 250 центрах обработки данных, а AWS обеспечивает доступность на уровне 99,999 %. Но есть способы, которыми клиенты могут снизить риск сбоя в работе центра обработки данных, помимо зависимости от времени безотказной работы своих провайдеров.

Используйте географическое разнообразие

Географическое разнообразие является основополагающей особенностью современных облачных сервисов и должно считаться важным для всей критически важной инфраструктуры. Подобно множеству зон доступности, предлагаемых в регионах AWS, такое распространение географического риска может происходить через несколько центров обработки данных, сопоставление приложения с несколькими облачными регионами или развертывание рабочей нагрузки через контейнеры.

Ищите резервирование сети

Резервированная сеть может поддерживать полную работу во время сбоя в обслуживании и обеспечивать техническое обслуживание в полете. В Equinix заявили, что предприятия должны обеспечить резервирование в отдельных сетевых компонентах, дополняющих друг друга и общую конструкцию, чтобы в случае сбоя его воздействие было минимальным, пока предпринимаются усилия по восстановлению.

Обеспечьте регулярное планирование и тестирование.

Equinix утверждает, что регулярное тестирование имеет решающее значение. Он тестирует критически важные системы каждые две недели при максимальной нагрузке и ежегодно проводит «тестирование темных площадок», во время которого намеренно отключает площадки от основного источника питания, чтобы гарантировать, что резервные системы заработают и будут работать должным образом. Forrester также рекомендует пересмотреть элементы рисков и непрерывности облачных стратегий.

Примите гибридную мультиоблачную стратегию

Организации все чаще используют независимую от облачных технологий цифровую инфраструктуру для достижения таких преимуществ, как инновации, экономическая эффективность и устойчивость. Объединение нескольких облаков с прилегающими к облаку локальными средами может предоставить предприятиям важные преимущества в области безопасности и непрерывности бизнеса, повышая устойчивость организаций.

СМ.: Узнайте все, что вам нужно знать о мультиоблачном и гибридном облаке.

Используйте управляемый сервис

AWS предлагает ряд управляемых сервисов, которые позволяют организациям работать внутри региона и за его пределами без необходимости самостоятельно разрабатывать характеристики для нескольких зон доступности. Поскольку AWS по умолчанию заботится об этом, если возникает проблема в определенной зоне доступности, она будет решена от имени клиента в рамках модели общей ответственности.

Будущее облаков обеспечит гибкость и отказоустойчивость клиентов

Недавние сбои в работе центров обработки данных не замедлят реализацию облачных стратегий. Danskine утверждает, что гибридное мультиоблако становится предпочтительной архитектурой для многих, поскольку это универсальная инфраструктурная стратегия. А согласно пятому ежегодному индексу корпоративных облаков Nutanix, респонденты в Австралии ожидают увеличения использования этой модели более чем в пять раз до 43% проникновения к 2026 году.

«Этот подход обеспечивает гибкость выбора между публичными и частными облаками, оптимизируя производительность и экономическую эффективность», — сказал Данскин. «Это также повышает устойчивость за счет резервирования и возможностей аварийного восстановления и обеспечивает соблюдение нормативных требований в принимающей стране, обеспечивая безопасность и суверенитет данных».

Нам Дже Чо из AWS заявил, что нет никаких сомнений в том, что регион «находится в середине тектонического перехода к облакам». Причина номер один, по которой наши клиенты переходят к облаку и внедряют инновации, — это гибкость и скорость, с которой они могут изменить качество обслуживания клиентов».


Оригинал
PREVIOUS ARTICLE
NEXT ARTICLE