Google заявляет, что закрыл ключевой центр обработки данных, чтобы спасти его от лондонской жары.

Google заявляет, что закрыл ключевой центр обработки данных, чтобы спасти его от лондонской жары.

1 августа 2022 г.

Компания Google предоставила дополнительную информацию о том, что произошло, когда она была вынуждена закрыл один из своих лондонских дата-центров в самый жаркий день года в Великобритании.

Отказ зоны "europe-west2-a" в прошлом месяце был , по данным Google, из-за несоблюдения безопасной рабочей температуры из-за одновременного отказа нескольких дублирующих систем охлаждения в сочетании с «чрезвычайно высокой» наружной температурой.

Сбой затронул многие службы Google, включая Google. Compute Engine, Persistent Disk (PD) и Google Cloud Storage, вызывающие завершение работы инстанса, снижение качества обслуживания и проблемы с сетью.

Что на самом деле произошло?

Инженеры Google отключили центр обработки данных, в котором размещалась часть пострадавшей зоны Europe-west2-a, на время ремонта системы охлаждения

Общее воздействие на облачные сервисы оценивается в 18 часов 23 минуты. .

Это довольно тревожная новость, особенно если учесть, что Google утверждает, что эти региональные сервисы «предназначены для того, чтобы пережить сбой одной зоны».

Google объяснил ошибку непреднамеренным изменением трафика. маршрутизация для внутренних служб, чтобы избежать всех трех зон в регионе «europe-west2», а не только затронутой зоны «europe-west2-a».

Инцидент с маршрутизацией помешал клиентам получить доступ к данным из региональных служб хранения, включая GCS и BigQuery, в нескольких зонах.

Произойдет ли это снова?

Понятно, что такие новости довольно пугают, если вы беспокоитесь о глобальном потеплении, поскольку в Великобритании в будущем может быть немало еще более теплых дней.

К счастью, Google взял на себя некоторые обязательства, чтобы остановить подобные сбои больше никогда не повлияют на его облачный хостинг.

Они включали ремонт и повторное тестирование автоматизации аварийного переключения в попытке обеспечить более высокую устойчивость протоколов аварийного переключения во время крупномасштабных событий, таких как это.

Облачный гигант также стремится исследовать и разрабатывать " более передовые методы» для постепенного снижения тепловой нагрузки в пределах одного пространства центра обработки данных, уменьшая вероятность того, что потребуется полное отключение.

Кроме того, предполагается, что Google проверит свои процедуры, инструменты и автоматизированные системы восстановления на наличие пробелов, а также проведет аудит оборудования и стандартов системы охлаждения в центрах обработки данных, в которых размещено Google Cloud по всему миру.

PREVIOUS ARTICLE
NEXT ARTICLE