Главная » Хабрахабр » [Перевод] Почему не следует пользоваться Google Cloud

[Перевод] Почему не следует пользоваться Google Cloud

Дополнение (2 июля 2018 г): сотрудники поддержки Google Cloud Platform (GCP) заверили, что такое больше не повторится. Их слова: «Многие люди (в рамках GCP) заинтересованы в том, чтобы улучшить ситуацию не только для вас, но для всех клиентов».

Они превосходны, наравне с AWS. Примечание: это пост не о качестве облачных сервисов Google. C нами это случилось второй раз. Речь идёт о «резких движениях без предупреждения», когда они полностью отключают все ваши системы, если сотрудники (или машины) вдруг решили: что-то не так.

Наш проект в продакшне использует GCP для мониторинга сотен ветроэнергетических установок (ВЭУ) и десятков солнечных электростанций, разбросанных по восьми странам. У нас центры управления с экранами на всю стену: там приборные панели, набитые метриками, за которыми следят круглосуточно. Менеджеры объектов используют эту систему для контроля в реальном времени состояния отдельных ВЭУ и солнечных установок. Если требуется вмешательство, оно производится немедленно. Команды разработки и прогнозирования используют систему для отработки алгоритмов на данных в BigQuery. Все действия непосредственно транслируются в нашу прибыль. Мы имеем дело с ветровой/солнечной энергией — скоропортящимся товаром. Если мы генерируем излишек, то не можем сохранить его и продать позже. Если генерируем недостаточно, то платим штрафы. По этой причине объекты нужно отслеживать 24/7, чтобы не выходить за рамки потребностей энергосистемы и заключенных соглашений о покупке электроэнергии.
Сегодня рано утром (28 июня 2018 года) я получил предупреждение от аптайм-бота, что весь сайт ушёл в офлайн. Шквал писем от Google, в которых говорится, что обнаружена некая «потенциальная подозрительная активность» и все мои системы были отключены. ВСЁ ВЫКЛЮЧЕНО. МАШИНА ОТКЛЮЧИЛА НАС БЕЗ ПРЕДУПРЕЖДЕНИЯ. Сайт не работает, движок приложений и базы данных недоступны, несколько сообщений от Firebase говорят, что меня понизили и поэтому произошло превышение лимитов.

Чат поддержки клиентов выключен. Телефона у нас нет. Пришло электронное письмо с просьбой заполнить форму, загрузить фотографию кредитной карты и ID государственного образца с фотографией владельца карты. Отлично, разбудим финансового директора, который является владельцем карты.

Эта форма подтверждает вашу личность и право собственности на платёжный инструмент. «Мы удалим ваш проект, если владелец счёта не исправит нарушение, заполнив форму подтверждения аккаунта в течение трёх рабочих дней. Непредставление запрошенных документов может привести к окончательному закрытию счёта».

Что делать, если владелец карты в отпуске и недоступен в течение трёх дней? Мы потеряли бы всё — годы работы — миллионы долларов дохода.

Когда это случилось в первый раз, даунтайм продлился несколько часов. Я заполняю форму с деталями и, к счастью, в течение 20 минут все сервисы начали возвращаться к жизни. Приходит автоматическое письмо с извинениями за причинённые неудобства. В целом мы потеряли доступ ко всей информации примерно на час. К сожалению, у машины нет понятия о количестве «неудобств».

Я понимаю, что Google нужно отслеживать и предотвращать подозрительную активность. Но важно, что именно вы делаете после обнаружения подозрительной активности. Здесь необходимо человеческое участие — то, что не заменяется ни на какое количество кода или систему ИИ. Нельзя просто всё отключить, а затем попросить объяснений. Нужно делать наоборот.

Все предыдущие работали на AWS. Это первый проект, который мы полностью построили на Google Cloud. Они предупреждают вас о подозрительной деятельности и дают время, чтобы объяснить и разобраться. По нашему опыту, AWS гораздо гуманнее справляется с проблемами выставления счетов. Они не пинают тебя с лестницы.

До тех пор я никогда не буду размещать никакие проекты на GCP. Надеюсь, что команда GCP прислушается и поменяет ситуацию к лучшему.


Оставить комментарий

Ваш email нигде не будет показан
Обязательные для заполнения поля помечены *

*

x

Ещё Hi-Tech Интересное!

Как изучение критической уязвимости DHCP в Windows 10 привело к обнаружению еще двух ошибок безопасности

Изображение: Unsplash А в некоторых случаях таких новых уязвимостей оказывается больше одной. Как было описано в предыдущей статье про CVE-2019-0726, иногда поиск деталей об уже известной уязвимости приводит к обнаружению новой уязвимости. Как всегда происходит при поиске уязвимостей, даже если ...

Быстрорастворимое проектирование

Люди учатся архитектуре по старым книжкам, которые писались для Java. Книжки хорошие, но дают решение задач того времени инструментами того времени. Время поменялось, C# уже больше похож на лайтовую Scala, чем Java, а новых хороших книжек мало. Увидим обзор типовых ...