Блог DFCenter

Поломка в облаке

На днях, если еще помните, случился глобальный и самый крупный за все время сбой в системах Microsoft. Колом встали, как минимум, Windows и облачная Azure. Жахнуло так, что United Airlines и Delta Airlines полностью приостановили полеты, а UK Southern Railway поезда. Прервалось вещание британского Sky News и австралийского ABC News. Много где не работала Visa. А в Израиле упало IT у нескольких больниц и скорой помощи.

В Майкрософте на фоне всего этого сказали, что признают наличие проблемы у части пользователей и заверили, что активно работают над ее решением. Ну это понятно, что тут еще скажешь. Если, вроде как ты и не виноват, а виновато… соглашение Microsoft с Еврокомиссией. Именно из-за него «Microsoft согласилась предоставить разработчикам защитного ПО такой же уровень доступа к Windows, как и у самой Microsoft».

Ну эти разработчики и наразрабатывали. Точнее наобновляли. И ладно бы стартап какой. Так ведь это оказалась компания Crowdstrike, одна из крупнейших в США (а считай и во всем мире) в сфере кибербезопасности. В ее продукте, который облака защищает от всякого зла, и случилось кривое обновление, которое все и положило.

Главная радость для конкретно нас – ни нас, ни наших клиентов, ни Россию в целом это особо не затронуло. Но заставило в очередной раз задуматься вот о чем.

Во-первых – нужно иметь свое. Особенно, если от этого зависит работоспособность критической инфраструктуры целых отраслей. Но даже если только жизнеспособность конкретно вашей компании – тоже. Ведь именно это – наличие «своего», и помогло России особо не заметить этот «глобальный сбой». Потому что уже успели много чего импортозаместить. И все ведь нормально вроде работает.

Нет возможности разработать свое? Да, для бизнеса, который еще не стал «мега», это задача сложно выполнимая. Но даже в этом случае не надо доверять свои критические сферы облакам. Особенно расположенным у «третьих лиц», непонятно где. А если и доверяете – будьте готовы всегда (реально всегда, вот прям 24/7/365) дернуть рубильник и все самое ценное перевести на запасную систему. Которая должна быть. И бэкапы должны быть. И они должны быть не в том же самом облаке. А лучше вообще не в облаке.

Слишком накладно, неудобно и в целом несовременно? Тогда те же самые 24/7 будьте морально готовы потерять все свои (и своих клиентов) данные, а возможно и сам бизнес. Потому что после такого сбоя обязательно будут миллиардные претензии, убытки и прочие суды. Это во-вторых.

В-третьих, технологии и/или человеческий фактор могут подвести и маленький стартап, и корпорацию с десятилетиями успешных успехов. Никто не застрахован, в иносказательном смысле. Но многие не были застрахованы и в прямом, юридическом. А ведь сбои, неработоспособность инфраструктуры, утеря данных и т.п. – это все не сильно в наше время отличается по разрушительной мощи от пожаров, наводнений, ураганов, засух, кораблекрушений и всего прочего, что губило посевы, скот, склады и караваны тысячелетиями истории человечества. И институт страхования, в том числе, страхования ответственности, для того и придуман, чтобы в случае чего было не совсем смертельно больно бизнесу.

И в-четвертых, что вытекает из третьего – может быть, в случившемся виноват кто-то конкретный? Увел не туда не по той карте, порох влажный купил и провиант тухлый в дальнюю экспедицию, огнетушители старые на опасное производство поставил и так далее. И разобраться во всем этом поможет расследование и экспертизы в предметной области. А когда «ситуация» произошла и IT, то и расследования с экспертизами тоже нужны в IT. Ну вы поняли.