Как прерывистую сделать непрерывной. Часть 1. Взгляд со стороны

27.09.2012 11:40 12 4 058 просмотров
Жизнь состоит из линий. Из сплошных и прерывистых. Будь то линия жизни, дорожная разметка или информационный поток. Сколько анекдотов про эти линии было. Но ситуация с ними неоднозначна. Иногда прерывистая линия – это благо, а иногда – беда. Сегодня хочу затронуть важную, на мой взгляд, тему о непрерывности предоставления ИТ-сервисов, от которых зависит так необходимое нам, как клиентам банков, непрерывное предоставление финансовых услуг. Непрерывность бизнес-процессов – это немного другая тема, её можно рассмотреть отдельно, а пока поговорим только о непрерывности ИТ-сервисов.

Во многих банках задумываются о необходимости выполнения работ по обеспечению непрерывности, но откладывают их на «потом». И как обычно бывает, однажды случается крупный сбой, все начинают бегать, что-то исправлять, искать виноватого. А надо было всего-то своевременно провести работы по тестированию непрерывности предоставления ИТ-сервисов. Тем более, что имеется целый ряд регламентирующих требований по вопросам обеспечения непрерывности и восстановления деятельности финансовых организаций со стороны Центробанка и Ассоциации российских банков.

Выполнение работ по обеспечению непрерывности собственными силами возможно, но вопрос в том, когда и какой результат будет достигнут? Приведу пример развития событий по обеспечению непрерывности предоставления ИТ-сервисов, когда работы выполнялись без плана, а от случая к случаю.

В банке присутствует много разрозненных и не всегда хорошо управляемых процессов. Периодически, то там, то здесь происходят сбои, пусть даже небольшие. Но каждый сбой – это опыт, позволяющий предотвратить повторение ситуации. Многие банки прошли тот этап, когда в результате накопленного опыта было принято абсолютно правильное решение – строительство собственного ЦОДа. И что? Сбои прекратились? Вовсе нет. Они стали реже, но избавиться от них не получилось. Так в чём причина? Чаще всего последующий опыт эксплуатации ИТ-систем показывает, что причина перерывов предоставления ИТ-сервисов в отсутствии или неполном резервировании. Банк принимает новое решение – строительство или аренда резервного ЦОДа. Работы завершены и ИТ-департамент вздыхает спокойно!.. Но, как показывает практика, счастье длится недолго. Раньше или позже опять возникает сбой. Почему? Ответ прост: принятые ранее меры необходимы, но недостаточны. Нет работающих, проверенных процедур обеспечения непрерывности предоставления ИТ-сервисов.

Многолетний опыт «Техносерва» показывает, что для непрерывного предоставления ИТ-сервисов требуется надёжное функционирование всей ИТ-инфраструктуры и инженерных систем предприятия. Для достижения этой цели банки устанавливают дизель-генераторы, получают на них экологические сертификаты, тратят на это значительные финансовые и административные ресурсы. Но жизнь устроена таким образом, что обязательно возникают нештатные ситуации. Именно это произошло при эксплуатации дизель-генераторных установок в двух известных мне банках. И пусть причины возникновения сбоя были различны, но привели они к одинаковому результату: работа ИТ-систем банков была полностью остановлена на несколько часов. В одном случае к сбою привело бездействие сотрудника, отвечающего за запуск дизель-генератора. В момент отключения электропитания этот специалист выполнял работы в изолированном помещении, и его мобильный был не доступен для оповещения. А коллеги по работе не знали, как запускать ДГУ. Второй банк не спасло даже то обстоятельство, что для обеспечения надёжности электропитания было предусмотрено ДВА дизель-генератора. Один из них не смог своевременно запуститься, а другой прекратил работу через несколько минут после запуска. ДГУ были заправлены летним топливом.

Эти примеры показывают, что на непрерывность предоставления ИТ-сервисов влияет не только серверное, а ещё и инженерное оборудование. Это надо учитывать и периодически проводить проверки (тестирования) штатного функционирования оборудования. В обоих банках были сделаны правильные выводы. Тестирование дизель-генераторов стали проводить на регулярной основе – не реже одного раза в месяц. Но кто сказал, что не будет других сбоев? Требуется тестировать не только работу дизель-генератора, но и чиллеров, кондиционеров, насосов.

Эти сбои принесли банкам реальные убытки, хотя этого можно было избежать. Есть много специализированных организаций, которые не только подготовят регламенты, но и будут отвечать за их выполнение в соответствии с SLA, прописанными в контракте. По такому принципу «Техносерв» отвечает за эксплуатацию, техническую поддержку и обслуживание инженерного оборудования в нескольких финансовых учреждениях, в ФМС России, АШАН, Росреестре. Важно, что процессы тестирования работы всего обслуживаемого оборудования производятся изначально в плановом порядке. Хочется надеяться, что к плановому процессу тестирования придут не только внешние подрядчики, но и внутренние службы эксплуатации, а работы будут выполнять опытные специалисты. И пусть эта линия будет только непрерывной!

Комментарии 12

Alex  (BankCoda)
#
А еще бывают потопы!
Погромы!
Их тоже моделировать?
A A  (NC_)
#
Нам бы без этих катаклизмов обойтись без сбоев….
«10 октября 2012 г. на территории обслуживании Байкальского банка Сбербанка России произошел сбой в работе части платежных терминалов из-за некорректной работы процессинговой системы банка.»
Олег Касатов  (zhuk0071)
#
Это всё поучительно, но суть вопроса в том - сколько готово платить руководство банка за поддержание такой "непрерывной линии". smile:)
Александр Горшков  (technoserv)
#
Олег, спасибо за комментарий. Вы правы - тема очень трепетная.
Расскажу один случай про участь CIO. Это было достаточно давно, тогда CIO только появлялись, опыта и авторитета у них было мало-то. И после одного ЧП CIO нашего банка увольняют.
Примерно через пол года на дне рождения руководителя службы HR в приватной беседе я задаю вопрос, а за что был уволен наш руководитель? Он вроде и к руководству и акционерам он ходил.
Заранее риск возникновения сбоя и его последствия объяснял, но денег выделено не было.

Ответ тогда меня поразил, - "Значит плохо объяснял".

Ваш вопрос как раз из аналогичной ситуации. Или Вы сможете объяснить необходимость выполнения таких работ, или потом Вам поставят в вину, что Вы не смогли убедить в необходимости выделения требуемых средств.

Приведу ещё один пример в качестве аргумента.
Одно время в банке рассматривался вопрос покупки части акций зарубежным инвестором. Один из пунктов, который влиял на стоимость пакета был наличие плана обеспечения непрерывности предоставления бизнес услуг. В данном случае я рассматриваю только одну из составных частей - непрерывность предоставления ИТ-сервисов. Но и предоставление такого плана и регламентов было достаточно, чтобы стоимость пакета акций не была снижена.
A A  (NC_)
#
Так что важнее
- Тестирование непрерывности
- Наличие регламентов по восстановлению штатного функционирования
- Периодическое тестирование
Или что-то ещё?
Александр Горшков  (technoserv)
#
Спасибо за проявленный интерес.
В обеспечении непрерывности предоставления ИТ-сервисов важно не какие-то одни отдельно взятые работы, а комплексное решение.
В каких-то случаях будет достаточно только одних регламентов, которые позволят при возникновении нештатной ситуации каждому специалисту знать - что и как делать, а в других потребуется применение специализированных технических решений.
А вот уже при наличие этих двух вариантов - можно проводить тестирование их корректного выполнения. Просто нельзя тестировать то, что неформализовано.
Михаил  (mih@)
#
Олег, в данном случае, все зависит от того, насколько Вам или Вашему подразделению это нужно.
Если действительно нужно, то всегда можно заручиться поддержкой других подразделений. Ну, например, Департамент рисков: "простой - это риск?" Безусловно. Уверен, что специально обученные люди его просчитывают! Вдвоем-то "веселее" идти к руководству. А сколько готов платить руководитель, зависит от Ваших непосредственных доводов и рисков, которые можно будет в будущем минимизировать или избежать!
Александр Горшков  (technoserv)
#
Михаил, всё правильно.
Практически невозможно обосновать финансирование работ, которые предназначены только для ИТ.
Даже внедрение Service Desk в последнее время реализуют не только для ИТ, а на все службы банка и даже для клиентов банка. Подключение к вопросу целесообразности таких работ и выделения финансирования позволит добиться успеха.
Операционные, кредитные подразделения или казначейство лучше других могут оценить свои потери от простоя.
Недавно "Техносерв" выполнял работы по обеспечению гарантированного электроснабжения.
Сроки были катастрофически малы, но требуемое финансирование производилось в полном объёме.
Спросите как этого получилось добиться? Очень просто. Бизнес подразделение, по заявке которого выполнялись работы оценило час простоя в 6 миллионов евро.
bang  (bang)
#
Добрый день
Судя по материалам инета поднимается новая волна по «непрерывности бизнеса»

А Есть ли
А) продуманная классификация инцидентов? Внешних и внутренних воздействующих факторов? Классификация Ит – рисков?
Б) методики оценки стоимости простоя Ит- систем, например, для универсального банка?
В) подходы к определению критичности системы? Оценки ее надежности?
?
Пока не будет вышеуказанного, подкрепленного внятным расчетом и анализом возврата инвестиций в бездну «непрерывность бизнеса» - эта тема так и останется рекламно \ пиарной.
Фразы «возьмите нас на подряд и усе будет» или «оплатите практический семинар и все узнаете» - уже многих «обожгли» и разочаровали.
Когда будет конкретика? Детальные примеры решений и качественные методические материалы, в том числе, ведущих интеграторов планеты?

Кстати, кто может поделиться ISO 22 301?
A A  (NC_)
#
Если поднимается волна, значит созданы необходимые и достаточные условия.
Могу предположить, что не малую роль в этом вопросе сыграло вступление в ВТО.
Александр Горшков  (technoserv)
#
Спасибо за конкретные вопросы.
Конечно, у нас имеется классификация инцидентов, их зависимость от внешних и внутренних факторов.
Что касается методики оценки стоимости простоя, то это более сложный вопрос.
Дело в том, что с этой методикой можно соглашаться, а можно не соглашаться.
И здесь каждый банк оценивает потери со своей точки зрения.
Если это будут выставленные потери для ИТ-подразделения, то подсчёты будут делаться по самой "хорошей" методики. Но если эту информацию надо будет передавать в ЦБ, то потери скорее всего окажутся минимальными. smile:)
Что касается "критичности" системы, то для каждого банка - это самостоятельная оценка.
Мне известны банки, которые контакт-центры считают критически важными системами. И я не могу с ними не согласиться. Если вы реально заинтересованы в проведении предобследования, то давайте обсудим это за рамками данного блога.
В блоге только поднимается тема, но решить задачу можно только при личном общении.
Комментарии и отзывы могут оставлять только зарегистрированные пользователи.
Авторизуйтесь или зарегистрируйтесь.

Популярные сообщения

FINAL CALL 11/16
15 ноября вышли данные по исполнению федерального бюджета за очередной месяц — октябрь. 1. В апреле — августе 2016 года из Резервного фонда изъяли
0
Как вернуть «тетрадочный» вклад?
Короткий ответ: показать документы о вкладе в банке-агенте. Длинный ответ. Наверное, уже практически все вкладчики знают, что во многих банках с
6
Венера в Козероге
Венера вошла в Знак Зодиака Козерог и пробудет здесь до 09 декабря. Вместо иллюзий и идеализма приходят сдержанность в проявлении чувств, строгость оценок
0
Рынок нефти 9 декабря
Нефть прибавляет в ожидании второй части сделки ОПЕК+. В субботу, 10 декабря, в Вене встретятся члены non-OPEC производителей, 14 стран участников рассмотрят
0

Новые сообщения

  • Рынок нефти 9 декабря
    Нефть прибавляет в ожидании второй части сделки ОПЕК+. В субботу, 10 декабря, в Вене встретятся члены non-OPEC производителей, 14 стран участников рассмотрят
  • Рынок нефти 6 декабря
    Ситуация на нефтяном рынке локально не изменилась. Brent консолидируется в районе $54/bbl на нейтральном новостном фоне. Оптимизм после заключения сделки
  • Рынок нефти 5 декабря
    Нефть торгуется в небольшом минусе, отступая от 16 месячных максимумов. Пауза в дальнейшем оптимизме на рынке сейчас выглядит вполне логично. Во-первых,
  • Как связаться с Агентством по страхованию вкладов?
    В разговорах, связанных с отзывом лицензий банков, часто возникает вопрос: как сообщить что-то АСВ, задать вопрос, пожаловаться и т.п. Ниже - справочник
  • Рынок нефти 1 декабря
    ОПЕК после почти годичных переговоров и восьми лет перерыва приняла решение о сокращении добычи нефти. Отдельным успехом для рынка в целом и картеля в