Оптимизация ИТ-инфраструктуры: отрезать или оставить?

Оптимизация в компании – всегда вопрос насущный. Когда же речь заходит об ИТ-инфраструктуре, удачная оптимизация может сэкономить компании десятки тысяч долларов. При этом решение подобных задач не обязательно означает затягивание пояса потуже и отрезание всех «лишних» функций. Как именно оптимизировать затраты и ресурсы, какими методами воспользоваться, говорили на CNews Forum Кейсы, в секции «Оптимизация ИТ-инфраструктуры».

страницы:

Петр Филатов: Всегда приходится искать компромисс между ценой и надежностью

О том, как обеспечить надежность ИТ-инфраструктуры и при этом не слишком увеличить затраты, рассказал Петр Филатов, коммерческий директор Oberon.

CNews: Как сократить затраты на ИТ-инфраструктуру и обеспечить при этом ее надежность?

Петр Филатов: Вопрос сокращения затрат на ИТ-инфраструктуру как никакой другой вызывает большое количество споров, поскольку подобные меры могут привести к ухудшению качества, контролируемости, и, возможно, финансовым и имиджевым потерям. Поэтому лучше говорить об оптимизации затрат, эффективное перераспределение которых способно сохранить высокий уровень надежности ИТ-инфраструктуры. Например, одним из очевидных ответов на вопрос, как оптимизировать затраты на ИТ, является переход к облачным сервисам. И если не забывать о необходимости разносить ресурсы по географически распределенным площадкам, в таком случае ты снимаешь с себя риски и защищаешься правильно составленным SLA c оператором, а затраты переходят из CAPEX в OPEX. Облако может быть надежным при правильном подходе.

И все же хочется сказать не про сокращения затрат, а про сохранность бизнеса и инвестиций. Последствия аварии или простоя ключевого бизнес-процесса могут сказаться на финансовых показателях компании здесь и сейчас или привести к серьезным потерям в будущем. Наиболее важным, на мой взгляд, является возможность предотвращения или минимизации рисков возникновения критических ситуаций. Обеспечить эту возможность могут современные проактивные системы мониторинга ИТ и инженерной инфраструктуры. Сегодня как никогда раньше значимость информационных активов для современных организаций велика, а системы мониторинга сфокусированы на раннем выявлении возможных проблем и предотвращении их негативного влияния на бизнес. Рынок предлагает широкий выбор технологических решений, которые можно грамотно и экспертно подобрать в соответствии с требованиями любой компании.

CNews: Какие решения предлагает рынок?

Петр Филатов: Это, в первую очередь, современные системы мониторинга, которые можно разделить на несколько групп. Самые распространенные системы – это системы класса Service Desk, основными задачами которого является повышение эффективности работы ИТ-подразделений и качества ИТ-сервисов.

Существуют системы управления неисправностями (Fault Management), которые предоставляют инструмент для фиксации и локализации источника проблемы и оповещения персонала службы эксплуатации об имеющихся сбоях и отказах в режиме реального времени.

Есть системы управления производительностью (Performance Management), с помощью которых можно выявить возможную проблему до момента сбоя, спрогнозировать загрузку оборудования и каналов передачи данных, отслеживать поток сетевого трафика, а также планировать расширение мощностей.

Системы Service Assurance (управление качеством обслуживания) являются комбинацией систем Fault Management и Performance Management с дополнительными механизмами сквозного тестирования производительности. Они позволяют отслеживать качество предоставляемых услуг, основываясь на SLA.

И, наконец, зонтичные системы мониторинга. Они внедряются с целью отслеживания состояния всех бизнес-приложений и предоставления заказчику целостной картины состояния ИТ-сервисов. В число функций зонтичных систем мониторинга входит формирование отчетности с необходимым уровнем детализации, ведение статистики и оперативный анализ соответствия ИТ-сервисов актуальным потребностям бизнеса.

Отдельно хочется остановиться на системах класса DCIM (Data Center Infrastructure Management) – это общее название класса технологических решений, которые призваны повысить эффективность работы Центров обработки данных. Фактически DCIM позволяет в режиме реально времени отслеживать все основные параметры работы ключевых систем дата-центра: электроснабжение, климат, сети и прочее. А в случае нештатных ситуаций быстро локализовать проблему и восстановить работоспособность системы. Для ЦОДа, обеспечивающего работоспособность, скажем, крупного контакт-центра или банка, даже минутный простой может повлечь за собой серьезные финансовые потери.

CNews: Приведите конкретный пример эффективности использования такого решения.

Петр Филатов: Неоднократно проверенная зарубежным и российским опытом технология минимизации рисков простоя, а также управления и контроля над эффективностью распределения ИТ-ресурсов в режиме реального времени, ежегодно привлекает все большее количество компаний. У нас был интересный кейс с одним из российских банков, перед которым стояла задача не только не допустить простоя сервиса, но также, в связи с постоянным ростом объемов обрабатываемых данных, максимально использовать существующие инфраструктурные мощности в трех территориально-распределенных ЦОДах. В результате было создано комплексное решение централизованного мониторинга показателей работоспособности и потенциальных угроз для ИТ и инженерных систем по всем 3 площадкам.

Используя эту технологию внутренние службы банка в режиме реального времени контролируют показатели электропотребления, состояние климатических систем и ИБП, распределение температурных зон для своевременного выявления эксплуатационных нарушений. Автоматизация процесса планирования и управления ресурсами ЦОДов по заданным параметрам полностью исключает непродуктивное использование мощностей (в данном кейсе это были физическое место в стойках и вес оборудования, электропитание ЦОД и серверных шкафов, показатели охлаждения и другие). Функциональная особенность системы позволяет графически визуализировать состояние компонентов инфраструктуры – заполнения оборудования, учет свободных мест, ведения карты размещения и многое другое.

Сразу после запуска решения в промышленную эксплуатацию были выявлены: критическая перегрузка на пультах дистанционного управления (ПДУ) в 10 шкафах, перекос подключения оборудования в пределах 1-й ПДУ в 18 единицах оборудования, 112 устройств, подключенных одним блоком питания. А вовремя выявленные проблемы в компонентах инфраструктуры позволили специалистам банка оперативно отреагировать на угрозы, которые могли повлечь за собой как технические, так и финансовые или репутационные потери.

Таким образом, на мой взгляд, задумываться над оптимизацией затрат на ИТ, конечно, надо, и сейчас есть решения, которые способны сократить затраты на ИТ-инфраструктуру. Но всегда стоит помнить, что, скорее всего, придется искать компромисс между ценой и надежностью.

Но что нужно обязательно делать, так это использовать современные решения, которые позволят предотвратить или предупредить о возможных негативных сценариях. И бизнес скажет вам спасибо.



страницы: