Q:
Як компанії максимально збільшують час роботи?
A:Очевидно важливим є підтримка роботи ІТ-служб. Виробники систем багато роздумували над цим питанням. Деякі критичні фінансові комп’ютери працюють протягом багатьох років безперервно. В Інтернеті є історія про комп'ютер Novell Netware 3, який був остаточно закритий через 16 років. Враховуючи час роботи в мережі, стандарт призначений для "П'яти 9" або 99, 999% доступності. Досягнення максимального часу роботи є важливим фактором для будь-яких пропозицій ІТ-послуг.
Як досягається максимальний час роботи? Гарне управління - це ключ. Міжнародна організація зі стандартизації (ISO) створила структуру для управління мережею під назвою FCAPS, яка розшифровується як:
- Усунення несправностей
- Управління конфігурацією
- Управління бухгалтерським обліком
- Управління продуктивністю
- Управління безпекою
Проблеми з окремими мережевими компонентами вирішуються як ініціативно, так і реактивно за допомогою цієї моделі. Несправності відстежуються за допомогою сигналів тривоги та сповіщень про події. Вони збираються агентами таких протоколів, як SNMP (протокол управління системною мережею) або деякі інші фірмові рішення. Налаштовані пороги можуть викликати тривогу і навіть автоматично генерувати квитки, які опиняються в черзі персоналу моніторингу в центрах обробки даних. Великі несучі мережі можуть мати окремі відділи для роботи з основним, розподільним або доступним рівнями мережі. Аналіз кореневої причини намагається виділити та визначити критичні проблеми після великої події.
Подібні процеси використовуються для управління системою. Постачальники Інтернет-послуг (ISP) та керовані хостингові центри використовують системних адміністраторів для контролю та управління життєздатністю серверів, систем зберігання даних або інших пристроїв. Наприклад, окремі процеси на машинах Windows або Linux можна переглядати та контролювати через програми управління графічним інтерфейсом користувача (GUI) так само, як і мережеві протоколи.
Віддалене спостереження та конфігурація мережевих компонентів та систем забезпечують можливість реального часу для максимального збільшення часу роботи системи. Це поширюється на зміни конфігурації, збір основних показників продуктивності або вдосконалення безпеки.
Один із способів переглянути тривалість роботи та надійність будь-якої системи - це модель, яку IBM назвав RAS: надійність, доступність та зручність роботи. Для забезпечення РАН було розроблено багато методів. До них відносяться надмірність, резервне копіювання даних, джерело безперебійного живлення (ДБЖ), компоненти з гарячою заміною та автоматичні оновлення. Заплановані зміни та вікна технічного обслуговування пропонують можливість виправити або вдосконалити відомі проблеми, не заважаючи користувачеві.
Врешті системи та мережі вийдуть з ладу. Надлишок - один із ключів до стійкості системи. Це може стосуватися обладнання, програмного забезпечення або даних. Особи, відповідальні за забезпечення надійності в мережевій або програмній системі, шукатимуть те, що може вважатися єдиним пунктом відмови (SPOF). Чи протікає вся мережа через один комутатор або кабель? Чи всі процеси відбуваються на самотньому сервері? Чи є лише одна копія критичного набору даних? Без надмірності компанія може за мить втратити те, що може знадобитися років для розвитку.
Максимізація тривалості тривалості роботи - це «все вищезазначене». Передовий досвід був розроблений за допомогою десятиліття досвіду та співпраці. Постійно впроваджуються нові рішення, такі як мережі самолікування, віртуалізація, аналітика даних та вдосконалена архітектура. Жоден єдиний метод не дасть відповіді на всі питання, що виникають у складних системах. Кожна компанія намагається якомога ефективніше використовувати свої ІТ-ресурси в межах життєвого циклу обладнання, яке є в її розпорядженні.