Мониторинг активного сетевого оборудования средствами The Dude. Part1. Установка и настройка
По долгу службы много и плотно работаю с активным сетевым оборудованием. В частности, одна из задач — мониторинг >7000 устройств различных вендоров: Cisco, Juniper, D-Link, Huawei, Edge-core, etc.
У каждой компании, имеющей в своем арсенале парк серверов + активное сетевое оборудование стоит задача отслеживать его работоспособность, минимизировать время простоя при аварии и решать прочие моменты. Помимо хорошего сетевого инженера, а если компания большая, то и СПД, нужен удобный инструмент для автоматического траблшутинга большинства стандартных проблем и их решения, эскалации.
В связи с этим, хочу рассказать вам (А возможно и начать цикл статей, если хабрасообщество одобрит) о бесплатном и полнофункциональном решении для мониторинга от компании Mikrotik — The Dude. Или как ее называют в русскоязычном сегменте — Дуда.
Какие задачи могут выполняться посредством The Dude? Да любые, которые подразумевают под собой мониторинг и траблшутинг оборудования. Это могут быть обычные win и nix хосты, сервера, оргтехника, коммутаторы, рутеры… Список можно продолжать бесконечно. Мониторинг сервисов согласно SLA, если вы (I)SP? Не вопрос! Оповещение по почте, или SMS? Тоже не проблема. Обычный ICMP-поллинг, или алгоритмы, направленные на выявление какой-то особой проблемы? Не вопрос.
Основные возможности
- ICMP-polling
- TCP/UDP-polling
- Syslog-server
- Syslog-sender
- SNMP-polling
- Карты сети
- Распределенный мониторинг
- Встроенный язык для написания функций опроса
- Запуск программ на удаленной машине с передачей контекстных параметров.
Почему не Nagios, Zabbix, NetView, Cacti, или Enterprise решение? (как пример — Equipment Manager от компании Orange Systems).
Простота первоначальной настройки, интуитивный интерфейс, минимум временнЫх и денежных затрат на внедрение(для офиса в полсотни компов и пары-тройки коммутаторов затраты вообще минимальны как по времени, так и по деньгам), кроссплатформа, расширяемый функционал, масштабируемость, типизация устройств на основе автоопроса и нетребовательность к ресурсам. Для сетки в 200-300 устройств будет достаточно p3-800MHz 512Mb RAM.
В качестве примера приведу случай из жизни:
Физически вышел из строя сервер с TheDude, который мониторил 2 с лишним тысячи устройств. За 10(!) минут был развернут бекап на моей виртуальной машине с Win2k, ограниченной 512Mb оперативной памяти и дежурные службы, после того как перебили IP в клиенте, продолжили работу в штатном режиме до момента восстановления (~4ч).
Сервер даже не подтормаживал.
Установка:
Поддерживаемые ОС
- Windows(клиент, сервер)
- RouterOS(сервер). Это также означает, что TheDude устанавливается на RouterBoard’ы
- Linux(клиент, сервер). Только через wine. Работу из под wine в качестве сервера не тестировал, но он запускается и поллит. Если кому-то интересно, могу протестировать и предоставить подробный отчет.
Последовательность действий при установке:
Для начала скачиваем бинарник для нашей платформы на оффсайте
- RouterOS:
Я рассмотрю здесь вариант, когда у нас нет машины с windows, чтобы для установки пакета на RouterOS воспользоваться графической утилитой winbox. Она, конечно, работает под wine, но не дает возможности из под wine установить пакет на RouterOS. Воспользуемся для этого SCP и RouterOS CLI.Копируем .npk в корень(sic!) сервера с RouterOS
your.comp>scp path/to/binary/dude.npk admin@dude.server:/
После завершения копирования коннектимся на сервер и смотрим есть-ли файл.
your.comp>ssh admin@dude.server
[admin@dude]> file print
# NAME TYPE SIZE CREATION-TIME
0 dude.npk ... ... ...
Увидев что он есть — ребутаем сервер, он автоматически установит пакет перед ребутом.
[admin@dude]> system reboot
Y/N
Installing package dude.npk
[####################]
connection closed.
Опять заходим на сервер, проверяем, нормально-ли он установился и создалось-ли хранилище данных, активно-ли оно.
your.comp>ssh admin@dude.server
[admin@dude]>system package print
# NAME VERSION SCHEDULED
0 dude ...
[admin@dude]>store print
# NAME TYPE DISK STATUS
0 dude dude ... active
После этого смело коннектимся к серверу из клиента и приступаем к конфигурации. При первом запуске будет предложено просканировать сеть на предмет устройств. - WINDOWS:
Запускаем бинарник и устанавливаем в нужную нам директорию. В диалоге конфигурации обязательно отмечаем чекбоксом Server Files.
Запускаем PATH_TO_DUDE/dude.exe
PROFIT! Сервер запущен и вы автоматически попадаете клиентом в режиме «local» к конфигурации The Dude. При первом запуске предлагается просканировать сеть в которой вы находитесь на предмет устройств (icmp, snmp, netbios, dns). При первом запуске демон прописывается в автозагрузку. После ребута запускать клиент уже не обязательно. - LINUX:
Все то же самое, за исключением того, что все действо совершается из под wine и демон в автозагрузку не прописывается.
Основные настройки (Глобальные)
Когда мы установили наш сервер с The Dude — нам его нужно настроить.
Для этого в клиенте есть кнопка… Правильно, «Настройки».
Вкладки:
- Общий
Здесь указываются DNS сервера, которые могут/будут резолвить адреса устройств, а так же SMTP-сервер, через который будут посылаться оповещения о событиях, при необходимости - SNMP
Здесь мы указываем профили SNMP, с помощью которых будут поллится наши устройства. Профиль включает комьюнити, порт и версию - Опроc
Настройки поллинга устройств (интервал, таймаут, количество циклов), настройки оповещений, логирования при изменении статуса сервиса, повешенного на устройство( для заббикса аналогом будет «триггер») - Сервер
Здесь мы конфигурим файрволл. Также здесь включается WEB-интерфейс мониторинга, натраивается время обновления информации в нем, таймаут сессии, указывается SSL-сертификат. - Агенты
Распределенный мониторинг. В качестве агента указывается Dude-сервер с такой же версией, как и настраиваемый. - Syslog
Здесь все банально. настройка syslog-сервера. - Карта
Настройка визуального отображения объектов (размер, шрифт, форма, время обновления текстовой информации, цвет). - Диаграмма
Настройка RDD-хранилища и цветов на графиках - Отчет
- Обнаружение
Настройка автообнаружения и расположения устройств на карте в автоматическом режиме - RouterOS
Настройки сессий для устройств на базе RouterOS, находящихся на мониторинге в The Dude - Разное
Здесь находятся настройки коммита в базу, прыжков отмены, определение вендора по найденному маку, интервал сканирования мак-адресов устройств.
Wiki: http://wiki.mikrotik.com/wiki/Main_Page
Forum: http://forum.mikrotik.com/index.php
IP демо-сервера 159.148.147.209
Тип коннекта: Защищенный
Логин: admin