Мониторинг активного сетевого оборудования средствами The Dude. Part1. Установка и настройка

8 февраля 2011 г.

По долгу службы много и плотно работаю с активным сетевым оборудованием. В частности, одна из задач — мониторинг >7000 устройств различных вендоров: Cisco, Juniper, D-Link, Huawei, Edge-core, etc.

У каждой компании, имеющей в своем арсенале парк серверов + активное сетевое оборудование стоит задача отслеживать его работоспособность, минимизировать время простоя при аварии и решать прочие моменты. Помимо хорошего сетевого инженера, а если компания большая, то и СПД, нужен удобный инструмент для автоматического траблшутинга большинства стандартных проблем и их решения, эскалации.

Логотип MikrotikВ связи с этим, хочу рассказать вам (А возможно и начать цикл статей, если хабрасообщество одобрит) о бесплатном и полнофункциональном решении для мониторинга от компании Mikrotik — The Dude. Или как ее называют в русскоязычном сегменте — Дуда.

Какие задачи могут выполняться посредством The Dude? Да любые, которые подразумевают под собой мониторинг и траблшутинг оборудования. Это могут быть обычные win и nix хосты, сервера, оргтехника, коммутаторы, рутеры… Список можно продолжать бесконечно. Мониторинг сервисов согласно SLA, если вы (I)SP? Не вопрос! Оповещение по почте, или SMS? Тоже не проблема. Обычный ICMP-поллинг, или алгоритмы, направленные на выявление какой-то особой проблемы? Не вопрос.

Основные возможности

  • ICMP-polling
  • TCP/UDP-polling
  • Syslog-server
  • Syslog-sender
  • SNMP-polling
  • Карты сети
  • Распределенный мониторинг
  • Встроенный язык для написания функций опроса
  • Запуск программ на удаленной машине с передачей контекстных параметров.


Почему не Nagios, Zabbix, NetView, Cacti, или Enterprise решение? (как пример — Equipment Manager от компании Orange Systems).

Простота первоначальной настройки, интуитивный интерфейс, минимум временнЫх и денежных затрат на внедрение(для офиса в полсотни компов и пары-тройки коммутаторов затраты вообще минимальны как по времени, так и по деньгам), кроссплатформа, расширяемый функционал, масштабируемость, типизация устройств на основе автоопроса и нетребовательность к ресурсам. Для сетки в 200-300 устройств будет достаточно p3-800MHz 512Mb RAM.

В качестве примера приведу случай из жизни:
Физически вышел из строя сервер с TheDude, который мониторил 2 с лишним тысячи устройств. За 10(!) минут был развернут бекап на моей виртуальной машине с Win2k, ограниченной 512Mb оперативной памяти и дежурные службы, после того как перебили IP в клиенте, продолжили работу в штатном режиме до момента восстановления (~4ч).
Сервер даже не подтормаживал.

Установка:

Поддерживаемые ОС

  • Windows(клиент, сервер)
  • RouterOS(сервер). Это также означает, что TheDude устанавливается на RouterBoard’ы
  • Linux(клиент, сервер). Только через wine. Работу из под wine в качестве сервера не тестировал, но он запускается и поллит. Если кому-то интересно, могу протестировать и предоставить подробный отчет.

Последовательность действий при установке:

Для начала скачиваем бинарник для нашей платформы на оффсайте

  • RouterOS:
    Я рассмотрю здесь вариант, когда у нас нет машины с windows, чтобы для установки пакета на RouterOS воспользоваться графической утилитой winbox. Она, конечно, работает под wine, но не дает возможности из под wine установить пакет на RouterOS. Воспользуемся для этого SCP и RouterOS CLI.Копируем .npk в корень(sic!) сервера с RouterOS
    your.comp>scp path/to/binary/dude.npk admin@dude.server:/
    После завершения копирования коннектимся на сервер и смотрим есть-ли файл.
    your.comp>ssh admin@dude.server
    [admin@dude]> file print
    # NAME TYPE SIZE CREATION-TIME
    0 dude.npk ... ... ...

    Увидев что он есть — ребутаем сервер, он автоматически установит пакет перед ребутом.
    [admin@dude]> system reboot
    Y/N
    Installing package dude.npk
    [####################]
    connection closed.

    Опять заходим на сервер, проверяем, нормально-ли он установился и создалось-ли хранилище данных, активно-ли оно.
    your.comp>ssh admin@dude.server
    [admin@dude]>system package print
    # NAME VERSION SCHEDULED
    0 dude ...
    [admin@dude]>store print
    # NAME TYPE DISK STATUS
    0 dude dude ... active

    После этого смело коннектимся к серверу из клиента и приступаем к конфигурации. При первом запуске будет предложено просканировать сеть на предмет устройств.
  • WINDOWS:
    Запускаем бинарник и устанавливаем в нужную нам директорию. В диалоге конфигурации обязательно отмечаем чекбоксом Server Files.
    Запускаем PATH_TO_DUDE/dude.exe
    PROFIT! Сервер запущен и вы автоматически попадаете клиентом в режиме «local» к конфигурации The Dude. При первом запуске предлагается просканировать сеть в которой вы находитесь на предмет устройств (icmp, snmp, netbios, dns). При первом запуске демон прописывается в автозагрузку. После ребута запускать клиент уже не обязательно.
  • LINUX:
    Все то же самое, за исключением того, что все действо совершается из под wine и демон в автозагрузку не прописывается.

Основные настройки (Глобальные)

Когда мы установили наш сервер с The Dude — нам его нужно настроить.
Для этого в клиенте есть кнопка… Правильно, «Настройки».
Скриншот The Dude
Вкладки:

  • Общий
    Здесь указываются DNS сервера, которые могут/будут резолвить адреса устройств, а так же SMTP-сервер, через который будут посылаться оповещения о событиях, при необходимости
  • SNMP
    Здесь мы указываем профили SNMP, с помощью которых будут поллится наши устройства. Профиль включает комьюнити, порт и версию
  • Опроc
    Настройки поллинга устройств (интервал, таймаут, количество циклов), настройки оповещений, логирования при изменении статуса сервиса, повешенного на устройство( для заббикса аналогом будет «триггер»)
  • Сервер
    Здесь мы конфигурим файрволл. Также здесь включается WEB-интерфейс мониторинга, натраивается время обновления информации в нем, таймаут сессии, указывается SSL-сертификат.
  • Агенты
    Распределенный мониторинг. В качестве агента указывается Dude-сервер с такой же версией, как и настраиваемый.
  • Syslog
    Здесь все банально. настройка syslog-сервера.
  • Карта
    Настройка визуального отображения объектов (размер, шрифт, форма, время обновления текстовой информации, цвет).
  • Диаграмма
    Настройка RDD-хранилища и цветов на графиках
  • Отчет
  • Обнаружение
    Настройка автообнаружения и расположения устройств на карте в автоматическом режиме
  • RouterOS
    Настройки сессий для устройств на базе RouterOS, находящихся на мониторинге в The Dude
  • Разное
    Здесь находятся настройки коммита в базу, прыжков отмены, определение вендора по найденному маку, интервал сканирования мак-адресов устройств.

Wiki: http://wiki.mikrotik.com/wiki/Main_Page
Forum: http://forum.mikrotik.com/index.php

IP демо-сервера 159.148.147.209
Тип коннекта: Защищенный
Логин: admin

Теги: рубрика Linux, Windows
  • Похожие статьи
  • Предыдущие из рубрики