KoncepceMonitoringu2N
Úkol
Zprovoznit pro 2N interní monitoring klíčových prvků, nezávisle na našem monitoringu. Zatím platí, že notifikace a dashboard budou sledovat oni, my jen při pomoci na zavolání.
Spěchá to, do 20.11 2013 to musí být funkční a odladěné
Co potřebujeme od 2N
- přístupy na Linux servery, které se mají monitorovat
- přístupy na Windows servery (už máme domain admina, takže OK)
- upřesnit jak chtějí notifikace. předpokládám zatím emailem, tak jako máme my, viz dále
přístup do webového rozhraní Centreon:
http://90.182.112.138/centreon/index.php
admin Nagios87
Centreon pristupny ve VPN na http://10.0.99.100/centreon/main.php
uvt 1:99XG3ODc0dyFtA==
Přístup na SSH s Centreonem
root DsXoM3@
- jde o virtuální stroj ve Vmware, přístup na Vmware:
IP VMwaru: 10.0.99.254
login: uvt/TajneHeslo2N
IP Centreonu: 10.0.99.100/24 (nazev CENTREON2)
GW: 10.0.99.1
DNS1: 10.0.100.102
DNS2: 10.0.100.101
Co a kam instalovat:
Centreon 2.4.5 (do teď u nás používáme verzi 2.3.9, takže je to pro nás nové) – základní instalace je hotova
Nsclient 0.4.2
- do teď u nás používáme verzi 0.3.9, takže je to pro nás nové a mění se trochu syntaxe v nsclient.ini na Windowsech, a bude třeba to pro x checků změnit, ale s tím počítám
Monitorované prvky
v prvním kole chtějí nastavit monitoring asi 35 kritických serverů, dvou UPS a 4 vmware strojů, vyznačím, kterých se to týká
Šablony
Navrhuji strukturu:
Generic host
Ping
styl monitoringu 24x7, notifikace emailem 24x7, first notification delay 5-10 minut?, notification interval 0 (tj. přijde jen první notifikace, žádná další)
Linux generic host – prosím případně Martine o doplnění?
ssh
stav raidu
disk usage
paměť
cpu
apache
mysql
pgsql
ftp
dále dle služeb – apache, mysql, dns atd.
MS generic host
CPU
MEM
Uptime
Velikost všech partišen
Běh všech automaticky spuštěných služeb
Stáří certifikátu
Stav Winupdates
Stav zaloh (Veem a/nebo Windowsbackup)
Test obnovy zaloh – bude-li možný
DHCP
DNS
IIS
Má smysl rozlišovat šablony MS 2K3 a 2K8? Historicky jsme rozlišovali kvůli různým checkům pro winbackup/ntbackup, abychom na to nezapomněli?
MS Exchange
Store
System_attendant
Transport
Mail_Submission?
Velikost fronty
Velikost databáze?
Chunking?
IMAP?
Email delivery? (nevím jestli by šlo dělat od nás, oni mají firewall Fortigate)
MS SQL server
MS SQL
MS SQL Agent
- další checky SQL serveru podle domluvy, částečně zkoumal Petr Mikeš
MS Ostatní – jednotlivé checky
Stav raidů?
Stav plánovaných úloh
Další služby, budou-li na daném serveru třeba, mají třeba FTP
UPS
Vmware ESX
dělat až na konec, koukal jsem, že lze monitorovat jak hostitele, tak hostované virtuály
CPU
paměť
síťová zátěž
zátěž disků
check hostitelského hardware
obecné zdraví vmfs datastore
velikost snapshotů
stav vSphere HA agenta