397 liens privés
Tuto sur 'smartd' (paquet 'smartmontools') pour monitorer les disques et être alerté par mail en cas de défaillance. Pour ma part je délègue le travail à 'munin' qui lance des commandes 'smartctl' régulièrement via cron.
Pour mon RAID hard de 2 disques HP en SATA, je fais lancer ces 2 commandes pour chacun des disques:
smartctl /dev/sda -a -d cciss,0
smartctl /dev/sda -a -d cciss,1
un autre article qui explique la bourde BGP d'hier, qui a paralysé une partie de l'internet mondial pendant au moins 2h.
et avec des GIF animés :)
tester la fiabilité, résilience et persistence d'une infra distribuée
Un howto qui explique comment gèrer la crise dans le cas d'un cluster consul down.
Méthode de résolution pas très rapide car il s'agit de trouver quels nodes sont down.
Ma méthode crade/rapide à l'aide de saltstack:
"""
salt * cmd.run 'rm -v /var/cache/consul/raft/peers.json'
salt * service.restart consul
"""