Djeps submitter nuove scritture "che ho usato per ottenere un certo grado di risoluzione dei problemi con gli script automatici Event Handler Nagios e RabbitMQ, ma Facebook ha fatto su una scala molto più ampia rispetto al mio passato di amministratore di sistema quotazioni:. 'Quando l'infrastruttura è la dimensione della Facebook, ci sono sempre i server rotti e pezzi di software che sono scesi o sono in genere comportano male. Nella maggior parte dei casi, i nostri sistemi sono progettati in modo tale che questi problemi causano poco o nessun impatto per le persone che utilizzano il sito. Ma a volte le interruzioni piccola può diventare più grande interruzioni, errori causando scarse prestazioni o sul sito. Se un pezzo di software o hardware rotto ha influenza sul sito, quindi è importante che noi lo riparare o sostituire il più velocemente possibile. ... Abbiamo dovuto trovare un metodo automatico per gestire questo tipo di problemi in modo che gli ingegneri umana potrebbe concentrarsi sulla soluzione e prevenire il più grande, interruzioni più complesso. Così, ho iniziato a scrivere gli script quando ho avuto il tempo per automatizzare le correzioni per vari tipi di server rotti e pezzi di software '".
Per saperne di più di questa storia a Slashdot.
Nessun commento:
Posta un commento