Ceph OSD ordentlich aus einem produktiven Cluster entfernen

In einem produktiven Cluster kann die Entfernung von OSDs oder ganzen Hosts, je nach Last die regulären Operationen für die Nutzer beeinflußen.
Deshalb entpfiehlt sich zum Beispiel eine OSD oder einen Host schrittweise aus dem produktien Betrieb zu nehmen, um die volle Replikation über den ganzen Prozess sicherzustellen.

Manuell könnte man die Befehle schrittweise ausführen und immer warten bis die Daten komplett im Cluster neu verteilt sind.

ceph osd crush reweight osd.<ID> 1.0
ceph osd crush reweight osd.<ID> 8.0
ceph osd crush reweight osd.<ID> 6.0
ceph osd crush reweight osd.<ID> 4.0
ceph osd crush reweight osd.<ID> 2.0
ceph osd crush reweight osd.<ID> 0.0

Zur Automatisierung haben wir ein eigenes Script vor Jahren geschrieben, sollte also auch mit früheren Versionen, wie Hammer, Jewel, Kraken und Luminous funktionieren.

ceph osd out <ID>
INITV: service ceph stop osd.<ID>
SYSTEMD: systemctl stop ceph-osd@<ID>
ceph osd crush remove osd.<ID>
ceph auth del osd.<ID>
ceph osd rm <ID>

Achtung beim Löschen von Elementen aus der CRUSHMAP fängt der Ceph Cluster an die Verteilung wieder auszugleichen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

88 − = 82