Proxmox Ceph Fehlerbehebung

Problem:

Im Proxmox Ceph Dasboard wird fongedes angezeigt

Die OSDs sind alle Up und In.

Lösung:

in der Shell aller Clusterknoten folgenden Befehl ausrühren

ceph osd repair all

Danach muss gewartet werden bis die Befehle ausgeführt wurden. Das kann, je nach größe, ein paar Stunden dauern. In meinem Fall, bei 2TB NVME, waren das ca. 2 Stunden.

Nachdem dieser Schritt ausgeführt wurde, sollte der Ceph-Storage wieder OK sein.

Wenn das nicht der Fall ist und folgender Fehler plötzlich im Ceph-Dasboard steht:

oder auf der Konsole wenn man den folgenden Befehl eingibt:

ceph health detail
[WRN] OSD_TOO_MANY_REPAIRS: Too many repaired reads on 2 OSDs
    osd.0 had 48 reads repaired
    osd.1 had 19 reads repaired

kann das Folgende helfen.

Bei mir half, die SSD einfach neu zu starten.

Die osd wird nicht sofort wieder gestartet sein, habt etwas Geduld. Nach da 3 – 4 Minuten sind dann alle wieder Online.

Hinweis:
Startet eine OSD nach der anderen und wartet bis die OSD, die ihr zuletzt neu gestartet habt, wieder da ist.