# 當 PVE Node 更換新的固定位置 IP 導致 Cluster 跑掉的暴力修復方法


# 簡介

有時候會有各種因素導致需要更改節點的配置,導致 Cluster 出現問題,這時候你可能嘗試各種方法導致修改了 Corosync Nodes 等等之類的相關設定檔案,這裡有一些暴力的解決方法提供大家參考


# 如果一開始你還沒有開始擅自進行修復

你可以參考他會簡單很多


# 如果你搞壞了一些檔案

如果 Node 不必要 大可以重灌再來

但有時候不行,對所以要更改成可以用的設定


# 從現有 Cluster 刪除已經更換配置的 Node

假設有三個 Node1/2/3

Node3 掛了

那我們可以從 Node1/2 進行設置把 Node3 踢掉

1
2
pvecm delnode node3 #刪除 Node3
rm -rf /etc/pve/nodes/node3 # 刪除 Node3 資訊(這步驟超重不然後面把 Node3 加入回 Cluster 會遇到資訊重複 無法加入的問題)

# 被刪除節點 離開 Cluster 刪除其餘節點資訊

進到 Node3 環境


# 離開 Cluster

1
2
3
4
5
service pve-cluster stop
service corosync stop
pmxcfs -l
rm -rf /etc/corosync/*
rm /etc/pve/corosync.conf

# 刪除節點已知主機 (Node1/2)

/etc/pve/priv/known_hosts

把裡面的非自身節點資訊刪除


# 將自己節點從 Cluster 分離成為獨立節點

1
2
3
killall pmxcfs
service pve-cluster start
service pveproxy restart

# 刪除其餘節點資訊

1
2
3
4
pvecm delnode node1 #刪除 Node1
rm -rf /etc/pve/nodes/node1 # 刪除 Node1 資訊(這步驟超重不然後面把 Node1 加入回 Cluster 會遇到資訊重複 無法加入的問題)
pvecm delnode node2 #刪除 Node2
rm -rf /etc/pve/nodes/node2 # 刪除 Node2 資訊(這步驟超重不然後面把 Node2 加入回 Cluster 會遇到資訊重複 無法加入的問題)

# 參考文章

  • 群集加入失败 此主机已包含虚拟客户机
  • [經驗分享] Proxmox VE 將節點由叢集分離出來為獨立節點
  • PVE 集群节点删除不干净问题处理