排错杂记（pod error）

尝试排错

起因是拉起某个pod的时候持续不断的错误边拉边寄，显示的不是image问题。

尝试describe一下，发现调度，拉取，创建，启动似乎都正常

这个时候就得去看日志kubectl log一下，

？？？timeout？？？kubectl 正常能get不至于访问不到api，api是包正常的。

那就是网络问题，先看一下插件，插件也正常。

再看DNS，似乎有点问题，丢了master3的conredns？？？

但是查询后这个pod的是属于master1的pod所以不是dns的问题，缺一个的问题后面再解决。
按着尝试手动再吃连接api服务器,草pod fail了，所以用不了，先标记

kubectl exec -it kcollie-pre-hook-install-crds-bdb4g -n kcollie-system -- /bin/sh
curl -k https://10.233.0.1:433

再check一下kube-system的pod

md草了，有屎啊，节点二怎么就timeout了，相继的节点一三也爆屎了。

看一下节点情况，感觉可以rollout整个kube-system，完蛋，怎么查个pod状态，查到整个kube崩了

直接rollout所有

# 重启所有 Deployments
for deployment in $(kubectl get deployments -n kube-system -o jsonpath='{.items[*].metadata.name}'); do
  kubectl rollout restart deployment $deployment -n kube-system
done

# 重启所有 StatefulSets
for statefulset in $(kubectl get statefulsets -n kube-system -o jsonpath='{.items[*].metadata.name}'); do
  kubectl rollout restart statefulset $statefulset -n kube-system
done

# 重启所有 DaemonSets
for daemonset in $(kubectl get daemonsets -n kube-system -o jsonpath='{.items[*].metadata.name}'); do
  kubectl rollout restart daemonset $daemonset -n kube-system
done