Rancher2.0.4集群中添加agent失败,日志显示No such container: kubelet

我有两台客户端服务器,客户端a和客户端b

新建一个custom集群之后,无论首次添加客户端a或者b,都能添加成功

但是添加一台之后添加第二台,就失败了,服务器没看到第二台客户端的注册信息

在添加失败的客户端服务器上查看运行的docker进程,显示启动了两个agent容器:

CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
3a995bda6150 rancher/rancher-agent:v2.0.4 “run.sh – share-r…” About a minute ago Up About a minute share-mnt
4a97ee0d246e rancher/rancher-agent:v2.0.4 “run.sh --server h…” About a minute ago Up About a minute jolly_wilson


share-mnt的日志:

Error response from daemon: {“message”:“No such container: kubelet”}
Error: failed to start containers: kubelet


jolly_wilson的日志:

-----END CERTIFICATE-----
time=“2018-08-06T02:48:31Z” level=info msg=“Option customConfig=map[address:10.12.50.27 internalAddress: roles:[etcd worker controlplane] label:map[ip:10 12.50.27:]]”
time=“2018-08-06T02:48:31Z” level=info msg=“Option etcd=true”
time=“2018-08-06T02:48:31Z” level=info msg=“Option controlPlane=true”
time=“2018-08-06T02:48:31Z” level=info msg=“Option worker=true”
time=“2018-08-06T02:48:31Z” level=info msg=“Option requestedHostname=ubuntu”
time=“2018-08-06T02:48:31Z” level=info msg=“Connecting to wss://10.12.7.204/v3/connect/register with token 9pcj4dzg6h6qpvxqth4f4g5sfjp5nfsxmnfd86zc92zrklqrf66qh6”
time=“2018-08-06T02:48:31Z” level=info msg=“Connecting to proxy” url=“wss://10.12.7.204/v3/connect/register”
time=“2018-08-06T02:48:31Z” level=info msg=“Starting plan monitor”


之前用的版本是2.0.0,没遇到这个问题,上周升级到2.0.4,新增客户端就一直没成功


请问有大神知道是什么原因引起的吗?

已邀请:

ezioabc

赞同来自: quguiliang

已解决


两台agent服务器的hostname一样的原因


以前2.0.0布置时候添加的服务器都是重命名过的

在没看这个帖子前我也遇到了,当时两台机器的hostname也都是localhost,后来修改是好了

我创建集群失败,就卡在这里[etcd] Successfully started etcd plane.. Checking etcd cluster health

也不知道怎么看日志,求助一下

要回复问题请先登录注册