15.8启动失败策略

当一个服务在某节点上启动失败一次或若干次后,将按照启动失败策略进行处置。启动失败策略包括设置在同一节点的重启次数,以及转移到其他节点继续启动之前的重启次数。该策略的目标是避免共享资源临时不可用导致的启动失败。例如,由于网络问题,共享存储在某个节点上暂时不可用,但在其他节点仍然可以正常访问,转移到其他节点运行的策略将允许该资源继续运行。 对每一个服务,都有两个服务启动恢复策略参数可以配置:

  • max_restart

    当前节点上重启失败服务的最大尝试次数。默认为1。

  • max_relocate

    在把服务转移到其他节点继续运行之前尝试重启失败服务的最大次数。只有在当前节点尝试重启次数超过max_relocate后,才会把服务转移到其他节点。默认为1。

注意: 当服务启动成功后,转移计数器会被重置为0。也就是说,如果未能排除故障,服务继续重启,只有重启策略反复生效。