[改进后的中文总结内容]

会议纪要

会议主题:服务发现与高可用性(HA)讨论

参会人员:Ceph研发团队成员

会议日期:2022年3月22日

会议地点:视频会议

主要议题:

  1. 服务发现(Service Discovery)
    • 讨论在Ceph中添加新端点以支持服务发现的需求,希望通过HTTP从外部获取当前配置。
    • 现有端点URL在代码中硬编码,建议考虑服务发现层级,以便集群内部客户端更容易发现服务。
    • 挑战在于集群内的名称解析和IP硬编码问题,建议使用虚拟IP(VIP)或高可用性代理(HA Proxy)简化服务发现。
  2. Rook测试失败更新
    • Rook测试套件中出现的故障问题,决定移除未维护的编排器(Orchestrator)命令测试,以清理测试套件。
    • 后续行动:继续监控和更新该问题。
  3. 高可用性NFS(HA NFS)
    • 测试结果显示,NFS守护进程在节点离线后能够重新调度,但恢复时间较长(约1-2分钟)。
    • 建议:添加MDS到调度列表,优化心跳检测机制,探索使用代理进行更快速的心跳检测。
    • 未来工作:解决端口冲突问题以支持守护进程的共存。

决定事项:

  • 继续使用当前的服务发现方法,同时考虑长期改进方案。
  • 移除Rook测试套件中的未维护编排器命令测试。
  • 优化NFS和MDS的高可用性配置,特别是心跳检测和重新调度机制。

后续行动计划:

  • 继续监控和更新Rook测试失败问题。
  • 与Jeff Leighton讨论NFS和MDS的调度策略。
  • 探索使用代理进行更快速的心跳检测,并解决端口冲突问题。

会议结束:

会议于具体时间结束,下次会议预定于下周进行。