[改进后的中文总结内容]
会议纪要
会议主题:服务发现与高可用性(HA)讨论
参会人员:Ceph研发团队成员
会议日期:2022年3月22日
会议地点:视频会议
主要议题:
- 服务发现(Service Discovery)
- 讨论在Ceph中添加新端点以支持服务发现的需求,希望通过HTTP从外部获取当前配置。
- 现有端点URL在代码中硬编码,建议考虑服务发现层级,以便集群内部客户端更容易发现服务。
- 挑战在于集群内的名称解析和IP硬编码问题,建议使用虚拟IP(VIP)或高可用性代理(HA Proxy)简化服务发现。
- Rook测试失败更新
- Rook测试套件中出现的故障问题,决定移除未维护的编排器(Orchestrator)命令测试,以清理测试套件。
- 后续行动:继续监控和更新该问题。
- 高可用性NFS(HA NFS)
- 测试结果显示,NFS守护进程在节点离线后能够重新调度,但恢复时间较长(约1-2分钟)。
- 建议:添加MDS到调度列表,优化心跳检测机制,探索使用代理进行更快速的心跳检测。
- 未来工作:解决端口冲突问题以支持守护进程的共存。
决定事项:
- 继续使用当前的服务发现方法,同时考虑长期改进方案。
- 移除Rook测试套件中的未维护编排器命令测试。
- 优化NFS和MDS的高可用性配置,特别是心跳检测和重新调度机制。
后续行动计划:
- 继续监控和更新Rook测试失败问题。
- 与Jeff Leighton讨论NFS和MDS的调度策略。
- 探索使用代理进行更快速的心跳检测,并解决端口冲突问题。
会议结束:
会议于具体时间结束,下次会议预定于下周进行。