[改进后的中文总结内容]

在2022年2月7日的Ceph Orchestrator会议中,Ceph研发团队成员讨论了与Ceph升级相关的问题,并提出了改进方案。

主要议题

  1. 升级过程中的OSD依赖问题:在升级过程中,OSD依赖于CRUSH map,导致在升级监控器后所有OSD需要重新配置,这在大型集群中会显著减慢升级速度,并影响用户体验。会议讨论了延迟OSD重新配置的可行性,以减少不必要的重新配置时间。

  2. 升级过程的粒度控制:大型集群的用户希望更细粒度地控制升级过程,例如按主机或按守护进程类型进行升级,以便更好地管理升级过程和减少潜在的风险。会议决定实现按主机和按守护进程类型的升级选项,并确保升级顺序的正确性。

讨论内容

  • OSD依赖问题:讨论了延迟OSD重新配置的潜在风险,并考虑了其他升级策略,如参考Ansible的升级方法。
  • 升级粒度控制:讨论了按主机和按守护进程类型的升级选项,以及如何改进升级状态显示。

决定事项

  • 探索延迟OSD重新配置的可行性,并评估其潜在风险。
  • 实现按主机和按守护进程类型的升级选项,并确保升级顺序的正确性。

后续行动计划

  • 进行技术调研,进一步研究延迟OSD重新配置的技术细节和潜在风险。
  • 开发按主机和按守护进程类型的升级选项,并确保升级顺序的正确性。
  • 改进升级状态显示,提供更详细的升级进度信息。

此外,会议还讨论了离线主机处理、升级状态显示以及如何处理版本兼容性问题。