[改进后的中文总结内容]
在2022年2月7日的Ceph Orchestrator会议中,Ceph研发团队成员讨论了与Ceph升级相关的问题,并提出了改进方案。
主要议题:
升级过程中的OSD依赖问题:在升级过程中,OSD依赖于CRUSH map,导致在升级监控器后所有OSD需要重新配置,这在大型集群中会显著减慢升级速度,并影响用户体验。会议讨论了延迟OSD重新配置的可行性,以减少不必要的重新配置时间。
升级过程的粒度控制:大型集群的用户希望更细粒度地控制升级过程,例如按主机或按守护进程类型进行升级,以便更好地管理升级过程和减少潜在的风险。会议决定实现按主机和按守护进程类型的升级选项,并确保升级顺序的正确性。
讨论内容:
- OSD依赖问题:讨论了延迟OSD重新配置的潜在风险,并考虑了其他升级策略,如参考Ansible的升级方法。
- 升级粒度控制:讨论了按主机和按守护进程类型的升级选项,以及如何改进升级状态显示。
决定事项:
- 探索延迟OSD重新配置的可行性,并评估其潜在风险。
- 实现按主机和按守护进程类型的升级选项,并确保升级顺序的正确性。
后续行动计划:
- 进行技术调研,进一步研究延迟OSD重新配置的技术细节和潜在风险。
- 开发按主机和按守护进程类型的升级选项,并确保升级顺序的正确性。
- 改进升级状态显示,提供更详细的升级进度信息。
此外,会议还讨论了离线主机处理、升级状态显示以及如何处理版本兼容性问题。