'Ceph Orchestrator Meeting: 2021-12-07'

[改进后的中文总结内容]

Rook 团队更新
- Rook 团队未参会，无更新内容。
TopoLVM 新 Operator 开发进展
- 决定开发全新的 TopoLVM Operator，以满足新的需求。
- 新 Operator 将从零开始，计划几周内提交设计方案。
- 目前工作重点是实现单节点部署和设备选择等基本功能。
大规模集群测试反馈
- 讨论了在大型集群中的性能和稳定性问题，特别是节点离线情况。
- 强调了需要对集群进行压力测试，并优化 Prometheus 监控模块。
Kubernetes 与 Ceph 的集成问题讨论
- 讨论了 Kubernetes 如何处理离线节点，并提出了借鉴其方法的建议。
- 提出了在 Ceph 中实现类似 Kubernetes 的节点故障检测和自动重调度机制。
维护模式与离线主机处理
- 讨论了维护模式与离线状态的处理逻辑，建议简化并统一处理方式。
- 提出了在维护模式下快速重调度无状态服务的建议。
Agent 与 Manager 的通信优化
- 讨论了 Agent 如何快速发现新的 Active Manager 的问题。
- 提出了通过改进 Agent 的配置更新机制来加速这一过程的建议。