Ceph Crimson/SeaStore 2021-05-19

[改进后的中文总结内容]

会议纪要：

本周的 orchestrator 会议主要讨论了 Ceph 的自我管理代理（self-adm agent）的深入探讨，以及模型选择、架构实现、安全性和可靠性等问题。

自我管理代理（self-adm agent）的深入探讨
- 讨论了自我管理代理的需求、收益以及对架构的影响。
- 分析了当前 cephadm 中的 reconciliation loop 的扩展性问题，特别是通过 SSH 连接执行任务的效率问题。
模型选择：推模型 vs 拉模型
- 讨论了使用推模型（push model）和拉模型（pull model）的优劣。
- 倾向于使用推模型，通过在每个主机上运行的代理（agent）将信息推送到管理模块（manager module），以提高性能和响应速度。
架构和实现细节
- 讨论了代理（agent）的职责和如何设计架构以最大化收益。
- 考虑了如何处理潜在的竞争条件和失败模式，特别是在部署新守护进程（daemon）时的同步问题。
安全性和可靠性
- 讨论了如何确保代理（agent）与管理模块（manager module）之间的通信安全，包括使用 API 端点和客户端认证。
- 考虑了如何处理主机离线的情况，以及如何确保代理（agent）的可靠运行。
未来扩展和升级路径
- 讨论了如何设计系统以便未来可以扩展到集群外的客户端。
- 考虑了从旧版本升级到新版本时的兼容性和升级路径。

决策事项： - 倾向于采用推模型（push model）来改善系统的扩展性和响应速度。 - 需要进一步细化代理（agent）的职责和架构设计，以避免竞争条件和失败模式。 - 需要设计一个安全可靠的通信机制，确保代理（agent）与管理模块（manager module）之间的信息交换。

后续行动计划： - 分配任务给团队成员，进一步细化代理（agent）的设计和实现细节。 - 开始实施初步的推模型（push model）原型，并进行测试以验证其性能和可靠性。 - 考虑未来的扩展需求，确保设计具有足够的灵活性和可扩展性。