[改进后的中文总结内容]
Ceph 分布式存储会议纪要
会议主题:
Ceph 编排(Orchestration)与存储管理讨论
参会人员:
Adam、John Mulligan、Redon、Anthony Datri 等
关键讨论议题:
- PIO3 加密库加载问题:
- 描述:Python 加密库
cryptography在多模块加载时存在冲突,导致部分模块无法接收事件。 - 解决方案:重构 Dashboard 和
cephadm调用逻辑,避免直接导入cryptography。 - 后续行动:由 John Mulligan 牵头,调研模块加载优化方案。
- 描述:Python 加密库
- Python 工具链升级:
- 现状:当前代码库依赖较旧版本的 Python 工具,无法兼容 Python 3.13+。
- 目标:升级至较新版本工具链,确保兼容性。
- 行动计划:分阶段更新工具链,优先解决
cephadm的兼容性问题。
ceph命令行工具优化:- 问题:
cephCLI 代码结构混乱,缺乏维护团队。 - 建议方案:将部分功能迁移至
python-common库,标准化代码结构。 - 后续行动:Adam 联系 Yuri(Manager Core 团队)讨论代码所有权问题。
- 问题:
- 服务配置变更自动化:
- 背景:用户修改服务规格后需手动触发
ceph orch reconfigure。 - 提案:自动检测 Spec 变更并触发服务重配置。
- 技术方向:在服务类中实现字段级变更检查,支持多种响应动作。
- 背景:用户修改服务规格后需手动触发
- 密钥与证书管理:
- 当前进展:支持通过 Vault 存储证书,但缺乏统一的 Secrets 管理框架。
- 未来计划:扩展后端支持,集成 ACME 协议实现自动化证书轮换。
- 大规模集群优化:
- 性能问题:主机元数据刷新和部署任务串行执行导致延迟。
- 优化措施:并行化部署与删除操作,升级时结合
ok-to-stop检查。
- 用户需求与功能扩展:
- Central Config 版本控制:将集群配置纳入 Git 管理,实现基础设施即代码(IaC)。
- SMB 增强:支持离线域加入令牌,扩展 gRPC 接口供云平台直接管理 SMB。
决议事项:
- 优先调研 K8S Events 模块的使用情况,再决定是否重构或移除。
- 建立定期工具链更新流程,由团队分阶段执行。
- 探索代码重构方案,明确维护责任。
- 设计服务级别的变更响应机制。
- 推进 ACME 协议集成,列为 Umbrella 版本目标。
后续行动计划:
- 提交模块加载优化提案
- 启动 Python 工具链升级
- 联系 Manager Core 团队讨论 CLI 所有权
- 实现 Spec 变更自动化原型
备注:
需关注核心团队对 Central Config 版本控制的反馈。