[改进后的中文总结内容]
会议纪要
会议主题:Ceph分布式存储系统中的随机跟踪(Tracing)部署
主要议题: - 跟踪系统介绍: Omri介绍了Ceph中使用的跟踪系统,特别是RDW(Rados Gateway Daemon)中的跟踪实现。他们使用Jaeger作为跟踪后端,OpenTelemetry作为客户端发送跟踪数据到后端。 - 跟踪系统的实现: 创建了一个Tracer类,使用OpenTelemetry客户端SDK。从OpenTracing迁移到OpenTelemetry,因为OpenTracing的C++库不再维护,而OpenTelemetry是一个活跃更新的新库,支持Jaeger后端。 - 当前工作进展: 在RDW和OSD中实现了新的跟踪功能,能够在运行时启用或禁用跟踪,默认情况下禁用。还实现了跟踪信息的序列化和反序列化,以便统一跨多个操作的跟踪。 - 未来计划: 条件跟踪(Conditional Tracing),允许在特定情况下(如特定存储桶)启用跟踪;多站点跟踪(Multi-site Tracing),帮助调试多站点环境;以及RGW和OSD的端到端跟踪集成。 - 性能测试: 完成性能测试,比较不同跟踪配置下的性能影响。 - 部署: 部署Jaeger组件与Ceph集成,确保通过SafeADM正确部署Jaeger容器。 - 条件跟踪和多站点跟踪功能: 探索和实现条件跟踪和多站点跟踪功能。
决定事项: - 继续开发和测试跟踪功能,确保其在多节点环境中的稳定性和性能。 - 探索和实现条件跟踪和多站点跟踪功能。
会议主题:Ceph开发环境中的Docker背景
主要议题: - 开发环境介绍: 讨论了使用Docker容器作为Ceph开发环境的问题,特别是在多容器和系统级权限下的挑战。 - 当前状态和挑战: 尽管在某些机器上工作良好,但在其他机器上由于cgroup v2和权限问题遇到了困难。 - 可能的解决方案: 考虑使用Podman替代Docker,或手动挂载必要的文件系统以支持systemd在容器中的运行。
决定事项: - 继续探索和测试不同的容器化解决方案,以找到最适合Ceph开发环境的工具。
后续行动计划: - 测试Podman作为Docker的替代方案。 - 进一步研究和实现手动文件系统挂载以支持systemd。
会议主题:Ceph开发环境中的SSH密码存储
主要议题: - SSH密码存储: 讨论了在Ceph配置密钥存储中存储SSH密码的安全性。 - 潜在风险: 存储未加密的SSH密码可能存在安全风险。
决定事项: - 等待制定更安全的存储方案,然后再合并相关拉取请求。
会议主题:监控集群健康状态
主要议题: - 监控问题: 当监控节点不响应时,可能会导致误报集群健康状态。 - 解决方案: 通过检查最后一条日志消息的时间戳或通过定期向监控节点发送消息来检测监控节点的活跃性。
决定事项: - 探索使用监控节点的信标机制或实施其他解决方案来检测监控节点的活跃性。
会议主题:Ceph自动扩展和PG最大值
主要议题: - 自动扩展: 讨论了在缩放模式下如何处理元数据池。 - 解决方案: 提出使用PG最大值(PG Max)来限制元数据池的PG数量。
决定事项: - 探索不同的自动扩展模式,并确保在升级到Quincy版本之前进行充分的测试。