[改进后的中文总结内容]
会议纪要
关键细节
- 会议时间: 2021年8月26日
- 参会人员: 核心团队成员及部分研发人员
- 会议主持: 未明确指出
讨论的主要议题
- 新PR审查:
- Prometheus缓存禁用: 讨论了针对小型部署禁用Prometheus缓存的功能,可能涉及内存使用问题。
- Direct IO写入方式变更: Adam提出了一个草案PR,旨在改变Direct IO写入方式,以确保安全性并提升性能。
- RGW跟踪实现: 讨论了RGW跟踪实现的关闭,以及后续的跟踪扩展和细节添加。
- 已关闭PR:
- RGW缓存问题: 讨论了RGW缓存的相关问题,包括缓存的必要性和可能的改进。
- BlueStore cap omap命名方案升级: Igor解释了该PR的目的,即解决大型引用写入时的性能问题。
- 性能调查和未来计划:
- 性能调查工具: 讨论了性能调查工具的需求,如Kubernetes性能测试工具Storms,以及如何在上游进行测试。
- 平衡改进: 讨论了平衡改进的必要性,特别是在处理大量小文件时的性能问题。
- QoS和缓存策略: 讨论了QoS的一般性问题,以及如何改进缓存策略以更好地平衡资源。
- 特定组件的性能问题:
- RGW和CephFS: 讨论了RGW和CephFS中的多个性能问题,包括缓存管理、异步请求处理和多站点性能。
- RBD: 讨论了RBD的客户端持久缓存问题,以及NVMe或Fabric网关的潜在性能影响。
- 其他议题:
- 自动化性能测试: 讨论了自动化性能测试的需求和挑战,以及如何确保性能不会在代码更新中退化。
决定的事项
- 需要进一步审查和讨论Prometheus缓存禁用的PR。
- Adam将继续审查和改进Direct IO写入方式的PR。
- 需要进一步讨论和实施RGW跟踪的扩展和细节添加。
- 需要关注和改进平衡性能,特别是在处理大量小文件时。
- 需要进一步研究和实施QoS和缓存策略的改进。
- 需要关注RGW和CephFS中的多个性能问题,并寻找解决方案。
- 需要关注RBD的客户端持久缓存问题,并评估NVMe或Fabric网关的性能影响。
- 需要进一步讨论和实施自动化性能测试,以确保性能不会在代码更新中退化。
后续行动计划
- 继续审查和讨论Prometheus缓存禁用的PR。
- 继续审查和改进Direct IO写入方式的PR。
- 继续讨论和实施RGW跟踪的扩展和细节添加。
- 继续关注和改进平衡性能,特别是在处理大量小文件时。
- 继续研究和实施QoS和缓存策略的改进。
- 继续关注RGW和CephFS中的多个性能问题,并寻找解决方案。
- 继续关注RBD的客户端持久缓存问题,并评估NVMe或Fabric网关的性能影响。
- 继续讨论和实施自动化性能测试,以确保性能不会在代码更新中退化。
其他备注
- 会议中提到了多个具体的PR和代码变更,这些需要研发团队的具体成员进行跟进和实施。
- 会议中提到了多个性能调查工具和方法,这些需要进一步的研究和实施。
- 会议中提到了多个具体的性能问题,这些需要进一步的讨论和解决方案。
- 会议中提到了自动化性能测试的需求和挑战,这些需要进一步的讨论和实施。