Ceph RGW Refactoring Meeting 2024-10-23

[改进后的中文总结内容]

桶同步错误处理机制：
- Shila介绍了Ceph分布式存储系统中桶同步过程中错误的重试机制，目前仅在桶分片级别进行全同步或增量同步时重试。
- 讨论了在数据同步过程中，即使桶分片处理成功，但由于网络超时等原因，从远程区域获取S3对象可能失败的同步问题。
- 提出了为失败的对象同步引入类似的重试机制，但具体实现细节尚不明确。
错误报告处理：
- 讨论了处理失败对象同步错误报告的方法，建议在RGW桶同步单个条目CR中写入和读取omap，类似于数据同步错误报告。
- 需要进一步讨论和明确如何在桶分片增量同步CR例程中重试这些对象同步。
Keystone缓存问题：
- Mark提到了Keystone缓存在多部分上传过程中可能导致的请求风暴问题，这可能导致Keystone崩溃。
- 讨论了Keystone缓存未命中时，多个RGW请求可能同时访问Keystone，导致缓存未更新的问题。
- 需要进一步研究和实现缓存未命中时的处理机制，以防止重复请求Keystone。