'Ceph code walk-through: OSD (async) recovery'

[改进后的中文总结内容]

Ceph分布式存储系统中，传统的对象恢复过程是同步的，这会导致写操作被阻塞，从而影响集群的可用性。为了解决这个问题，Ceph团队引入了一种名为异步恢复的新机制。

会议内容概述：

会议背景与动机：同步恢复机制会阻塞写操作，影响集群可用性。异步恢复机制旨在后台恢复对象，而不会阻塞写操作。
异步恢复的关键概念：
- 目标：恢复仅在非活跃OSD上缺失的对象。
- 选择标准：基于日志差异、对象大小和恢复成本等因素。
- 最小PG日志条目：用于确定是否允许同步恢复的阈值。
- 保持主副本大小：只有当有足够的主副本可用时，才考虑同步恢复。
异步恢复的代码实现：
- 选择活跃OSD：修改了选择活跃OSD的算法，使其能够识别异步恢复目标。
- 处理写操作：修改了写操作的代码，使其在异步恢复目标上不会阻塞。
- 更新元数据：在异步恢复过程中，需要更新元数据结构，以确保恢复的准确性。
恢复操作：
- 启动恢复操作：使用PGRecovery::run函数启动恢复操作。
- 恢复副本：恢复操作会尝试从副本恢复丢失的对象。
讨论与后续行动：
- 讨论了异步恢复的代码实现细节，并提出了改进建议。
- 团队计划制作一个流程图，以更直观地展示异步恢复的工作原理。
- 团队将根据讨论结果进一步改进异步恢复机制。

关键词：