我们已在《Ops Manager(v4.2和v4.4)/云管理器/Atlas旧版备份》中识别到一系列错误,这些错误可能导致在运行MongoDB 4.2或更高版本的集群上备份快照损坏。这些错误不会以任何方式影响源集群上的数据。然而,目前无法从损坏的快照中恢复数据。有关更多信息,请参阅下文的“影响”部分。
Ops Manager版本4.4.4/4.2.20 包含此错误的修复方案,现已可用。所有运行较早版本Ops Manager并使用FCV 4.2+备份MongoDB 4.2+的用户应尽快升级Ops Manager。请参阅下文的影响细节和解决方案选项。
云管理器目前包含修复方案。建议需要恢复旧版备份的客户使用在2020年4月21日之前或之后创建的快照,以确保可用性。
Atlas目前包含修复方案。建议需要恢复旧版备份的客户使用在2020年8月11日之前或之后创建的快照。对于使用云提供商快照(最近更名为“云备份”)的客户,此问题不适用。
执行自动恢复或手动提取下载的快照且未遇到错误信息的客户未受到影响,此类操作应能成功完成。从损坏的快照恢复将显示失败。
以下条件下生成的备份快照可能受到影响
使用MongoDB 4.2+和FCV 4.2+创建的Ops Manager备份
2020年4月21日至2020年9月27日期间创建的云管理器备份快照
2020年8月11日至2020年9月27日期间创建的Atlas旧版备份快照。
受影响的快照恢复将表现出以下行为
尝试下载受影响的备份快照将导致出现“无效tar头部”错误信息。一旦下载tar文件,将无法解压,可能会使自动化处于不完全状态,需要干预。如果数据块本身损坏,将文件恢复到dbpath将导致无法启动mongod节点,使节点本身处于损坏状态。
如果使用受影响的快照启动自动恢复,恢复过程将启动但似乎会无限期地挂起。需要由MongoDB支持人员取消此过程。
尝试在受影响的快照上执行可查询的恢复也会失败。可查询的恢复可能无法挂载,或查询受影响的集合本身可能会返回错误。
快照源集群上的所有数据均未发生数据丢失或数据完整性受到影响。
对于云管理器或Atlas客户,无需采取任何操作。
虽然即将推出的修复将解决这个问题,但希望保持在当前版本但避免此问题的Ops Manager客户可以执行以下操作
将此属性添加到您的conf-mms.properties配置文件中:mms.featureFlag.backup.incrementalWtEnabled=disabled
重新启动Ops Manager应用程序服务器。
重启后,所有使用Blockstore快照存储的备份的块大小应更新为16MB。在执行下一个快照时,它将是一个完整的快照,没有潜在的损坏。
请注意:如果您随后升级Ops Manager,请务必从配置中删除此属性,以重新获得对增量备份功能的访问权限。
这可以用来设置mms.featureFlag.backup.incrementalWtEnabled
标志。