Jepsen团队对NATS JetStream 2.12.1版本进行了深入测试,发现了多个严重的可靠性问题。测试表明,即使仅少数节点出现文件损坏(如.blk或快照文件的单比特错误),也可能导致大规模消息丢失(高达78%的已确认消息)或整个流被删除。此外,默认每两分钟才将数据刷新到磁盘的策略,在节点同时断电或快速连续故障时会导致已确认消息丢失。更严重的是,单个操作系统崩溃结合进程暂停或网络分区可能引发持久性脑裂,不同节点返回不同的消息集。Jepsen建议NATS将fsync默认值改为立即执行,或明确警告用户这些风险。这些发现对依赖NATS JetStream构建分布式系统的开发者具有重要参考价值,提醒他们关注数据一致性和系统可靠性。
原文链接:Hacker News

最新评论
照片令人惊艳。万分感谢 温暖。
氛围绝佳。由衷感谢 感受。 你的博客让人一口气读完。敬意 真诚。
实用的 杂志! 越来越好!
又到年底了,真快!
研究你的文章, 我体会到美好的心情。
感谢激励。由衷感谢
好久没见过, 如此温暖又有信息量的博客。敬意。
很稀有, 这么鲜明的文字。谢谢。