[Paper Note] the Design of a Practical System for Fault-Tolerant Virtual Machines
背景
hypervisor 控制整个 VM 的执行环境,因此可能高效地实现可容错的虚拟机系统。论文在 WMware vShpere 4.0 上实现了一个可用于生产环境的可容错虚拟机,称为 VMware FT。
设计
论文聚焦于如何实现一个可用与生产环境的容错虚拟机,更多聚焦于实现容错的策略(协议),底层使用的机制依赖于 VMware 的其他技术。虚拟机复制使用 VMware VMotion,这个技术原本用于迁移 VMware 虚拟机,VMware FT 稍作修改,用于复制虚拟机和重启虚拟机。使用 VMware 的 deterministic replay 技术记录主虚拟机的执行并确保副本的执行于主虚拟机相同。
![Featured image for [Paper Note] The design of a practical system for fault-tolerant virtual machines](/posts/the-design-of-a-practical-system-for-fault-tolerant-virtual-machines/images/VMware-basic-FT-configuration.png)
![Featured image for [Paper Note] ZooKeeper wait-free coordination for internet-scale systems](/posts/zookeeper-wait-free-coordination-for-internet-scale-systems/images/ZooKeeper-componets.png)

![Featured image for [Paper Note] f4 Facebook’s Warm BLOB Storage System](/posts/f4-facebooks-warm-blob-storage-system/images/overall-blob-storage-architecture.png)