fault-tolerance相关内容

使用 Erlang/OTP 构建容错软实时 Web 应用程序

我想为一家披萨外卖店构建一个容错的软实时 Web 应用程序.它应该帮助比萨店接听顾客的电话,将它们作为订单放入系统(通过 CRM 网络客户端),并帮助调度员为订单分配送货司机. 这些目标并不罕见,但我想让该服务 24/7 可用,即使其具有容错性.此外,我想让它工作得非常快并且反应灵敏. 以下是此类应用程序的一个非常简单的架构视图. 问题是我不知道如何利用 Erlang/OTP 的 ..

Zookeeper 容错究竟是什么意思?同时或累积?

如 ZooKeeper 入门指南中所述,容错集群设置至少需要三台服务器,强烈建议您使用奇数台服务器. 所以如果我有 5 台服务器,并且如上所述,当其中 2 台发生故障时我仍然可以生存.但这意味着同时或累积 ?? 那么这个怎么样: 5台服务器->失败1台->4台服务器->失败1台->3台服务器->失败1台->2台服务器->失败1台->死 3台服务器(初始化)和3台服务器(5台服务 ..
发布时间:2021-11-15 00:02:33 其他开发

Kafka Streams stateStores 容错恰好一次?

我们正在尝试使用 Kafka Streams 实现重复数据删除服务.总体而言,它将使用它的 RocksDB 状态存储,以便在处理过程中检查现有密钥. 如果我错了,请纠正我,但为了使那些 stateStores 也具有容错性,Kafka 流 API 将透明地复制 Kafka 主题(称为更改日志)中 stateStore 中的值.这样,如果我们的服务崩溃,另一个服务将能够根据在 Kafka 中找 ..
发布时间:2021-11-12 03:35:39 其他开发

Kafka Streams stateStores 容错恰好一次?

我们正在尝试使用 Kafka Streams 实现重复数据删除服务.总体而言,它将使用它的 RocksDB 状态存储,以便在处理过程中检查现有密钥. 如果我错了,请纠正我,但为了使那些 stateStores 也具有容错性,Kafka 流 API 将透明地复制 Kafka 主题(称为更改日志)中 stateStore 中的值.这样,如果我们的服务崩溃,另一个服务将能够根据在 Kafka 中找 ..
发布时间:2021-11-12 02:00:22 其他开发

Zookeeper容错的确切含义是什么?同时还是累计?

如《 ZooKeeper入门指南》所述,容错群集设置至少需要三台服务器,并且强烈建议您使用奇数个服务器. 因此,如果我有5台服务器,并且如上所述,当其中2台服务器出现故障时,我仍然可以生存.但这意味着同时或累计?? 那呢: 5台服务器->失败一台-> 4台服务器->失败一台-> 3台服务器->失败一台-> 2台服务器->失败一台->死亡 3个服务器(初始化)和3个服务器(从5个 ..
发布时间:2021-04-08 20:34:54 其他开发

Kafka Streams state只能一次存储容错能力吗?

我们正在尝试使用Kafka Streams实现重复数据删除服务. 总体情况是,它将使用其rocksDB状态存储来在处理过程中检查现有密钥. 如果我错了,请纠正我,但是为了使这些stateStores也容错,Kafka Streams API将透明地复制Kafka主题内的stateStore中的值(称为更改日志). 这样,如果我们的服务失败了,另一个服务将能够根据在Kafka中找到的chang ..
发布时间:2020-06-14 19:15:11 其他开发

良好的可扩展容错内存数据库,对.NET具有LINQ支持

是否有支持LINQ和SQL Server持久性的良好的内存事务数据库?我想在内存中创建一个大型数据存储的完整表示形式,并以一种惰性的方式将其提交到SQL Server数据库,但仍可以通过水平扩展将其保留在一定程度的容错能力.我不想依赖像CouchDB这样的非关系数据报. 解决方案 SQLite支持内存数据库具有交易支持,并且具有关于SQL Server的持久性,我认为您可以自己编写一些代码 ..
发布时间:2020-06-14 19:15:09 其他开发

石英作业详细要求恢复

JobDetail.requestsRecovery属性的文档规定以下内容 指示调度程序是否应重新执行作业 如果遇到“恢复"或“故障转移"情况. 现在,什么是“恢复"情况或“故障转移"情况? 它们有何不同? 仅在JVM在作业执行过程中崩溃时才进行恢复吗,还是在作业由于异常而执行失败时才进行恢复? 解决方案 "恢复情况"是通用术语,一种恢复情况是"故障转移". ..
发布时间:2020-06-14 19:15:01 其他开发

处理Akka演员中的错误

我有一个非常简单的示例,其中有一个Actor( SimpleActor )通过向自身发送消息来执行定期任务。该消息已在参与者的构造函数中安排。在正常情况下(即无故障),一切正常。 但是,如果Actor必须处理错误,该怎么办。我有另一个演员( SimpleActorWithFault )。这个演员可能有毛病。在这种情况下,我通过抛出异常来生成自己。发生故障时(即 SimpleActorWith ..
发布时间:2020-06-03 18:38:13 其他开发

如何发现Scala远程演员死亡?

在Scala中,可以通过设置trapExit标志并使用第二个actor作为参数调用link()方法,在另一个(远程)actor终止时通知actor。在这种情况下,当远程参与者通过调用exit()结束其工作时,第一个参与者将收到退出消息来通知。 但是,当远程actor以不太正常的方式终止时(例如,运行它的VM崩溃),会发生什么?换句话说,本地角色如何发现远程角色不再可用?当然,我希望(如果可能 ..
发布时间:2020-06-01 20:04:22 其他开发

容错MPI实施:状态

哪些MPI实现当前支持容错,其发展状况如何? 解决方案 这个问题可能范围太广,无法在此处给您一个很好的答案,尤其是因为答案会随着时间的推移而改变. 通常,在各种支持状态下,各种MPI实现都需要进行大量的容错工作. FT-MPI 是一个旧项目,现在已经不在开发中了,但是从MPI库中的集成FT角度而言,这一切都从某种程度上开始了. ULFM 是FT-MPI的精神继承者,目前正在提 ..
发布时间:2020-05-12 20:02:42 其他开发

MPICH/OpenMPI中的容错

我有两个问题- 第一季度.除了检查点/回滚之外,还有没有更有效的方法来处理MPI中的错误情况?我看到,如果节点“死亡",程序将突然停止.在节点死亡之后,有什么方法可以继续执行吗? (如果以准确性为代价,则没有问题) 第二季度.我在"http://stackoverflow.com/questions/144309/what-is-the-best-mpi-implementation" ..
发布时间:2020-05-12 19:53:50 其他开发

Akka PoisonPill用例

根据PoisonPill的Akka文档: 您还可以向演员发送akka.actor.PoisonPill消息,该消息将在处理该消息时停止该演员. PoisonPill被列为普通邮件,将在邮箱中已排队的邮件之后进行处理. 尽管对于Akka Guru来说,这种功能的有用性/实用性对于新手来说是显而易见的,但这听起来完全是无用/鲁ck/危险的. 所以我问:此消息的目的是什么?出于任何原因 ..
发布时间:2020-05-09 01:18:56 其他开发

如何在客户端实现REST服务器的容错?

我正在开发一个系统,它有一个可以操作它的RESTful Web服务(该服务允许所有CURD操作),以及一个显示系统数据的Web客户端(大多数客户端是用jQuery编写的)。在标准操作场景中,我的系统有一个主服务器和至少一个备份服务器,因此至少有两个RESTful Web服务。 所以我的问题是在这种情况下我的主服务器崩溃了,如何让一个正在查看主服务器的客户端现在正在查看备份服务器而不需要任何用 ..
发布时间:2019-05-25 22:52:44 JavaScript

顶级Akka演员升级和关机挂钩

在我的Akka系统中,有一个顶级(“root”)演员, Initializer ,所有其他演员都来自。还有一个演员 Destroyer ,负责在收到 Destroy 消息时正常关闭系统。有几种情况下,演员将向 Destroyer 发送 Destroy ,但这些条件并不重要 我现在想在 Initializer中实现功能的 SupervisorStrategy 如果它无法处理其中一个chidre ..
发布时间:2017-09-30 23:13:52 其他开发

Erlang中终止节点的检测工作如何? net_ticktime如何影响Erlang节点活动的控制?

我将net_ticktime值设置为600秒。 net_kernel:set_net_ticktime(600) 在Erlang文档中为net_ticktime = TickTime: 指定net_kernel刻度时间。 TickTime以秒为单位。每个TickTime / 4秒后,所有连接的节点都会被勾选(如果还有其他任何东西已写入节点),并且在节点被认为是关闭 ..
发布时间:2017-08-27 13:29:21 其他开发语言