sharding相关内容

MongoDB 使用带有 $lookup 聚合运算符的分片

$lookup 是 MongoDB 3.2 中的新功能.它对同一数据库中的未分片集合执行左外连接,以过滤来自“已连接"集合的文档以进行处理. 要使用 $lookup,from 集合不能被分片. 另一方面,分片是一种有用的水平扩展方法. 将它们一起使用的最佳做法是什么? 解决方案 正如您引用的文档所示,您不能在分片集合上使用 $lookup.因此,最佳实践解决方法是在单独的 ..
发布时间:2022-01-20 13:21:17 其他开发

增加 DynamoDB 中的分片数量以并行启动更多 lambda

我目前正在使用 DynamoDB 流来处理使用 lambda 函数更改的集合值,但是,目前,我只并行运行两个 lambda 实例,这不足以处理所有传入的数据和 lambda 函数刚刚排队. 从 aws 文档中,我可以看到可以并行运行的 lambda 数量与 DynamoDB 的分片数量成正比: 如果您创建一个 Lambda 函数来处理来自基于流的服务(Amazon Kinesis St ..

RabbitMQ 是否会在有消息时为消费者调用回调函数?

RabbitMQ 是否在有消息时为消费者调用回调函数,或者消费者是否必须轮询 RabbitMQ 客户端? 所以在消费者端,如果有 PHP 脚本,RabbitMQ 可以调用它并将消息/参数传递给它.例如如果在 shard 1 上提交了 rating 并且 aggregateRating 表在 shard 2 上,那么 shard 2 上的 RabbitMQ 消费者会触发脚本 aggRating ..
发布时间:2022-01-11 17:06:46 PHP

用于数据库分片的 MySQL 代理替代方案

MySQL 代理是否有任何替代方案.我不想使用它,因为它仍处于 alpha 阶段. 我将有 10 个 MySQL 服务器,其中 table_1 table_2 table_3 table_4 ... table_10 分布在 10 个服务器上.每个表的结构都是相同的,它们只是具有不同数据集的分片. 是否有 MySQL 代理的替代方案,我可以让我的客户端应用程序连接到单个 SQL Ser ..
发布时间:2021-12-31 19:42:07 数据库

cassandra 分片和复制

我是 Cassandra 的新手,正在阅读 这篇文章 解释分片和复制,我被困在 - 我有一个集群,在我的本地机器上配置了 6 个 Cassandra 节点.我创建了一个新的键空间“TestKeySpace",复制因子为 6,键空间“employee"中的表和主键是名为 RID 的自动增量编号.我无法理解如何对这些数据进行分区和复制.我想知道的是,由于我将复制因子保持为 6,并且数据将分布在多 ..
发布时间:2021-12-31 17:40:42 其他开发

MongoDB 超过 500 万条记录的查询性能

我们最近的一个主要集合的记录超过了 200 万,现在我们开始因该集合的主要性能问题而受到影响. 集合中的文档有大约 8 个字段,您可以使用 UI 过滤这些字段,并且结果应该按记录处理的时间戳字段排序. 我添加了几个带有过滤字段和时间戳的复合索引例如: db.events.ensureIndex({somefield: 1, timestamp:-1}) 我还添加了几个索引以同时使用 ..
发布时间:2021-12-21 23:40:02 其他开发

ElasticSearch:未分配的分片,如何修复?

我有一个有 4 个节点的 ES 集群: number_of_replicas: 1search01 - 主:假,数据:假search02 - 主:真,数据:真search03 - 主:假,数据:真search04 - 主:假,数据:真 我不得不重新启动 search03,当它回来时,它重新加入集群没问题,但留下了 7 个未分配的碎片. {"cluster_name": "tweedle",“ ..
发布时间:2021-12-13 11:32:02 其他开发

每个 kinesis 分片有多个消费者

我了解到每个 kinesis 流可以有多个消费者应用程序. http://docs.aws.amazon.com/kinesis/latest/dev/developing-consumers-with-kcl.html 但是,我听说每个分片只能拥有一个消费者.这是真的?我没有找到任何文档来支持这一点,并且无法想象如果多个消费者从同一个流中读取会怎样.当然,这并不意味着生产者需要为不同 ..
发布时间:2021-11-27 10:18:48 其他开发

MySQL 分片方法?

分片 MySQL 表的最佳方法是什么.我能想到的方法是: 应用级分片? 在 MySQL 代理层进行分片? 用于分片的中央查找服务器? 你知道这方面有什么有趣的项目或工具吗? 解决方案 分片 MySQL 表的最佳方法是不要这样做,除非完全不可避免. 在编写应用程序时,您通常希望以最大限度提高开发速度和开发人员速度的方式进行编写.仅在必要时优化延迟(答案准备好之前的时间) ..
发布时间:2021-11-20 22:22:27 数据库

极端分片:每个用户一个 SQLite 数据库

我正在开发一个介于电子邮件服务和社交网络之间的网络应用.我觉得它有潜力在未来变得非常大,所以我担心可扩展性. 我决定为每个活动用户创建一个单独的 SQLite 数据库,而不是使用一个集中的 MySQL/InnoDB 数据库,然后在那个时候对其进行分区:每个“分片"一个活动用户. 这样备份数据库就像每天将每个用户的小数据库文件复制到远程位置一样简单. 扩展就像添加额外的硬盘来存储新 ..
发布时间:2021-11-17 02:18:04 数据库

如何在 ArangoDB 中设置集群和分片?

我想在 arangoDB 中使用分片.我已经制作了协调器,如文档 2.8.5 中提到的 DBServers.但是仍然有人仍然可以详细解释它,以及我如何能够在分片前后检查查询的性能. 解决方案 可以测试您的应用程序 使用本地集群,所有实例都在一台机器上运行 - 如果我没猜错的话,您已经这样做了吗? ArangoDB 集群由协调器和数据库服务器节点组成.协调器在磁盘上没有自己的用户特定的 ..
发布时间:2021-11-17 01:31:40 其他开发

Solr 云文档路由

目前我有一个 zookeeper 多 solr 服务器,单分片设置.唯一 id 由 solr 自动生成. 我现在有一个 zookeeper 多 solr 服务器,需要多分片.我需要能够将更新路由到特定分片. 阅读后http://searchhub.org/2013/06/13/solr-cloud-document-routing/ 我担心如果我想将更新路由到特定分片,我不能允许 so ..
发布时间:2021-11-14 23:58:18 其他开发

大量文档的分片键 (MongoDB)

我正在开发一个 Web 应用程序,其中用户将向系统上传大量文档,并对文档执行不同类型的操作,包括聚合.然而,每个用户上传的文档数量差异很大——有的可能上传十几个文档,有的可能上传一百万个文档. 文档看起来像这样: doc{_id:,uid: ,ctime: ,........} 现在这里是选择shard key的问题: 1.如果我选择UUID作为shard ..
发布时间:2021-07-23 20:13:56 其他开发

如何在solr中动态地将分片添加到集合中?

在创建集合时使用以下查询,我为 collection10 设置了两个分片. /solr/admin/collections?action=CREATE&name=collection10&numShards=2&replicationFactor=2 但是我的要求是,在前两个分片中索引了 10000 个文档后,我必须动态添加第三个分片. 一旦我们在现有分片上开始收集和索引,是否可 ..
发布时间:2021-07-23 20:13:50 其他开发

我如何了解有关为网站分片用户数据的更多信息?

我有兴趣在多台服务器上分片我的网站用户数据. 例如,用户将从同一个地方登录.但是登录脚本需要弄清楚用户数据驻留在哪个服务器上.因此,登录脚本将查询主注册表以获取该用户名,并且它可能会返回它在服务器 B 上.然后登录脚本将连接到服务器 B 并验证用户名/密码.那有意义吗?使用主注册表之类的东西来解析数据所在的位置是否正常? 也 - 我已经搜索过,但我没有太多运气找到有关分片的教程/信息/ ..
发布时间:2021-07-23 20:13:44 其他开发

如何在 mongodb 中的分片副本集上执行只读查询

考虑以下配置 - 2 个 Shard 服务器,每个服务器有 1 个副本集(比如 rs0 和 rs1). 3 个配置服务器和 1 个查询路由器(mongos) 上述分片配置工作正常.但是,我想从分片副本集(从 rs0 和 rs1 的辅助节点)执行只读查询.因为,mongodb 数据同时存在于副本集 rs0 和 rs1 中.那么,如何配置它,从 rs0 和 rs1 的辅助节点获取数据?. ..
发布时间:2021-07-07 19:53:54 其他开发

有没有办法分片和复制 Neo4j 数据?

我正在考虑为我正在工作的一些新项目选择 Neo4j.对于给定的数据需求(本质上基于图形),neo4j 非常适合,快速原型为我提供了良好的响应时间.我想了解的是如何扩展 Neo4j 部署.具体: 如何在 Neo4j 部署中分片我的数据.由于neo4j部署在一台机器上,所以我可以在一台机器上存储多少数据是有限制的,因此我想知道如何分发它.显然,如果我将其拆分为用户,则无法维护断开连接的用户(跨分 ..
发布时间:2021-07-07 19:53:20 其他开发

RavenDB - 规划可扩展性

我最近一直在学习 RavenDB,想使用它. 我想知道人们对以可扩展的方式构建系统有什么建议或建议,特别是跨服务器分片数据,但可以在单个服务器上启动,并且只能根据需要增长. 在单个实例上创建多个数据库并在它们之间实施分片是可取的,甚至是可能的.那么要扩展它是否只是将这些数据库分布到机器上的问题? 我的第一印象是这种方法行得通,但我很想听听其他人的意见和经验. 更新 1: ..
发布时间:2021-07-02 20:34:53 其他开发