cassandra相关内容

实时查询/聚合数百万条记录-hadoop?hbase?卡珊德拉?

我有一个可以并行化的解决方案,但我(还)没有使用 hadoop/nosql 的经验,我不确定哪种解决方案最适合我的需求.理论上,如果我有无限的 CPU,我的结果应该会立即返回.因此,任何帮助将不胜感激.谢谢! 这是我所拥有的: 1000 个数据集 数据集键: 所有数据集都有相同的键 100 万个密钥(以后可能是 10 或 2000 万个) 数据集列: 每个数据集都有相 ..
发布时间:2022-01-13 13:59:22 其他开发

伏地魔与卡珊德拉相比如何?

Voldemort 与 卡桑德拉? 我不是在谈论社区的规模,我只想听听实际使用过两者的人的意见. 我特别感兴趣: 在添加和删除节点时它们如何动态扩展 查询性能 添加节点时它们如何扩展(线性)? 写入速度 解决方案 Voldemort 对添加节点的支持是最近才添加的(本月).所以我希望 Cassandra's 会因为更长的烹饪时间和更大规模的社区测试而更加强大. ..
发布时间:2022-01-13 13:57:50 其他开发

比较:Aerospike vs Cassandra

Aerospike 和 Cassandra 都表示,他们在各自的基准测试中都优于对方. 参考:http://java.dzone.com/articles/benchmarking-cassandra-对和其他一些人. 有人都用过吗? Aerospike 和声称的一样好吗? 最后,建议用 Aerospike 替换 Cassandra? 解决方案 在 Cassandra 和 ..
发布时间:2022-01-13 13:56:57 其他开发

解释用于最终一致性的 Merkle 树

Merkle 树 在多个分布式、复制的键/值中用作反熵机制商店: Dynamo Riak Cassandra 毫无疑问,反熵机制是一件好事 - 瞬态故障只是在生产中发生.我只是不确定我是否理解为什么 Merkle Trees 是流行的方法. 向对等点发送完整的默克尔树涉及向该对等点发送本地密钥空间,以及每个键值的哈希值,存储在树的最低层. 区分从对等点发送的 Merkl ..
发布时间:2022-01-13 13:55:42 其他开发

“面向文档"是什么意思?在谈论 MongoDB 和 Cassandra 时,vs. 键值是什么意思?

与 KV 存储相比,基于文档的 NoSQL 选项会给您带来什么好处,反之亦然? 解决方案 key-value store 提供了最简单的数据模型,顾名思义:它是一个存储值的存储系统由一个键索引.您只能通过键进行查询,并且值是不透明,商店对它们一无所知任何.这允许非常快速的读写操作(简单的磁盘访问),我将此模型视为一种非易失性缓存(即非常适合您需要通过密钥快速访问长期存在的数据). 面 ..
发布时间:2022-01-13 13:55:19 其他开发

我们应该使用 Cassandra NoSQL 计数器还是 LWT 进行自动增量整数密钥生成?

我们想在 Cassandra 中生成自动增量整数键.这在传统数据库中是微不足道的任务,但在 Cassandra 中并不复杂. 我已经尝试过可以使用递增的计数器数据类型 值=值+1 并尝试使用 LWT 如果 value=oldValue,则更新 myTable SET value=newValue.(其中 newValue=oldValue+1 表示自动递增) 我已被强烈警告不要使用计 ..
发布时间:2022-01-13 13:51:49 其他开发

Cassandra 更新专栏

如何更新 cassandra 数据库中的列?? columnfam{用户名{名称:edds,姓:姓,电子邮件:mymail@rrr.com}} 例如我需要更新姓氏?? 我使用php客户端PHPCASSA. 感谢 解决方案 正如 Octopus-Paul 所说,更新与插入相同.不过,在写作之前不需要阅读.你可以这样做: $column_family->insert('use ..
发布时间:2022-01-13 13:50:26 其他开发

一致性读查询期间的 Cassandra 超时 ONE

我的 cassandra db 有问题,希望有人能帮助我.我有一个表“日志".在日志表中,我插入了大约 10000 行.一切正常.我可以做一个 选择 * from从中选择计数(*) 当我插入 TTL 50 的 100000 行时,我收到一个错误 选择 count(*) from 版本:cassandra 2.1.8,2 个节点 Cassandra 在一致性读取查询期间超时 ONE(1 ..
发布时间:2022-01-13 13:44:45 其他开发

Cassandra CQL选择查询不返回时间戳作为clusterkey的记录

Cassandra CQL:使用复合键和集群键创建的表.当我尝试从分区键执行 select * 时,我能够检索所有数据并且它也适用于关系运算符( ).但是,当我使用具有正确值的等于(=)运算符查询特定集群键时,它返回 0 行. 表格: 创建表 entity_data (received_date 时间戳,实体文本,received_time 时间戳,节点整数,主键 ((rece ..
发布时间:2022-01-13 13:44:39 其他开发

为从 CSV 文件导入的每一行添加 UUID

我们想将 .csv 文件中的 10 万行数据导入 Cassandra 表. 每一行都没有唯一值,因此我们希望将 UUID 添加到每个导入的行,我们如何在从 CSV 文件导入数据时自动执行此操作. .CSV 文件中的示例行(第一行是列名) DateTime,Latitude,Longitude,Depth,Magnitude,MagType,NbStations,Gap,Distanc ..
发布时间:2022-01-13 13:44:34 其他开发

Cassandra 乐观锁定

我有一个 cassandra table1: CREATE TABLE Policy.table1 (名称 VARCHAR ,日期时间戳,version_num INT,首要的关键 (名称)) WITH 缓存 = 'all'-- 和 memtable_flush_period_in_ms = 7200 ;; 我需要在 tis 表上实现乐观锁定.当我们从 table1 中读取一行时,我们会记 ..
发布时间:2022-01-13 13:43:53 其他开发

NoSQL 中的 read-before-write 是什么?

我在一本书中读到:“Cassandra 是一个 NoSQL 数据库,提倡先读后写而不是关系模型". 在 NoSQL 上下文中,“read-before-write"是什么意思? 解决方案 Read before write 意味着在修改之前检查单元格的值. Read-Before write 是 Cassandra 中一个巨大的反模式.你读过的任何鼓励这样做的书都应该被怀疑地看 ..
发布时间:2022-01-13 13:43:16 其他开发

为什么 nosql 用 cassandra 而不是 mysql?

我在大型数据库(数百 GB)上工作,而 Mysql 现在或多或少地让我感到满意.我对 cassandra 的发布犹豫不决. 之前什么都想知道,所以这种DBMS NoSQL应该比MySQL快吧? 几点: 一行上列数的变化在Mysql中,它们都必须事先定义好.列设置在表的结构中.在 NoSQL 中,它们可以是多种多样的.固定结构有真正的不同性能吗?为什么? 不要让关系有利于表现 ..
发布时间:2022-01-13 13:38:23 数据库

Cassandra 如何选择协调节点和复制节点?

Cassandra 客户端如何选择协调节点?coordinator节点是否存储了复制前客户端发送的数据? 解决方案 协调节点通常由考虑“网络距离"的算法选择.任何节点都可以充当协调者,首先请求将发送到您的驱动程序知道的节点.但是一旦它连接并理解了集群的拓扑结构,它可能会变成一个“更接近"的协调器. 如果协调器最终成为负责数据令牌范围的节点之一,则协调器仅在本地存储数据(在写入时). ..
发布时间:2022-01-13 13:24:19 其他开发

你为什么不从“单身"开始?小"Cassandra 服务器就像你通常用 MySQL 做的那样?

对于任何刚起步的网站,最初的负载都是最小的 &最初以缓慢的速度增长.人们通常从他们基于 MySQL 的站点开始,使用单个服务器(***这也是 VPS 而不是专用服务器)作为应用程序服务器以及数据库服务器和运行.这种设置通常会走得太远只有当他们觉得有必要时,他们才会将数据库与应用服务器分开,给它一个单独的 VPS 服务器.这就是初创公司在规划资源采购时所期望的. 但到目前为止,我所看到的情况与 ..
发布时间:2022-01-13 13:21:58 其他开发

Cassandra 中的集群键

在给定的物理节点上,给定分区键的行按照由集群键诱导的顺序存储,使得以该集群顺序检索行特别有效.http://cassandra.apache.org/doc/cql3/CQL.html#createTableStmt 什么排序是由聚类键引起的吗? 解决方案 假设你的聚类键是 k1 t1, k2 t2, ..., kn tn 其中 ki 是第 i 个键名,ti 是第 i 个键类型.然后订 ..
发布时间:2022-01-13 13:21:41 其他开发

为什么很多人将 Cassandra 称为面向列的数据库?

在互联网上阅读了几篇论文和文档,我发现了许多关于 Cassandra 数据模型的相互矛盾的信息.有很多人将其识别为面向列的数据库,其他人将其识别为面向行的数据库,然后将其定义为两者的混合方式. 根据我对 Cassandra 如何存储文件的了解,它使用 *-Index.db 文件访问 *-Data.db 文件的正确位置,其中存储了布隆过滤器、列索引,然后是所需行的列. 在我看来,这是严格 ..