cassandra相关内容
我有一个可以并行化的解决方案,但我(还)没有使用 hadoop/nosql 的经验,我不确定哪种解决方案最适合我的需求.理论上,如果我有无限的 CPU,我的结果应该会立即返回.因此,任何帮助将不胜感激.谢谢! 这是我所拥有的: 1000 个数据集 数据集键: 所有数据集都有相同的键 100 万个密钥(以后可能是 10 或 2000 万个) 数据集列: 每个数据集都有相
..
Voldemort 与 卡桑德拉? 我不是在谈论社区的规模,我只想听听实际使用过两者的人的意见. 我特别感兴趣: 在添加和删除节点时它们如何动态扩展 查询性能 添加节点时它们如何扩展(线性)? 写入速度 解决方案 Voldemort 对添加节点的支持是最近才添加的(本月).所以我希望 Cassandra's 会因为更长的烹饪时间和更大规模的社区测试而更加强大.
..
Aerospike 和 Cassandra 都表示,他们在各自的基准测试中都优于对方. 参考:http://java.dzone.com/articles/benchmarking-cassandra-对和其他一些人. 有人都用过吗? Aerospike 和声称的一样好吗? 最后,建议用 Aerospike 替换 Cassandra? 解决方案 在 Cassandra 和
..
在 BigTable/GFS 和 Cassandra 术语中,SSTable 的定义是什么? 解决方案 Sorted Strings Table(借自google)是一个key/value字符串对的文件,按key排序
..
Merkle 树 在多个分布式、复制的键/值中用作反熵机制商店: Dynamo Riak Cassandra 毫无疑问,反熵机制是一件好事 - 瞬态故障只是在生产中发生.我只是不确定我是否理解为什么 Merkle Trees 是流行的方法. 向对等点发送完整的默克尔树涉及向该对等点发送本地密钥空间,以及每个键值的哈希值,存储在树的最低层. 区分从对等点发送的 Merkl
..
与 KV 存储相比,基于文档的 NoSQL 选项会给您带来什么好处,反之亦然? 解决方案 key-value store 提供了最简单的数据模型,顾名思义:它是一个存储值的存储系统由一个键索引.您只能通过键进行查询,并且值是不透明,商店对它们一无所知任何.这允许非常快速的读写操作(简单的磁盘访问),我将此模型视为一种非易失性缓存(即非常适合您需要通过密钥快速访问长期存在的数据). 面
..
我们想在 Cassandra 中生成自动增量整数键.这在传统数据库中是微不足道的任务,但在 Cassandra 中并不复杂. 我已经尝试过可以使用递增的计数器数据类型 值=值+1 并尝试使用 LWT 如果 value=oldValue,则更新 myTable SET value=newValue.(其中 newValue=oldValue+1 表示自动递增) 我已被强烈警告不要使用计
..
如何更新 cassandra 数据库中的列?? columnfam{用户名{名称:edds,姓:姓,电子邮件:mymail@rrr.com}} 例如我需要更新姓氏?? 我使用php客户端PHPCASSA. 感谢 解决方案 正如 Octopus-Paul 所说,更新与插入相同.不过,在写作之前不需要阅读.你可以这样做: $column_family->insert('use
..
如何读取 cassandra nodetool 直方图百分位和其他列? 百分比 SSTables 写入延迟 读取延迟 分区大小 单元计数(微) (微) (字节)50% 1.00 14.24 4055.27 149 275% 35.00 17.08 17436.92 149 295% 35.00 24.60 74975.55 642 298% 86.00 35.43 129557.75 770 2
..
我的 cassandra db 有问题,希望有人能帮助我.我有一个表“日志".在日志表中,我插入了大约 10000 行.一切正常.我可以做一个 选择 * from从中选择计数(*) 当我插入 TTL 50 的 100000 行时,我收到一个错误 选择 count(*) from 版本:cassandra 2.1.8,2 个节点 Cassandra 在一致性读取查询期间超时 ONE(1
..
Cassandra CQL:使用复合键和集群键创建的表.当我尝试从分区键执行 select * 时,我能够检索所有数据并且它也适用于关系运算符( ).但是,当我使用具有正确值的等于(=)运算符查询特定集群键时,它返回 0 行. 表格: 创建表 entity_data (received_date 时间戳,实体文本,received_time 时间戳,节点整数,主键 ((rece
..
我们想将 .csv 文件中的 10 万行数据导入 Cassandra 表. 每一行都没有唯一值,因此我们希望将 UUID 添加到每个导入的行,我们如何在从 CSV 文件导入数据时自动执行此操作. .CSV 文件中的示例行(第一行是列名) DateTime,Latitude,Longitude,Depth,Magnitude,MagType,NbStations,Gap,Distanc
..
我有一个 cassandra table1: CREATE TABLE Policy.table1 (名称 VARCHAR ,日期时间戳,version_num INT,首要的关键 (名称)) WITH 缓存 = 'all'-- 和 memtable_flush_period_in_ms = 7200 ;; 我需要在 tis 表上实现乐观锁定.当我们从 table1 中读取一行时,我们会记
..
我在一本书中读到:“Cassandra 是一个 NoSQL 数据库,提倡先读后写而不是关系模型". 在 NoSQL 上下文中,“read-before-write"是什么意思? 解决方案 Read before write 意味着在修改之前检查单元格的值. Read-Before write 是 Cassandra 中一个巨大的反模式.你读过的任何鼓励这样做的书都应该被怀疑地看
..
我在大型数据库(数百 GB)上工作,而 Mysql 现在或多或少地让我感到满意.我对 cassandra 的发布犹豫不决. 之前什么都想知道,所以这种DBMS NoSQL应该比MySQL快吧? 几点: 一行上列数的变化在Mysql中,它们都必须事先定义好.列设置在表的结构中.在 NoSQL 中,它们可以是多种多样的.固定结构有真正的不同性能吗?为什么? 不要让关系有利于表现
..
Cassandra 客户端如何选择协调节点?coordinator节点是否存储了复制前客户端发送的数据? 解决方案 协调节点通常由考虑“网络距离"的算法选择.任何节点都可以充当协调者,首先请求将发送到您的驱动程序知道的节点.但是一旦它连接并理解了集群的拓扑结构,它可能会变成一个“更接近"的协调器. 如果协调器最终成为负责数据令牌范围的节点之一,则协调器仅在本地存储数据(在写入时).
..
对于任何刚起步的网站,最初的负载都是最小的 &最初以缓慢的速度增长.人们通常从他们基于 MySQL 的站点开始,使用单个服务器(***这也是 VPS 而不是专用服务器)作为应用程序服务器以及数据库服务器和运行.这种设置通常会走得太远只有当他们觉得有必要时,他们才会将数据库与应用服务器分开,给它一个单独的 VPS 服务器.这就是初创公司在规划资源采购时所期望的. 但到目前为止,我所看到的情况与
..
在给定的物理节点上,给定分区键的行按照由集群键诱导的顺序存储,使得以该集群顺序检索行特别有效.http://cassandra.apache.org/doc/cql3/CQL.html#createTableStmt 什么排序是由聚类键引起的吗? 解决方案 假设你的聚类键是 k1 t1, k2 t2, ..., kn tn 其中 ki 是第 i 个键名,ti 是第 i 个键类型.然后订
..
在互联网上阅读了几篇论文和文档,我发现了许多关于 Cassandra 数据模型的相互矛盾的信息.有很多人将其识别为面向列的数据库,其他人将其识别为面向行的数据库,然后将其定义为两者的混合方式. 根据我对 Cassandra 如何存储文件的了解,它使用 *-Index.db 文件访问 *-Data.db 文件的正确位置,其中存储了布隆过滤器、列索引,然后是所需行的列. 在我看来,这是严格
..
在使用 Cassandra 进行试验时,我发现 Cassandra 侦听以下端口: TCP *:8080 TCP *:8888 TCP *:57311 TCP *:57312 TCP 127.0.0.1:7000 TCP 127.0.0.1:9160 UDP 127.0.0.1:700 Cassandra 如何使用列出的每个端口? 解决方案 @Schildmeije
..