cassandra相关内容

是什么让 Cassandra(以及一般的 NoSQL)成为 RDBMS 的更好解决方案?

好吧,NoSQL 现在是一个流行词,所以我一直在研究它.我还没有了解 ColumnFamilies 和 SuperColumns 等......但我一直在研究数据是如何映射的. 阅读这篇文章和其他文章后,似乎数据以类似 JSON 的格式映射. 用户 = {1:{用户名:“戴夫",密码:“blahblah",日期注册:“1/1/1"},2:{用户名:“等",密码:“blahblah",dat ..
发布时间:2021-12-31 18:09:32 其他开发

没有足够的副本可用于一致性 ONE 查询(需要 1 个,但只有 0 个活着)

我有一个包含三个节点的 Cassandra 集群,其中两个已启动.他们都在同一个DC.当我的 Java 应用程序写入集群时,我的应用程序出现错误,这似乎是由 Cassandra 的某些问题引起的: 引起:com.datastax.driver.core.exceptions.UnavailableException:没有足够的副本可用于一致性 ONE 查询(需要 1 但只有 0 个活动)在 ..
发布时间:2021-12-31 18:09:26 其他开发

长行的 Cassandra 性能

我正在考虑在 Cassandra 中实现一个具有很长行(每行数十万到数百万列)的 CF. 使用完全虚拟的数据,我在一行中插入了 200 万列(均匀间隔).如果我执行切片操作以获得 20 列,那么当您在行的更下方执行切片操作时,我会注意到性能大幅下降. 对于大多数列,我似乎能够在 10-40 毫秒内提供切片结果,但是当您接近行尾时,性能遇到瓶颈,响应时间从 1,800,000 时的 43 ..
发布时间:2021-12-31 18:09:17 其他开发

在 Cassandra 列中存储 JSON 字符串的有效方法?

Cassandra 新手问题.我正在使用 REST 调用从社交网站收集一些数据.所以我最终以 JSON 格式返回数据. JSON 只是我表中的一列.我试图弄清楚存储 JSON 字符串的“最佳实践"是什么. 首先我想到使用 ma​​p 类型,但 JSON 包含字符串、数字类型等的混合.似乎我不能为地图键/值声明通配符类型.JSON 字符串可能非常大,大小可能超过 10KB.我可以将它存储 ..
发布时间:2021-12-31 18:09:08 其他开发

Cassandra cqlsh“无法连接到任何服务器"

我在命令行执行 cqlsh.bat 时收到以下消息 连接错误: ('无法连接到任何服务器', {'127.0.0.1': ProtocolError("cql_version '3.3.0' is not supported by remote (w/native protocol).支持的版本:[u'3.2.0']",)}) 我正在运行 Python 2.7.10 版和 Cassandra ..
发布时间:2021-12-31 18:08:57 Python

Cassandra 冻结关键字含义

Cassandra 中的 frozen 关键字是什么意思? 我正在尝试阅读此文档页面:使用用户定义类型,但他们对 frozen 关键字(他们在示例中使用)的解释对我来说不够清楚: 为了支持未来的功能,用户定义的列定义或元组类型需要冻结关键字.Cassandra 序列化一个将多个组件合并为一个值的冻结值.为了示例和使用信息,请参阅“使用用户定义的类型",“元组类型"和集合类型. 我 ..
发布时间:2021-12-31 18:08:48 其他开发

Cassandra 牺牲了 CAP 定理的哪一部分,为什么?

这里有精彩的演讲关于使用 Kingsby 的 Jesper 库 在 Cassandra 中模拟分区问题. 我的问题是 - 对于 Cassandra,您主要关注 CAP 定理的分区部分,还是一致性也是您需要管理的一个因素? 解决方案 Cassandra 通常被归类为 AP 系统,这意味着可用性和分区容错性通常被认为比一致性更重要.然而,现实世界的系统很少完全属于这些类别,因此将 CAP ..

文档存储的最佳用途是什么?

我听说过很多关于像 CouchDB 这样的面向文档的数据存储.我了解 BigTable 的用途,例如 Cassandra 之类的商店.阅读这个问题后,我想知道条件会是什么值得使用文档存储吗? 解决方案 列族存储(例如 Bigtable 和 Cassandra)的查询能力非常有限.应用程序负责维护索引以查询更复杂的数据模型. 文档数据库允许您查询内容,而不仅仅是键.它还将为您管理索引, ..
发布时间:2021-12-31 18:08:33 其他开发

什么 NoSQL DB 用于像数据这样的稀疏时间序列?

我正在计划一个副项目,我将在其中处理时间序列之类的数据,并想尝试使用其中一个闪亮的新 NoSQL DB 并寻求推荐. 对于一组(不断增长的)symbols,我将有一个 (time,value) 元组列表(随着时间的推移而增加).并非所有symbols 都会更新;一些 symbols 可能会更新,而另一些可能不会,并且可能会添加全新的 symbols. 因此数据库应该允许: 添加带 ..
发布时间:2021-12-31 18:08:16 其他开发

具有大量数据的 ec2 上的最佳实践 cassandra 设置

我正在进行从物理机到 ec2 实例的大规模迁移. 截至目前,我有 3 个 x.large 节点,每个节点有 4 个实例存储驱动器(raid-0 1.6TB).设置完这些后,我想起“实例存储卷上的数据仅在关联的 Amazon EC2 实例的生命周期内持续存在;如果您停止或终止实例,实例存储卷上的任何数据都会丢失." 在这种情况下,人们通常会怎么做?我担心如果其中一个盒子崩溃,那么如果它不 ..
发布时间:2021-12-31 18:08:09 其他开发

Cassandra 文件结构 - 如何使用文件?

在使用 Cassandra 进行试验时,我观察到 Cassandra 会写入以下文件: /.../cassandra/commitlog/CommitLog-.log/.../cassandra/data/Keyspace1/Standard1-1-Data.db/.../cassandra/data/Keyspace1/Standard1-1-Filter.db/.../cassandra/d ..
发布时间:2021-12-31 18:07:58 其他开发

Cassandra“没有可行的输入替代方案"

我正在尝试在表格中插入一个简单的行.有人可以指出这里发生了什么吗? CREATE TABLE Recommendation_engine_poc.user_by_category (game_category 文字,customer_id 文本,金额翻倍,游戏日期时间戳,PRIMARY KEY (game_category, customer_id)) WITH CLUSTERING ORDER ..
发布时间:2021-12-31 18:07:50 其他开发

达到墓碑限制时究竟会发生什么

根据 cassandra 的日志(见下文),由于存在太多 tombstones,查询正在中止.发生这种情况是因为我每周清理(删除)一个计数器太低的行.这“删除"了数十万行(用墓碑标记它们.) 如果在这个表中因为一个节点在清理过程中宕机而重新出现一个被删除的行,那完全不是问题,所以我为单个受影响的人设置了gc宽限时间table 到 10 小时(从默认的 10 天减少),因此可以相对较快地永久删 ..
发布时间:2021-12-31 18:07:40 其他开发

实时查询/聚合数百万条记录 - hadoop?数据库?卡桑德拉?

我有一个可以并行化的解决方案,但我(还)没有使用 hadoop/nosql 的经验,而且我不确定哪种解决方案最适合我的需求.理论上,如果我有无限的 CPU,我的结果应该会立即返回.因此,任何帮助将不胜感激.谢谢! 这是我所拥有的: 1000 个数据集 数据集键: 所有数据集都具有相同的键 100 万个密钥(以后可能是 10 或 2000 万个) 数据集列: 每个数据集 ..
发布时间:2021-12-31 18:07:33 其他开发

使用 mongodb 或 cassandra 的空间数据

我正在考虑处理大量数据的概念证明,例如 > 10 G,这需要每秒至少 200 次以上的写入和每秒大约 50 次以上的空间相关数据读取.这也是一个不断增长的系统.目前,出于性能原因,我正在考虑将这些大容量数据移动到 NoSql 大表类型的数据库中. 我已经考虑并仔细研究了 MongoDB 和 cassandra.就我的阅读而言, MongoDB:- 似乎有写锁问题- 如果不需要多台服务器 ..
发布时间:2021-12-31 18:07:23 其他开发

为什么 Cassandra 是用 Java 编写的?

关于 Cassandra 的问题 为什么会有人用 Java 编写数据库引擎? 我能理解为什么你想要一个 Java 接口,但引擎... 我的印象是没有什么比 C/C++ 更快的了,数据库引擎不应该比最大速度慢,当然也不要使用垃圾收集...... 谁能解释一下这有什么意义/为什么 Cassandra 可以比在 C/C++ 代码上运行的普通 SQL 更快? 编辑: 很抱歉“为 ..
发布时间:2021-12-31 18:07:14 Java开发

bigtable vs cassandra vs simpledb vs dynamo vs couchdb vs hypertable vs riak vs hbase,它们有什么共同点?

抱歉,这个问题有点主观.我是“可以存储"、“分布式存储"或类似这样的一些概念的新手.我真的很想知道它们有什么共同点,并想了解所有这些.如果我想写一个类似的产品,我需要准备什么? 解决方案 NoSQL 数据库站点 总结了这个概念像这样: 主要是下一代数据库解决一些问题:非关系,分布式,开源和水平可扩展.初衷是现代的网络规模的数据库.运动始于 2009 年初,并且正在增长迅速.往往更多的 ..
发布时间:2021-12-31 18:07:07 其他开发