cassandra-2.0相关内容

Cassandra中没有回滚,那么Cassandra如何删除失败的写入?

假设我有一个复制因子(RF)= 2的2节点群集。 我用一致性2触发了一个插入操作。当客户端等待响应时,Cassandra开始写入这2个节点。在一个节点之间失败并且无法完成写入,而在另一节点上成功写入。客户端将不会收到成功消息,因为无法满足一致性要求。 Cassandra中没有回滚。那么,Cassandra如何以及何时从该节点中删除插入的记录或将其标记为“不使用”? 相关问题:即使无法满足​ ..
发布时间:2020-09-29 20:13:49 其他开发

有哪些选项可以加快对Cassandra的全面修复?

我有一个Cassandra数据中心,我想对其进行全面维修。数据中心用于分析/批处理,我愿意牺牲延迟以加快全面修复的速度( nodetool修复)。 我有什么选择可以使完整修复更快?一些想法: 增加 streamthroughput ? 我想我可以禁用自动压缩功能并暂时删除 compactionthroughput 。但是,不确定我是否愿意... 其他信息: 我正在运行SS ..
发布时间:2020-09-29 20:07:57 其他开发

通过Shell脚本执行CQL?

我正在尝试从shell脚本执行CQL命令。 我能够连接到cqlsh(我正在使用的CQL版本是1.1.18),但是无法将查询发送到cql。 任何想法或建议如何进行此操作? 是否需要连接到Cassandra并使用shell脚本执行一些命令(选择/更新)? 解决方案 cqlsh -e”从ks.table限制1中选择*; > 〜/输出 ..
发布时间:2020-09-29 20:04:04 其他开发

Cassandra查询失败:所有尝试查询的主机均失败(未尝试任何主机)

我无法对Cassandra节点进行查询。我可以建立与群集的连接并进行连接。但是,在执行查询时,它会失败 原因:com.datastax.driver.core.exceptions.NoHostAvailableException:所有主机(s)尝试查询失败(未尝试任何主机)com.datastax.driver.core.RequestHandler.reportNoMoreHosts(R ..

在Cassandra列中存储JSON字符串的有效方法?

Cassandra新手问题。我正在使用REST呼叫从社交网站收集一些数据。因此,我最终获得了以JSON格式返回的数据。 JSON只是我表中的一列。我试图弄清楚存储JSON字符串的“最佳做法”是什么。 首先,我想到了使用 map 类型,但是JSON包含字符串,数字类型等的混合。就像我可以为地图键/值声明通配符类型一样。 JSON字符串可能很大,可能超过10KB。我可以将其存储为字符串,但 ..
发布时间:2020-09-29 19:50:07 其他开发

Cassandra控件的SSTable大小

有没有一种方法可以控制SSTable的最大大小,例如100 MB,以便当CF实际有超过100MB的数据时,Cassandra会创建下一个SSTable? 解决方案 不幸的是答案不是那么简单,您的SSTables的大小将受压缩策略的影响,并且没有直接的方法来控制最大sstable的大小。 / p> 当将内存表作为SSTables刷新到磁盘时,将首先创建SSTables。这些表的大小最初 ..
发布时间:2020-09-29 19:39:47 其他开发

如何获取Cassandra表中的行数

这是一个非常基本的问题,但实际上困扰了我好几天。是否有一种好方法来获得与Cassandra中给定表的 COUNT(*)等效的方法? 我将把几亿行移到C *中以进行一些负载测试,并且我希望至少在某些示例ETL作业之前获得行数我在网络上移动了大量数据。 我最好的主意是基本上使用Python遍历每一行并自动递增计数器。有没有更好的方法来确定(甚至估计)C *表的行大小?我还浏览了Datast ..
发布时间:2020-09-29 19:30:43 其他开发

Cassandra如何找到包含数据的节点?

我已经阅读了很多关于Cassandra的文章和关于SO的许多问题/答案,但是我仍然无法弄清楚Cassandra在读取数据时如何决定去哪个节点。 首先,对一个虚构簇进行一些假设: 复制策略=简单 使用随机分区程序 10个节点的群集 复制因子5 这是我根据我读过的各种Datastax文章和其他博客文章对写法的理解: 客户端将数据发送到随机节点 “随机”节点是基于主键的M ..
发布时间:2020-09-29 19:30:38 其他开发

Spark SQL查询失败

使用Sparks 2/java/Cassanda2.2 尝试运行一个简单的spark sql查询,它报错: 尝试如下,使用+变体,例如“'LAX'"和'=',而不是'=='. Exception in thread "main" org.apache.spark.sql.AnalysisException: cannot resolve '`LAX`' given input columns ..
发布时间:2020-09-04 21:03:19 Java开发

从Spark中的cassandra表中删除

我正在将Spark与cassandra一起使用.我正在从表中读取一些行,以便使用PrimaryKey删除主题.这是我的代码: val lines = sc.cassandraTable[(String, String, String, String)](CASSANDRA_SCHEMA, table). select("a","b","c","d"). where("d=?", d) ..
发布时间:2020-09-04 07:12:21 其他开发

无需停机即可将生产环境cassandra集群移至AWS cassandra

我有4个节点的cassandra集群在本地DC中的生产环境中运行.我必须将其移至AWS cassandra.由于某些原因,我不想将cassandra移至dynamoDB. 使用的Cassandra版本相当旧,即1.2.9. 如何将cassandra从本地DC迁移到AWS cassandra,而不会造成数据丢失和零停机时间. 关于, Vivek 解决方案 在AWS中创建新的 ..
发布时间:2020-08-23 20:23:43 其他开发

Cassandra从2.0.x升级到2.1.x或3.0.x

我已经搜索了该问题的早期版本,但似乎没有一个适合我的情况.我有一个运行2.0.x的现有Cassandra群集.我已经分配了新的VM,所以我不想升级现有的Cassandra节点-而是想迁移到a)新的VM和b)Cassandra的最新版本. 我知道就地升级,我会先升级到最新的2.0.x,然后再升级到最新的2.1.x. AFAIK,这里没有SSTable不一致.如果我通过添加新节点走这条路线,我假 ..

Cqlsh查询通配符

我希望查询执行以下操作 列出员工姓名(以A开头或结尾) 但是我在某些网站上看到cassandra不支持通配符是真的还是不正确的 我也引用了solr_query,但是cqlsh给出了错误的未定义名称solr_query 从emp中选择*,其中solr_query ='name:A *或name:* A';名字是coloumn的 请帮我解决这个问题 解决方案 全文 ..
发布时间:2020-07-07 06:23:52 其他开发

我们如何设置nodetool和cqlsh使其可以在Linux服务器上的任何位置和任何用户运行

我正在尝试设置环境变量,以便特定服务器上的任何用户都可以从linux文件系统中的任何位置运行诸如nodetool或cqlsh之类的命令.应该节省每次遍历到bin目录的精力. 我们怎样才能做到这一点?我的DSE 4.8是一个tarball安装. 解决方案 要设置环境变量,只需遵循root用户的一些步骤: # vi /etc/profile.d/cassandra.sh 将以下行添加 ..