cassandra-2.0相关内容
您好,我刚刚在表my_table中添加了新列Business_sys: ALTER TABLE my_table ALTER business_sys TYPE set ; 但是我还是删除了该列名,因为我想更改列的类型: ALTER TABLE my_table DROP business_sys; 再次尝试添加具有不同类型的相同
..
假设我有一个复制因子(RF)= 2的2节点群集。 我用一致性2触发了一个插入操作。当客户端等待响应时,Cassandra开始写入这2个节点。在一个节点之间失败并且无法完成写入,而在另一节点上成功写入。客户端将不会收到成功消息,因为无法满足一致性要求。 Cassandra中没有回滚。那么,Cassandra如何以及何时从该节点中删除插入的记录或将其标记为“不使用”? 相关问题:即使无法满足
..
我在网上找不到任何东西。如何在cassandra中创建自定义用户定义的函数?。 对于Ex: 创建或替换功能customfunc(custommap map) 在空输入上调用 返回map 语言java AS‘返回MyClass.mymethod(custommap);’; “ MyClass”是可以在类路径中注册的类吗?
..
我有一个Cassandra数据中心,我想对其进行全面维修。数据中心用于分析/批处理,我愿意牺牲延迟以加快全面修复的速度( nodetool修复)。 我有什么选择可以使完整修复更快?一些想法: 增加 streamthroughput ? 我想我可以禁用自动压缩功能并暂时删除 compactionthroughput 。但是,不确定我是否愿意... 其他信息: 我正在运行SS
..
我正在尝试从shell脚本执行CQL命令。 我能够连接到cqlsh(我正在使用的CQL版本是1.1.18),但是无法将查询发送到cql。 任何想法或建议如何进行此操作? 是否需要连接到Cassandra并使用shell脚本执行一些命令(选择/更新)? 解决方案 cqlsh -e”从ks.table限制1中选择*; > 〜/输出
..
我有一个具有以下架构的cassandra列族或CQL表: 创建表user_actions( company_id varchar, employee_id varchar, insert_at timeuuid, action_type varchar, PRIMARY KEY((company_id,employee_id),insert_at) )含排序顺序(insertted
..
我无法对Cassandra节点进行查询。我可以建立与群集的连接并进行连接。但是,在执行查询时,它会失败 原因:com.datastax.driver.core.exceptions.NoHostAvailableException:所有主机(s)尝试查询失败(未尝试任何主机)com.datastax.driver.core.RequestHandler.reportNoMoreHosts(R
..
Cassandra新手问题。我正在使用REST呼叫从社交网站收集一些数据。因此,我最终获得了以JSON格式返回的数据。 JSON只是我表中的一列。我试图弄清楚存储JSON字符串的“最佳做法”是什么。 首先,我想到了使用 map 类型,但是JSON包含字符串,数字类型等的混合。就像我可以为地图键/值声明通配符类型一样。 JSON字符串可能很大,可能超过10KB。我可以将其存储为字符串,但
..
我正在尝试在表格中插入一个简单的行。有人可以指出这里发生了什么吗? 创建表Recommendation_engine_poc.user_by_category( game_category文本, customer_id文本, 数量加倍, game_date时间戳, 主键(game_category,customer_id) ),并带有排序顺序(customer_id ASC) 和blo
..
有没有一种方法可以控制SSTable的最大大小,例如100 MB,以便当CF实际有超过100MB的数据时,Cassandra会创建下一个SSTable? 解决方案 不幸的是答案不是那么简单,您的SSTables的大小将受压缩策略的影响,并且没有直接的方法来控制最大sstable的大小。 / p> 当将内存表作为SSTables刷新到磁盘时,将首先创建SSTables。这些表的大小最初
..
这是一个非常基本的问题,但实际上困扰了我好几天。是否有一种好方法来获得与Cassandra中给定表的 COUNT(*)等效的方法? 我将把几亿行移到C *中以进行一些负载测试,并且我希望至少在某些示例ETL作业之前获得行数我在网络上移动了大量数据。 我最好的主意是基本上使用Python遍历每一行并自动递增计数器。有没有更好的方法来确定(甚至估计)C *表的行大小?我还浏览了Datast
..
我已经阅读了很多关于Cassandra的文章和关于SO的许多问题/答案,但是我仍然无法弄清楚Cassandra在读取数据时如何决定去哪个节点。 首先,对一个虚构簇进行一些假设: 复制策略=简单 使用随机分区程序 10个节点的群集 复制因子5 这是我根据我读过的各种Datastax文章和其他博客文章对写法的理解: 客户端将数据发送到随机节点 “随机”节点是基于主键的M
..
使用Sparks 2/java/Cassanda2.2 尝试运行一个简单的spark sql查询,它报错: 尝试如下,使用+变体,例如“'LAX'"和'=',而不是'=='. Exception in thread "main" org.apache.spark.sql.AnalysisException: cannot resolve '`LAX`' given input columns
..
我正在尝试运行我的第一个spark作业(访问Cassandra的Scala作业),该作业失败并显示以下错误: java.io.IOException: Failed to open native connection to Cassandra at {}:9042 at com.datastax.spark.connector.cql.CassandraConnector$.com$
..
我正在将Spark与cassandra一起使用.我正在从表中读取一些行,以便使用PrimaryKey删除主题.这是我的代码: val lines = sc.cassandraTable[(String, String, String, String)](CASSANDRA_SCHEMA, table). select("a","b","c","d"). where("d=?", d)
..
我在cassandra中使用spark,并且有JavaRDD个客户端.对于每个客户,我都希望从cassandra中选择他的互动方式,例如: avaPairRDD> a = client.mapToPair(new PairFunction
..
我有4个节点的cassandra集群在本地DC中的生产环境中运行.我必须将其移至AWS cassandra.由于某些原因,我不想将cassandra移至dynamoDB. 使用的Cassandra版本相当旧,即1.2.9. 如何将cassandra从本地DC迁移到AWS cassandra,而不会造成数据丢失和零停机时间. 关于, Vivek 解决方案 在AWS中创建新的
..
我已经搜索了该问题的早期版本,但似乎没有一个适合我的情况.我有一个运行2.0.x的现有Cassandra群集.我已经分配了新的VM,所以我不想升级现有的Cassandra节点-而是想迁移到a)新的VM和b)Cassandra的最新版本. 我知道就地升级,我会先升级到最新的2.0.x,然后再升级到最新的2.1.x. AFAIK,这里没有SSTable不一致.如果我通过添加新节点走这条路线,我假
..
我希望查询执行以下操作 列出员工姓名(以A开头或结尾) 但是我在某些网站上看到cassandra不支持通配符是真的还是不正确的 我也引用了solr_query,但是cqlsh给出了错误的未定义名称solr_query 从emp中选择*,其中solr_query ='name:A *或name:* A';名字是coloumn的 请帮我解决这个问题 解决方案 全文
..
我正在尝试设置环境变量,以便特定服务器上的任何用户都可以从linux文件系统中的任何位置运行诸如nodetool或cqlsh之类的命令.应该节省每次遍历到bin目录的精力. 我们怎样才能做到这一点?我的DSE 4.8是一个tarball安装. 解决方案 要设置环境变量,只需遵循root用户的一些步骤: # vi /etc/profile.d/cassandra.sh 将以下行添加
..