datastax-enterprise相关内容
我正在尝试以嵌套方式按多个字段执行搜索结果聚合(计数和总和)分组. 例如,使用本文末尾显示的架构,我希望能够获得按“类别"分组并按“子类别"进一步分组的“大小"总和,并得到类似这个: …… 我主要关注 Solr 的 Stats 组件
..
我有一个旧的 Cassandra 集群需要恢复使用.我想清除所有用户和系统数据、所有存储的令牌、所有内容,然后从头开始 - 有推荐的方法吗? 解决方案 这是我用于 Apache Cassandra 的过程: 首先在所有节点上停止 Cassandra,然后在每个节点上: rm -r rm -r rm
..
我有 64 个火花芯.我的 cassandra 集群中有超过 8000 万行数据,总计 4.2 GB.我现在需要 82 秒来处理这些数据.我希望这减少到 8 秒.对此有何想法?这甚至可能吗?谢谢. 这是我想要改进的 Spark 应用程序的一部分: axes = sqlContext.read.format("org.apache.spark.sql.cassandra")\.options
..
Dataframe A(百万条记录)其中一列是create_date,modified_date Dataframe B 500 记录有 start_date 和 end_date 目前的方法: 从 start_date 和 end_date 之间的 a.create_date 上的连接 b 中选择 a.*,b.* 上述工作需要半小时或更长时间才能运行. 如何提高性能
..
我正在根据我的分区键的令牌范围从 cassandra 节点中选择所有记录. 代码如下: 公共静态同步列表获取令牌范围(最后一届会议){如果(集群==空){集群 = session.getCluster();}元数据元数据 = cluster.getMetadata();返回 unwrapTokenRanges(metadata.getTokenRanges());}私有静态列表unwrap
..
我将 OpsCenter 从 5.1.3 升级到 5.2.0(然后升级到 5.2.1).在升级之前,我有一个到本地服务器的计划备份和一个 S3 位置配置,它在 OpsCenter 5.1.3 上运行良好.在升级期间或升级之后,我没有对计划的备份进行任何更改. 升级后的第二天,S3 备份失败.在 opscenterd.log 中,我看到以下错误: 2015-09-28 17:00:00+
..
注意:我们在 Cassandra 2.1.12.1047 (DSE 4.8.4) 集群中看到了这个问题,集群有 6 个节点,跨越 3 个区域(每个区域 2 个). 最近尝试更新我们集群上的架构,我们发现更新失败.我们怀疑集群中的一个节点不接受更改. 当检查我们在 us-east-1 中的一台服务器的 system.peers 表时,它有一个异常,它似乎是一个完整的主机条目,没有存在.
..
我最近降低了 CQL 表的 gc_grace_seconds.我正在运行 LeveledCompactionStrategy.我是否可以强制清除 SSTable 中的旧墓碑? 解决方案 TL;DR 您的墓碑会通过压实位自行消失,请确保您正在维修,否则它们可能会死而复生. http://www.datastax.com/documentation/cassandra/2.0/ca
..
当我尝试在 ubuntu 12.04(通过 Datastax 的 dsc20 包安装)作为服务启动 cassandra 时: $ sudo service cassandra start 它说 *无法访问 Cassandra 的 pidfile &日志中没有其他消息或任何内容. 但是当我尝试以 root 用户身份运行时(sudo cassandra -f),它运行正常
..
我想不使用节点私有 IP 地址而是使用弹性公共 IP 在 Amazon EC2 实例上运行 Cassandra Datastax Enterprise 我当前的配置如下: /etc/dse/cassandra/cassandra.yaml种子提供者:- 类名:org.apache.cassandra.locator.SimpleSeedProvider参数:种子:“公共IP"听地址:“公共
..
在 早期的 CQ 测试版L 中,有一个命令我可以用来设置单个 CQL 操作的读/写一致性.它看起来像这样: SELECT * FROM users WHERE state='TX' USING CONSISTENCY QUORUM; 我经常使用 CQL3 并且有一个用例,我需要能够以比我们应用程序的其余部分更高的一致性级别执行读取. 我浏览了 CQL3 参考,但没有发现任何提及C
..
我正在尝试使用以下方法过滤巨大的 C* 表的一小部分: val snapshotsFiltered = sc.parallelize(startDate to endDate).map(TableKey(_)).joinWithCassandraTable("listener","snapshots_tspark")println("完成加入")//********//只获取快照并创建rdd临
..
我正在尝试运行以下查询 SELECT edge_id, b_id FROM booking_by_edge WHERE edge_id IN ? 我将 Long 的 Java 列表绑定为参数,但出现异常 SyntaxError: line 0:-1 不匹配的输入 ''期待 ')' (ResultSetFuture.java:242) 如果我尝试使用 (?) 它期望绑定单个 Long 项目,
..
当我尝试使用以下查询在 Cassandra 中插入数据时,出现以下错误 cqlsh:assign>插入到 tblFiles1(rec_no,clientid,contenttype,datafiles,filename) values(1,2,'gd','dgfsdg','aww'); WriteTimeout: code=1100 [Coordinator 节点超时等待副本节点的响应] me
..
我想知道如何使用 Cassandra 实现分页. 假设我有一个博客.该博客每页最多列出 10 个帖子.要访问下一个帖子,用户必须点击分页菜单才能访问第 2 页(帖子 11-20)、第 3 页(帖子 21-30)等. 在 MySQL 下使用 SQL,我可以做到以下几点: SELECT * FROM 帖子 LIMIT 20,10; LIMIT 的第一个参数是从结果集开始的偏移量,第二个
..
我正在尝试在 Spark 1.1.0 中使用 Spark Cassandra 连接器. 我已经成功地从 GitHub 上的 master 分支构建了 jar 文件,并且已经让包含的演示工作.但是,当我尝试将 jar 文件加载到 spark-shell 中时,我无法从 com.datastax.spark.connector 包中导入任何类. 我尝试在 spark-shell 上使用 -
..
我将 DSE 用于 Cassandra/Solr 集成,以便数据存储在 Cassandra 中并在 Solr 中建立索引.分别使用Cassandra处理CRUD操作和使用Solr进行全文搜索是很自然的,而DSE确实可以简化Cassandra和Solr之间的数据同步. 然而,当谈到查询时,实际上有两种方法可以走:Cassandra 二级/手动配置索引与 Solr.我想知道何时使用哪种方法以及一
..
Solr 动态字段在 Solr 中显示为可搜索并在 Thrift 界面中可用,但在使用 CQL 时,这些字段不会出现.是否有特定的搜索样式或查询样式可用于公开动态字段及其值? 解决方案 通过 CQL3 动态字段应该也能正常工作,但有一些注意事项. 您需要将类型声明为映射(例如:dyn_map)并创建 CQL 架构. 使用声明的动态类型发布您的架构. 动态部分不是通过容器(地图)的
..
以下文档页面说不建议将 vnodes 用于 Solr/Hadoop 节点: http://www.datastax.com/documentation/datastax_enterprise/4.0/datastax_enterprise/srch/srchIntro.htmlhttp://www.datastax.com/documentation/datastax_enterprise/
..
我正在尝试读取位于孟买地区的 s3 存储桶上的 CSV 文件.我正在尝试使用 datastax dse spark-submit 读取文件. 我尝试将 hadoop-aws 版本更改为各种其他版本.目前,hadoop-aws 版本为 2.7.3 spark.sparkContext.hadoopConfiguration.set("com.amazonaws.services.s3.ena
..