datastax-enterprise - IT屋-程序员软件开发技术分享社区

如何对 Solr 中的多个字段执行嵌套聚合?

我正在尝试以嵌套方式按多个字段执行搜索结果聚合(计数和总和)分组. 例如，使用本文末尾显示的架构，我希望能够获得按“类别"分组并按“子类别"进一步分组的“大小"总和，并得到类似这个: …… 我主要关注 Solr 的 Stats 组件 ..

发布时间：2022-01-15 13:24:17 java solr lucene indexing datastax-enterprise Java开发

如何彻底清除、重置和重启 Cassandra 集群?

我有一个旧的 Cassandra 集群需要恢复使用.我想清除所有用户和系统数据、所有存储的令牌、所有内容，然后从头开始 - 有推荐的方法吗? 解决方案这是我用于 Apache Cassandra 的过程: 首先在所有节点上停止 Cassandra，然后在每个节点上: rm -r rm -r rm ..

发布时间：2021-12-31 18:14:43 cassandra datastax-enterprise 其他开发

如何改进我的 Spark 应用程序的 reducebykey 部分?

我有 64 个火花芯.我的 cassandra 集群中有超过 8000 万行数据，总计 4.2 GB.我现在需要 82 秒来处理这些数据.我希望这减少到 8 秒.对此有何想法?这甚至可能吗?谢谢. 这是我想要改进的 Spark 应用程序的一部分: axes = sqlContext.read.format("org.apache.spark.sql.cassandra")\.options ..

发布时间：2021-12-31 18:04:50 python apache-spark cassandra datastax datastax-enterprise Python

Spark最佳方法查找数据帧以提高性能

Dataframe A(百万条记录)其中一列是create_date,modified_date Dataframe B 500 记录有 start_date 和 end_date 目前的方法: 从 start_date 和 end_date 之间的 a.create_date 上的连接 b 中选择 a.*,b.* 上述工作需要半小时或更长时间才能运行. 如何提高性能 ..

发布时间：2021-12-31 18:02:16 scala apache-spark cassandra datastax-enterprise 其他开发

基于令牌范围的分区键查询的性能?

我正在根据我的分区键的令牌范围从 cassandra 节点中选择所有记录. 代码如下: 公共静态同步列表获取令牌范围(最后一届会议){如果(集群==空){集群 = session.getCluster();}元数据元数据 = cluster.getMetadata();返回 unwrapTokenRanges(metadata.getTokenRanges());}私有静态列表unwrap ..

发布时间：2021-12-31 17:56:58 cassandra datastax-enterprise cassandra-3.0 其他开发

无法使用 OpsCenter 5.2.1 备份到 S3

我将 OpsCenter 从 5.1.3 升级到 5.2.0(然后升级到 5.2.1).在升级之前，我有一个到本地服务器的计划备份和一个 S3 位置配置，它在 OpsCenter 5.1.3 上运行良好.在升级期间或升级之后，我没有对计划的备份进行任何更改. 升级后的第二天，S3 备份失败.在 opscenterd.log 中，我看到以下错误: 2015-09-28 17:00:00+ ..

发布时间：2021-12-31 17:52:49 cassandra datastax-enterprise opscenter 其他开发

集群中的 Cassandra 主机，ID 为空

注意:我们在 Cassandra 2.1.12.1047 (DSE 4.8.4) 集群中看到了这个问题，集群有 6 个节点，跨越 3 个区域(每个区域 2 个). 最近尝试更新我们集群上的架构，我们发现更新失败.我们怀疑集群中的一个节点不接受更改. 当检查我们在 us-east-1 中的一台服务器的 system.peers 表时，它有一个异常，它似乎是一个完整的主机条目，没有存在. ..

发布时间：2021-12-31 17:50:37 cassandra datastax-enterprise datastax-startup 其他开发

我可以强制清理旧墓碑吗?

我最近降低了 CQL 表的 gc_grace_seconds.我正在运行 LeveledCompactionStrategy.我是否可以强制清除 SSTable 中的旧墓碑? 解决方案 TL;DR 您的墓碑会通过压实位自行消失，请确保您正在维修，否则它们可能会死而复生. http://www.datastax.com/documentation/cassandra/2.0/ca ..

发布时间：2021-12-31 17:45:39 cassandra datastax datastax-enterprise tombstone 其他开发

将 cassandra 作为服务启动不适用于 2.0.5， sudo cassandra -f 有效

当我尝试在 ubuntu 12.04(通过 Datastax 的 dsc20 包安装)作为服务启动 cassandra 时: $ sudo service cassandra start 它说 *无法访问 Cassandra 的 pidfile &日志中没有其他消息或任何内容. 但是当我尝试以 root 用户身份运行时(sudo cassandra -f)，它运行正常 ..

发布时间：2021-12-31 17:44:24 cassandra datastax-enterprise datastax 其他开发

使用 Amazon Elastic IP 的 Cassandra Datastax Enterprise

我想不使用节点私有 IP 地址而是使用弹性公共 IP 在 Amazon EC2 实例上运行 Cassandra Datastax Enterprise 我当前的配置如下: /etc/dse/cassandra/cassandra.yaml种子提供者:- 类名:org.apache.cassandra.locator.SimpleSeedProvider参数:种子:“公共IP"听地址:“公共 ..

发布时间：2021-12-31 17:40:22 amazon-web-services cassandra datastax-enterprise datastax 其他开发

如何在 CQL3 中设置单个 CQL 查询的一致性级别?

在早期的 CQ 测试版L 中，有一个命令我可以用来设置单个 CQL 操作的读/写一致性.它看起来像这样: SELECT * FROM users WHERE state='TX' USING CONSISTENCY QUORUM; 我经常使用 CQL3 并且有一个用例，我需要能够以比我们应用程序的其余部分更高的一致性级别执行读取. 我浏览了 CQL3 参考，但没有发现任何提及C ..

发布时间：2021-12-31 17:36:01 cassandra cql3 datastax-enterprise consistency 其他开发

Spark JoinWithCassandraTable on TimeStamp 分区键 STUCK

我正在尝试使用以下方法过滤巨大的 C* 表的一小部分: val snapshotsFiltered = sc.parallelize(startDate to endDate).map(TableKey(_)).joinWithCassandraTable("listener","snapshots_tspark")println("完成加入")//********//只获取快照并创建rdd临 ..

发布时间：2021-12-31 17:25:59 mysql scala cassandra apache-spark datastax-enterprise 数据库

在 Datastax Cassandra CQL 驱动程序的 IN 子句中收集准备好的语句

我正在尝试运行以下查询 SELECT edge_id, b_id FROM booking_by_edge WHERE edge_id IN ? 我将 Long 的 Java 列表绑定为参数，但出现异常 SyntaxError: line 0:-1 不匹配的输入 ''期待 ')' (ResultSetFuture.java:242) 如果我尝试使用 (?) 它期望绑定单个 Long 项目， ..

发布时间：2021-12-31 17:24:35 cassandra cql cql3 datastax-enterprise datastax-java-driver 其他开发

协调器节点在插入数据时等待 Cassandra Datastax 中的副本节点超时

当我尝试使用以下查询在 Cassandra 中插入数据时，出现以下错误 cqlsh:assign>插入到 tblFiles1(rec_no,clientid,contenttype,datafiles,filename) values(1,2,'gd','dgfsdg','aww'); WriteTimeout: code=1100 [Coordinator 节点超时等待副本节点的响应] me ..

发布时间：2021-12-31 17:24:01 cassandra cql datastax-enterprise 其他开发

Cassandra (CQL) 中的结果分页

我想知道如何使用 Cassandra 实现分页. 假设我有一个博客.该博客每页最多列出 10 个帖子.要访问下一个帖子，用户必须点击分页菜单才能访问第 2 页(帖子 11-20)、第 3 页(帖子 21-30)等. 在 MySQL 下使用 SQL，我可以做到以下几点: SELECT * FROM 帖子 LIMIT 20,10; LIMIT 的第一个参数是从结果集开始的偏移量，第二个 ..

发布时间：2021-12-31 17:17:49 cassandra cql cql3 datastax-enterprise 其他开发

如何在外壳中加载 Spark Cassandra 连接器?

我正在尝试在 Spark 1.1.0 中使用 Spark Cassandra 连接器. 我已经成功地从 GitHub 上的 master 分支构建了 jar 文件，并且已经让包含的演示工作.但是，当我尝试将 jar 文件加载到 spark-shell 中时，我无法从 com.datastax.spark.connector 包中导入任何类. 我尝试在 spark-shell 上使用 - ..

发布时间：2021-12-31 17:17:44 cassandra apache-spark datastax-enterprise 其他开发

什么时候在 DSE 中使用 Cassandra 和 Solr?

我将 DSE 用于 Cassandra/Solr 集成，以便数据存储在 Cassandra 中并在 Solr 中建立索引.分别使用Cassandra处理CRUD操作和使用Solr进行全文搜索是很自然的，而DSE确实可以简化Cassandra和Solr之间的数据同步. 然而，当谈到查询时，实际上有两种方法可以走:Cassandra 二级/手动配置索引与 Solr.我想知道何时使用哪种方法以及一 ..

发布时间：2021-12-30 09:00:12 solr cassandra datastax-enterprise 其他开发

如何使用 Cassandra 在 CQL 中查看 SOLR 动态字段?

Solr 动态字段在 Solr 中显示为可搜索并在 Thrift 界面中可用，但在使用 CQL 时，这些字段不会出现.是否有特定的搜索样式或查询样式可用于公开动态字段及其值? 解决方案通过 CQL3 动态字段应该也能正常工作，但有一些注意事项. 您需要将类型声明为映射(例如:dyn_map)并创建 CQL 架构. 使用声明的动态类型发布您的架构. 动态部分不是通过容器(地图)的 ..

发布时间：2021-12-30 08:48:42 solr cassandra datastax-enterprise 其他开发

DSE Solr 节点和 vnode

以下文档页面说不建议将 vnodes 用于 Solr/Hadoop 节点: http://www.datastax.com/documentation/datastax_enterprise/4.0/datastax_enterprise/srch/srchIntro.htmlhttp://www.datastax.com/documentation/datastax_enterprise/ ..

发布时间：2021-12-30 08:47:19 solr datastax-enterprise 其他开发

在 Datastax Spark 提交中使用 Scala 从 S3 存储桶读取文件到 Spark 数据帧，给出 AWS 错误消息:错误请求

我正在尝试读取位于孟买地区的 s3 存储桶上的 CSV 文件.我正在尝试使用 datastax dse spark-submit 读取文件. 我尝试将 hadoop-aws 版本更改为各种其他版本.目前，hadoop-aws 版本为 2.7.3 spark.sparkContext.hadoopConfiguration.set("com.amazonaws.services.s3.ena ..

发布时间：2021-11-14 22:54:11 scala apache-spark amazon-s3 apache-spark-sql datastax-enterprise 其他开发

datastax-enterprise相关内容