cassandra 第3页 - IT屋-程序员软件开发技术分享社区

Cassandra 中的 MAX()、DISTINCT 和 group by

我正在尝试改造一个 SQL 数据库 Cassandra，以便我可以找到与 SQL 查询等效的 Cassandra.我使用 CQL 3 和 Cassandra v1.2.我在 cassandra 中对 db 设计进行了建模，使其支持 order by 子句和非规范化表以支持连接操作.但是，当涉及到 DISTINCT、SUM() 和 GROUPBY 等价物时，我感到很困惑 SELECT a1,MAX ..

发布时间：2022-01-13 13:06:59 nosql cassandra cql cql3 nosql-aggregation 其他开发

MySQL 和 NoSQL:帮我选一个合适的

有一个大数据库，有 1,000,000,000 行，称为线程(这些线程确实存在，我并不是因为我喜欢它而使事情变得更难).Threads 里面只有一些东西，让事情变得更快:(int id, string hash, int replycount, int dateline (timestamp), int forumid, string title) 查询: select * from ..

发布时间：2022-01-13 13:03:50 php mysql nosql cassandra PHP

用于分区大小的 Cassandra 存储桶拆分

我对 Cassandra 还很陌生，我只是通过 Datastax 课程学习的，但是我在此处或 Internet 上找不到有关存储桶的足够信息，并且在我的应用程序中，我需要使用存储桶来拆分我的数据. 我有一些可以测量的工具，很多，并且每天分割测量(时间戳作为分区键)可能有点冒险，因为我们很容易达到一个分区的 100MB 的限制.每个度量都涉及一个用 ID 标识的特定对象.所以想用桶，但是不知道 ..

发布时间：2022-01-11 09:53:48 cassandra time-series datastax partition bucket 其他开发

将海量有序时间序列数据存储在 bigtable 衍生品中

我正试图弄清楚这些新奇的数据存储，如 bigtable、hbase 和 cassandra 到底是什么. 我处理大量股票市场数据、数十亿行价格/报价数据，这些数据每天可以加起来高达 100 GB(尽管这些文本文件通常会压缩至少一个数量级).这些数据基本上是一些数字、两三个短字符串和一个时间戳(通常是毫秒级).如果我必须为每一行选择一个唯一标识符，我将不得不选择整行(因为交换可能会在同一毫秒内 ..

发布时间：2022-01-11 09:36:30 cassandra finance hbase bigtable time-series 其他开发

Cassandra 内部存储

我试图了解当在 CQL 样式表中插入行(列)时，存储引擎级别内部究竟发生了什么. 创建表 log_date (用户名 bigint，时间timeuuid，类别文字，子类别文本，itemid 文本，计数整数，价格整数，主键((用户 ID)，时间) - #1PRIMARY KEY ((userid), time, category, subcategory, itemid, count, price ..

发布时间：2022-01-11 09:31:12 cassandra apache-spark time-series cql 其他开发

如何确保 Cassandra 在不同表上的数据一致性?

我是 Cassandra 的新手，我听说 Cassandra 鼓励数据的非规范化和重复.这让我有点困惑.让我们想象以下场景: 我有一个包含四个表的键空间:A、B、C 和 D. 创建表 A (表 ID 整数，列 1 整数，column2 varchar,第 3 列 varchar，第 4 列 varchar，第 5 列 varchar，主键(column1，tableID)); 让我们假设 ..

发布时间：2022-01-10 14:01:05 cassandra duplicates cassandra-2.0 data-consistency 其他开发

如何彻底清除、重置和重启 Cassandra 集群?

我有一个旧的 Cassandra 集群需要恢复使用.我想清除所有用户和系统数据、所有存储的令牌、所有内容，然后从头开始 - 有推荐的方法吗? 解决方案这是我用于 Apache Cassandra 的过程: 首先在所有节点上停止 Cassandra，然后在每个节点上: rm -r rm -r rm ..

发布时间：2021-12-31 18:14:43 cassandra datastax-enterprise 其他开发

允许过滤，cql 中的数据建模

我目前正在 cassandra 中使用和研究数据建模实践.到目前为止，我知道您需要基于执行的查询进行数据建模.然而，多个 select 要求使得数据建模更难或不可能在 1 个表上处理.所以，当你不能在1张表上处理这些需求时，你需要插入2-3张表.换句话说，您需要对 1 个操作进行多次插入. 目前，我正在处理活动结构的数据模型.我在 cassandra 上有一个带有以下 cql 的竞选表； ..

发布时间：2021-12-31 18:14:34 cassandra 其他开发

ResponseError : 预期的 4 或 0 字节 int

我正在尝试 cassandra 节点驱动程序并在插入记录时遇到问题，看起来 cassandra 驱动程序无法插入浮点值. 问题:在db中传递int值插入时，api报错如下:调试:hapi、内部、实现、错误ResponseError: 预期的 4 或 0 字节 int (8)在 FrameReader.readError (/home/gaurav/Gaurav-Drive/code/nodejs ..

发布时间：2021-12-31 18:14:24 node.js cassandra cassandra-2.0 其他开发

Cassandra 轻量级交易的一致性级别

我了解了 Cassandra 2 的轻量级事务.在 QUORUM 中，这种写入的一致性级别总是吗?这是否意味着即使我有一个包含 100 个节点的多数据中心设置，也会涉及整个集群的仲裁(所有数据中心的大部分行副本)?这不会真的很慢并且不会影响可用性吗? 我们可以做 LOCAL_QUORUM 或 EACH_QUORUM 一致性吗?如果跨多个数据中心复制的数据的写入者始终仅来自特定数据中心，则这将 ..

发布时间：2021-12-31 18:14:16 transactions cassandra cassandra-2.0 consistency 其他开发

使用 cql 从 python 插入到 cassandra

我打算将数据插入到具有复合键的 CF 中. CREATE TABLE event_attend (event_id 整数，event_type varchar，event_user_id int,PRIMARY KEY (event_id, event_type) #复合键...); 但是我无法使用 cql 从 python 向这个 CF 插入数据.(http://code.google.co ..

发布时间：2021-12-31 18:14:06 python cassandra cql Python

Cassandra 错误 - Order By 仅在分区键受 EQ 或 IN 限制时支持

这是我正在创建的表格，该表格包含有关上次参加 Mundial 杯的球员的信息. 创建表玩家(组文本、装备文本、数字整数、位置文本、名称文本、日整数，月整数，年整数，俱乐部文本，联赛文本，队长文本，PRIMARY 键(名称、日、月、年))；进行以下查询时: 从担任选拔队队长的最年长球员那里获得 5 个名字这是我的查询: SELECT name FROM player WHERE ..

发布时间：2021-12-31 18:13:57 select cassandra sql-order-by cql 其他开发

cassandra 如果不存在则添加列

我需要通过 CQL 脚本将新列插入到现有列族中. 我想做类似的事情: alter COLUMNFAMILY rules ADD rule_template text IF NOT EXISTS; 我怎样才能完全在 CQL 脚本中实现这一点? 解决方案没有用于更改列族(表)的可选“如果不存在".作为一种解决方法，您可以只执行 alter 命令并忽略该列已存在的错误.除了错误消息外 ..

发布时间：2021-12-31 18:13:48 cassandra database-schema cql3 其他开发

Java 程序以 java 结果终止:137

我有一个用 netbeans 编写的程序.该程序从 cassandra 读取了大约 1,000,000 条数据，处理它们并再次将结果写入 cassandra.我的程序运行了大约 9 个小时，但突然因以下错误而终止: java 结果:137 我听说这些错误意味着 (128 + signalnember).在我的情况下，signalnember = 9 即 KILLSIGNAL.有没有人知道我怎样 ..

发布时间：2021-12-31 18:13:38 java netbeans cassandra kill-process Java开发

如何检查 Cassandra 表是否存在

是否有一种简单的方法可以使用 CQL(或 API，使用 com.datastax.driver)检查 Cassandra 中是否定义了表(列族)? 现在我倾向于执行 SELECT 1 FROM table 并检查异常，但也许有更好的方法? 解决方案从 1.1 开始，您应该能够查询 system 键空间、schema_columnfamilies 列族.如果您知道要检查哪个键空间，则 ..

发布时间：2021-12-31 18:13:29 cassandra cql 其他开发

Cassandra 服务器抛出 java.lang.AssertionError: DecoratedKey(...) != DecoratedKey

我目前正在试用 Cassandra. 在客户端(使用 Hector)，我查找如下几个键: ColumnFamilyResultresult = template.queryColumns(Arrays.asList("key1","key2","key3")); 大部分时间它似乎都有效.但有时我会在客户端上遇到超时异常: 引起:me.prettyprint.hector.api.exc ..

发布时间：2021-12-31 18:13:22 cassandra hector 其他开发

Cassandra 和 MapReduce - 最低设置要求

我需要在我的 Cassandra 集群上执行 MapReduce，包括数据局部性，即.每个作业只查询属于作业运行所在的本地卡桑德拉节点的行. 存在有关如何在较旧的 Cassandra 版本 (0.7) 上为 MR 设置 Hadoop 的教程.我在当前版本中找不到这样的. 自 0.7 以来在这方面发生了哪些变化? 最小设置(Hadoop+HDFS+...)需要哪些软件模块? ..

发布时间：2021-12-31 18:13:13 hadoop mapreduce cassandra 其他开发

Cassandra 中的二级索引和倒排索引有什么区别?

当我读到这两个时，我认为他们都在解释相同的方法，我用谷歌搜索但什么也没找到.执行上有区别吗?Cassandra自己做二级索引，倒排索引要自己实现? 顺便说一下，哪个搜索速度更快? 解决方案主要区别在于 Cassandra 中的二级索引的分布方式与手动倒排索引的分布方式不同.使用内置的二级索引，每个节点都对其本地存储的数据进行索引(使用 LocalPartitioner).通过手动索 ..

发布时间：2021-12-31 18:13:03 search indexing cassandra inverted-index 其他开发

在同一台机器上运行多个 cassandra 节点(一个集群)?

如何从我的 Ubuntu 运行 3 个 cassandra 节点(实际上是一个集群)?我不想创建 3 个 VMWare/VirtualBox 实例，而是将每个 cassandra 节点配置为侦听不同的端口.安装一个 cassandra 可以吗? 我想到的一个解决方案是安装 3 个本地 cassandra 并独立配置每个 cassandra.yaml，但实际上我更愿意通过我安装的 cassan ..

发布时间：2021-12-31 18:12:55 cassandra cluster-computing 其他开发

如果表具有 SET 类型列，则 Cassandra IN 查询不起作用

我是 Cassandra 的新手.我在 CQL IN 查询中遇到问题，如果表具有 SET 类型列，则它可以工作. 创建表测试(test_date bigint，test_id bigint，标题文字，PRIMARY KEY(test_date,test_id));select * from test where test_date = 2022015 and test_id IN (1,2); ..

发布时间：2021-12-31 18:12:44 cassandra cql 其他开发

cassandra相关内容