cassandra相关内容

Cassandra 中的 MAX()、DISTINCT 和 group by

我正在尝试改造一个 SQL 数据库 Cassandra,以便我可以找到与 SQL 查询等效的 Cassandra.我使用 CQL 3 和 Cassandra v1.2.我在 cassandra 中对 db 设计进行了建模,使其支持 order by 子句和非规范化表以支持连接操作.但是,当涉及到 DISTINCT、SUM() 和 GROUPBY 等价物时,我感到很困惑 SELECT a1,MAX ..
发布时间:2022-01-13 13:06:59 其他开发

MySQL 和 NoSQL:帮我选一个合适的

有一个大数据库,有 1,000,000,000 行,称为线程(这些线程确实存在,我并不是因为我喜欢它而使事情变得更难).Threads 里面只有一些东西,让事情变得更快:(int id, string hash, int replycount, int dateline (timestamp), int forumid, string title) 查询: select * from ..
发布时间:2022-01-13 13:03:50 PHP

用于分区大小的 Cassandra 存储桶拆分

我对 Cassandra 还很陌生,我只是通过 Datastax 课程学习的,但是我在此处或 Internet 上找不到有关存储桶的足够信息,并且在我的应用程序中,我需要使用存储桶来拆分我的数据. 我有一些可以测量的工具,很多,并且每天分割测量(时间戳作为分区键)可能有点冒险,因为我们很容易达到一个分区的 100MB 的限制.每个度量都涉及一个用 ID 标识的特定对象.所以想用桶,但是不知道 ..
发布时间:2022-01-11 09:53:48 其他开发

将海量有序时间序列数据存储在 bigtable 衍生品中

我正试图弄清楚这些新奇的数据存储,如 bigtable、hbase 和 cassandra 到底是什么. 我处理大量股票市场数据、数十亿行价格/报价数据,这些数据每天可以加起来高达 100 GB(尽管这些文本文件通常会压缩至少一个数量级).这些数据基本上是一些数字、两三个短字符串和一个时间戳(通常是毫秒级).如果我必须为每一行选择一个唯一标识符,我将不得不选择整行(因为交换可能会在同一毫秒内 ..
发布时间:2022-01-11 09:36:30 其他开发

Cassandra 内部存储

我试图了解当在 CQL 样式表中插入行(列)时,存储引擎级别内部究竟发生了什么. 创建表 log_date (用户名 bigint,时间timeuuid,类别文字,子类别文本,itemid 文本,计数整数,价格整数,主键((用户 ID),时间) - #1PRIMARY KEY ((userid), time, category, subcategory, itemid, count, price ..
发布时间:2022-01-11 09:31:12 其他开发

如何确保 Cassandra 在不同表上的数据一致性?

我是 Cassandra 的新手,我听说 Cassandra 鼓励数据的非规范化和重复.这让我有点困惑.让我们想象以下场景: 我有一个包含四个表的键空间:A、B、C 和 D. 创建表 A (表 ID 整数,列 1 整数,column2 varchar,第 3 列 varchar,第 4 列 varchar,第 5 列 varchar,主键(column1,tableID)); 让我们假设 ..
发布时间:2022-01-10 14:01:05 其他开发

允许过滤,cql 中的数据建模

我目前正在 cassandra 中使用和研究数据建模实践.到目前为止,我知道您需要基于执行的查询进行数据建模.然而,多个 select 要求使得数据建模更难或不可能在 1 个表上处理.所以,当你不能在1张表上处理这些需求时,你需要插入2-3张表.换句话说,您需要对 1 个操作进行多次插入. 目前,我正在处理活动结构的数据模型.我在 cassandra 上有一个带有以下 cql 的竞选表; ..
发布时间:2021-12-31 18:14:34 其他开发

ResponseError : 预期的 4 或 0 字节 int

我正在尝试 cassandra 节点驱动程序并在插入记录时遇到问题,看起来 cassandra 驱动程序无法插入浮点值. 问题:在db中传递int值插入时,api报错如下:调试:hapi、内部、实现、错误ResponseError: 预期的 4 或 0 字节 int (8)在 FrameReader.readError (/home/gaurav/Gaurav-Drive/code/nodejs ..
发布时间:2021-12-31 18:14:24 其他开发

Cassandra 轻量级交易的一致性级别

我了解了 Cassandra 2 的轻量级事务.在 QUORUM 中,这种写入的一致性级别总是吗?这是否意味着即使我有一个包含 100 个节点的多数据中心设置,也会涉及整个集群的仲裁(所有数据中心的大部分行副本)?这不会真的很慢并且不会影响可用性吗? 我们可以做 LOCAL_QUORUM 或 EACH_QUORUM 一致性吗?如果跨多个数据中心复制的数据的写入者始终仅来自特定数据中心,则这将 ..
发布时间:2021-12-31 18:14:16 其他开发

使用 cql 从 python 插入到 cassandra

我打算将数据插入到具有复合键的 CF 中. CREATE TABLE event_attend (event_id 整数,event_type varchar,event_user_id int,PRIMARY KEY (event_id, event_type) #复合键...); 但是我无法使用 cql 从 python 向这个 CF 插入数据.(http://code.google.co ..
发布时间:2021-12-31 18:14:06 Python

Cassandra 错误 - Order By 仅在分区键受 EQ 或 IN 限制时支持

这是我正在创建的表格,该表格包含有关上次参加 Mundial 杯的球员的信息. 创建表玩家(组文本、装备文本、数字整数、位置文本、名称文本、日整数,月整数,年整数,俱乐部文本,联赛文本,队长文本,PRIMARY 键(名称、日、月、年)); 进行以下查询时: 从担任选拔队队长的最年长球员那里获得 5 个名字 这是我的查询: SELECT name FROM player WHERE ..
发布时间:2021-12-31 18:13:57 其他开发

cassandra 如果不存在则添加列

我需要通过 CQL 脚本将新列插入到现有列族中. 我想做类似的事情: alter COLUMNFAMILY rules ADD rule_template text IF NOT EXISTS; 我怎样才能完全在 CQL 脚本中实现这一点? 解决方案 没有用于更改列族(表)的可选“如果不存在".作为一种解决方法,您可以只执行 alter 命令并忽略该列已存在的错误.除了错误消息外 ..
发布时间:2021-12-31 18:13:48 其他开发

Java 程序以 java 结果终止:137

我有一个用 netbeans 编写的程序.该程序从 cassandra 读取了大约 1,000,000 条数据,处理它们并再次将结果写入 cassandra.我的程序运行了大约 9 个小时,但突然因以下错误而终止: java 结果:137 我听说这些错误意味着 (128 + signalnember).在我的情况下,signalnember = 9 即 KILLSIGNAL.有没有人知道我怎样 ..
发布时间:2021-12-31 18:13:38 Java开发

如何检查 Cassandra 表是否存在

是否有一种简单的方法可以使用 CQL(或 API,使用 com.datastax.driver)检查 Cassandra 中是否定义了表(列族)? 现在我倾向于执行 SELECT 1 FROM table 并检查异常,但也许有更好的方法? 解决方案 从 1.1 开始,您应该能够查询 system 键空间、schema_columnfamilies 列族.如果您知道要检查哪个键空间,则 ..
发布时间:2021-12-31 18:13:29 其他开发

Cassandra 和 MapReduce - 最低设置要求

我需要在我的 Cassandra 集群上执行 MapReduce,包括数据局部性,即.每个作业只查询属于作业运行所在的本地卡桑德拉节点的行. 存在有关如何在较旧的 Cassandra 版本 (0.7) 上为 MR 设置 Hadoop 的教程.我在当前版本中找不到这样的. 自 0.7 以来在这方面发生了哪些变化? 最小设置(Hadoop+HDFS+...)需要哪些软件模块? ..
发布时间:2021-12-31 18:13:13 其他开发

Cassandra 中的二级索引和倒排索引有什么区别?

当我读到这两个时,我认为他们都在解释相同的方法,我用谷歌搜索但什么也没找到.执行上有区别吗?Cassandra自己做二级索引,倒排索引要自己实现? 顺便说一下,哪个搜索速度更快? 解决方案 主要区别在于 Cassandra 中的二级索引的分布方式与手动倒排索引的分布方式不同.使用内置的二级索引,每个节点都对其本地存储的数据进行索引(使用 LocalPartitioner).通过手动索 ..
发布时间:2021-12-31 18:13:03 其他开发

在同一台机器上运行多个 cassandra 节点(一个集群)?

如何从我的 Ubuntu 运行 3 个 cassandra 节点(实际上是一个集群)?我不想创建 3 个 VMWare/VirtualBox 实例,而是将每个 cassandra 节点配置为侦听不同的端口.安装一个 cassandra 可以吗? 我想到的一个解决方案是安装 3 个本地 cassandra 并独立配置每个 cassandra.yaml,但实际上我更愿意通过我安装的 cassan ..
发布时间:2021-12-31 18:12:55 其他开发