cassandra相关内容
我正在尝试改造一个 SQL 数据库 Cassandra,以便我可以找到与 SQL 查询等效的 Cassandra.我使用 CQL 3 和 Cassandra v1.2.我在 cassandra 中对 db 设计进行了建模,使其支持 order by 子句和非规范化表以支持连接操作.但是,当涉及到 DISTINCT、SUM() 和 GROUPBY 等价物时,我感到很困惑 SELECT a1,MAX
..
有一个大数据库,有 1,000,000,000 行,称为线程(这些线程确实存在,我并不是因为我喜欢它而使事情变得更难).Threads 里面只有一些东西,让事情变得更快:(int id, string hash, int replycount, int dateline (timestamp), int forumid, string title) 查询: select * from
..
我对 Cassandra 还很陌生,我只是通过 Datastax 课程学习的,但是我在此处或 Internet 上找不到有关存储桶的足够信息,并且在我的应用程序中,我需要使用存储桶来拆分我的数据. 我有一些可以测量的工具,很多,并且每天分割测量(时间戳作为分区键)可能有点冒险,因为我们很容易达到一个分区的 100MB 的限制.每个度量都涉及一个用 ID 标识的特定对象.所以想用桶,但是不知道
..
我正试图弄清楚这些新奇的数据存储,如 bigtable、hbase 和 cassandra 到底是什么. 我处理大量股票市场数据、数十亿行价格/报价数据,这些数据每天可以加起来高达 100 GB(尽管这些文本文件通常会压缩至少一个数量级).这些数据基本上是一些数字、两三个短字符串和一个时间戳(通常是毫秒级).如果我必须为每一行选择一个唯一标识符,我将不得不选择整行(因为交换可能会在同一毫秒内
..
我试图了解当在 CQL 样式表中插入行(列)时,存储引擎级别内部究竟发生了什么. 创建表 log_date (用户名 bigint,时间timeuuid,类别文字,子类别文本,itemid 文本,计数整数,价格整数,主键((用户 ID),时间) - #1PRIMARY KEY ((userid), time, category, subcategory, itemid, count, price
..
我是 Cassandra 的新手,我听说 Cassandra 鼓励数据的非规范化和重复.这让我有点困惑.让我们想象以下场景: 我有一个包含四个表的键空间:A、B、C 和 D. 创建表 A (表 ID 整数,列 1 整数,column2 varchar,第 3 列 varchar,第 4 列 varchar,第 5 列 varchar,主键(column1,tableID)); 让我们假设
..
我有一个旧的 Cassandra 集群需要恢复使用.我想清除所有用户和系统数据、所有存储的令牌、所有内容,然后从头开始 - 有推荐的方法吗? 解决方案 这是我用于 Apache Cassandra 的过程: 首先在所有节点上停止 Cassandra,然后在每个节点上: rm -r rm -r rm
..
我目前正在 cassandra 中使用和研究数据建模实践.到目前为止,我知道您需要基于执行的查询进行数据建模.然而,多个 select 要求使得数据建模更难或不可能在 1 个表上处理.所以,当你不能在1张表上处理这些需求时,你需要插入2-3张表.换句话说,您需要对 1 个操作进行多次插入. 目前,我正在处理活动结构的数据模型.我在 cassandra 上有一个带有以下 cql 的竞选表;
..
我正在尝试 cassandra 节点驱动程序并在插入记录时遇到问题,看起来 cassandra 驱动程序无法插入浮点值. 问题:在db中传递int值插入时,api报错如下:调试:hapi、内部、实现、错误ResponseError: 预期的 4 或 0 字节 int (8)在 FrameReader.readError (/home/gaurav/Gaurav-Drive/code/nodejs
..
我了解了 Cassandra 2 的轻量级事务.在 QUORUM 中,这种写入的一致性级别总是吗?这是否意味着即使我有一个包含 100 个节点的多数据中心设置,也会涉及整个集群的仲裁(所有数据中心的大部分行副本)?这不会真的很慢并且不会影响可用性吗? 我们可以做 LOCAL_QUORUM 或 EACH_QUORUM 一致性吗?如果跨多个数据中心复制的数据的写入者始终仅来自特定数据中心,则这将
..
我打算将数据插入到具有复合键的 CF 中. CREATE TABLE event_attend (event_id 整数,event_type varchar,event_user_id int,PRIMARY KEY (event_id, event_type) #复合键...); 但是我无法使用 cql 从 python 向这个 CF 插入数据.(http://code.google.co
..
这是我正在创建的表格,该表格包含有关上次参加 Mundial 杯的球员的信息. 创建表玩家(组文本、装备文本、数字整数、位置文本、名称文本、日整数,月整数,年整数,俱乐部文本,联赛文本,队长文本,PRIMARY 键(名称、日、月、年)); 进行以下查询时: 从担任选拔队队长的最年长球员那里获得 5 个名字 这是我的查询: SELECT name FROM player WHERE
..
我需要通过 CQL 脚本将新列插入到现有列族中. 我想做类似的事情: alter COLUMNFAMILY rules ADD rule_template text IF NOT EXISTS; 我怎样才能完全在 CQL 脚本中实现这一点? 解决方案 没有用于更改列族(表)的可选“如果不存在".作为一种解决方法,您可以只执行 alter 命令并忽略该列已存在的错误.除了错误消息外
..
我有一个用 netbeans 编写的程序.该程序从 cassandra 读取了大约 1,000,000 条数据,处理它们并再次将结果写入 cassandra.我的程序运行了大约 9 个小时,但突然因以下错误而终止: java 结果:137 我听说这些错误意味着 (128 + signalnember).在我的情况下,signalnember = 9 即 KILLSIGNAL.有没有人知道我怎样
..
是否有一种简单的方法可以使用 CQL(或 API,使用 com.datastax.driver)检查 Cassandra 中是否定义了表(列族)? 现在我倾向于执行 SELECT 1 FROM table 并检查异常,但也许有更好的方法? 解决方案 从 1.1 开始,您应该能够查询 system 键空间、schema_columnfamilies 列族.如果您知道要检查哪个键空间,则
..
我目前正在试用 Cassandra. 在客户端(使用 Hector),我查找如下几个键: ColumnFamilyResultresult = template.queryColumns(Arrays.asList("key1","key2","key3")); 大部分时间它似乎都有效.但有时我会在客户端上遇到超时异常: 引起:me.prettyprint.hector.api.exc
..
我需要在我的 Cassandra 集群上执行 MapReduce,包括数据局部性,即.每个作业只查询属于作业运行所在的本地卡桑德拉节点的行. 存在有关如何在较旧的 Cassandra 版本 (0.7) 上为 MR 设置 Hadoop 的教程.我在当前版本中找不到这样的. 自 0.7 以来在这方面发生了哪些变化? 最小设置(Hadoop+HDFS+...)需要哪些软件模块?
..
当我读到这两个时,我认为他们都在解释相同的方法,我用谷歌搜索但什么也没找到.执行上有区别吗?Cassandra自己做二级索引,倒排索引要自己实现? 顺便说一下,哪个搜索速度更快? 解决方案 主要区别在于 Cassandra 中的二级索引的分布方式与手动倒排索引的分布方式不同.使用内置的二级索引,每个节点都对其本地存储的数据进行索引(使用 LocalPartitioner).通过手动索
..
如何从我的 Ubuntu 运行 3 个 cassandra 节点(实际上是一个集群)?我不想创建 3 个 VMWare/VirtualBox 实例,而是将每个 cassandra 节点配置为侦听不同的端口.安装一个 cassandra 可以吗? 我想到的一个解决方案是安装 3 个本地 cassandra 并独立配置每个 cassandra.yaml,但实际上我更愿意通过我安装的 cassan
..
我是 Cassandra 的新手.我在 CQL IN 查询 中遇到问题,如果表具有 SET 类型列,则它可以工作. 创建表测试(test_date bigint,test_id bigint,标题文字,PRIMARY KEY(test_date,test_id));select * from test where test_date = 2022015 and test_id IN (1,2);
..