cassandra相关内容
我试图做一个简单的code其中我创建模式,插入一些表,然后拉一些信息,并打印出来。不过,我得到一个错误。我使用的是Datastax卡桑德拉火花接口。我一直在使用这两个例子来帮助我试图做到这一点: https://gist.github.com/jacek-lewandowski/278bfc936ca990bee35a
..
我有一个表模式作为 APPNAME文字, randomnum INT, addedtime时间戳 shortuuid文字, ASSETNAME文字, 名优产品文字,PRIMARY KEY((应用程序名称,randomnum),addedtime,shortuuid) addedtime是聚集键 现在,当我使用聚类关键addedtime下推过滤器,我没有看到它得到应用 VAL RDD =
..
我想查询从卡桑德拉根据我在RDD值的一些数据。我的做法是这样的: VAL用户id = sc.textFile(“/ tmp目录/ user_ids”)keyBy。(E => E) VAL T = sc.cassandraTable(“密钥空间”,“用户”)。选择(“用户id”,“USER_NAME”) VAL用户名= {userIds.flatMap =用户id> t.wher
..
我有越来越星火卡桑德拉连接器在Scala中工作的问题。 我使用这些版本: 斯卡拉2.10.4 火花核心1.0.2 卡桑德拉 - 节俭2.1.0(我装Cassandra是V2.1.0) 卡桑德拉 - clientutil 2.1.0 卡桑德拉驱动核心2.0.4(推荐用于连接器?) 火花卡桑德拉连接器1.0.0 我可以连接和交谈卡桑德拉(W / O火花),我可以跟星火(W /
..
假设我们有一个RF = N和含有宽行表的卡桑德拉集群。 我们的表可以有一个索引是这样的: PK / CK1 / CK2 / .... 如果我们创建从表中的行的RDD如下: VAL wide_row = sc.cassandraTable(KS,表)。选择(“C1”,“C2”)。其中(“PK =?”,PK) 我注意到一个星火节点有数据的100%,其他没有。我想这是因为火花卡桑德拉连接器没
..
照片下面塞纳里奥:火花的应用程序(Java实现)使用卡桑德拉数据库加载,转换为RDD和处理数据。还应用程序被蒸从其也由定制接收器处理的数据库中的新的数据。流传输过程的输出被存储在数据库中。实现从与数据库集成使用Spring数据卡珊德拉。 CassandraConfig: @Configuration @ComponentScan(basePackages = {“org.foo”}) @Pr
..
我想我还没有完全理解星火如何工作的。 下面是我的设置: 我运行在单机模式下的星火集群。我使用的是4机这样的:一个是法师,另外三个是工人。 我写了从卡桑德拉集群中读取数据的应用程序(请参阅https://github.com/journeymonitor/analyze/blob/master/spark/src/main/scala/SparkApp.scala#L118). 三节点卡
..
我有4个节点的集群:3星火节点和1 Solr的节点。我的CPU是8个核心,我的内存是32 GB,磁盘空间是SSD。我用卡桑德拉作为我的数据库。我的数据量为22GB 6小时后,我现在有大约3,4百万行,应在5分钟读取。 但已经不能完成这段时间的任务。我的未来计划是在5分钟阅读 100万行。我不知道我可以增加或做的更好,以实现这一结果,现在,以及实现我未来的目标。是,甚至有可能还是会更好地使用火花的
..
我想明白当行(列)插入一个定制列表样式表究竟是什么内部发生在存储引擎的水平。 CREATE TABLE LOG_DATE( 用户ID BIGINT, 时间timeuuid, 类文字, 子类的文字, itemid的文字, 诠释计数, 价格INT, PRIMARY KEY((用户ID),时间) - #1 PRIMARY KEY((用户ID),时间,类别,子类别,
..
我想通过在一个巨大的C *表中的一小部分过滤: VAL snapshotsFiltered = sc.parallelize(STARTDATE至结束日期).MAP(TableKey(_))。joinWithCassandraTable(“监听器”,“snapshots_tspark”) 的println(“完成加入”) // ******* //只得到快照和创建RD
..
我试图得到一些卡桑德拉/ SPARK数据的最小,最大意思,但我需要用JAVA做。 进口org.apache.spark.sql.DataFrame; 引入静态org.apache.spark.sql.functions *。数据帧DF = sqlContext.read() .format(“org.apache.spark.sql.cassandra”) 。选项
..
我使用的是这里的教程在这个Github上使用Java Maven项目上运行卡桑德拉火花:的 https://github.com/datastax/spark-cassandra-connector 。 我已经想通了如何使用直接CQL语句,因为我有previously问了一个关于此问题:
..
我用的是星火卡桑德拉连接器。 它需要5-6分钟,取卡珊德拉从表中的数据。在星火我已经看到了很多日志任务和执行人。其原因可能是火花分割过程中的许多任务! 下面是我的code例如: 公共静态无效的主要(字串[] args){ SparkConf的conf =新SparkConf(真).setMaster(“本地[4]”) .setAppName(“APP_NAME”
..
我试图使用星火卡桑德拉连接器在星火1.1.0 。 我已经成功地构建从GitHub上的主分支jar文件,并已经得到了包括演示工作。然而,当我尝试将jar文件加载到火花壳我无法导入任何从 com.datastax.spark类的.connector 包。 我已经使用尝试 - 罐子在火花shell选项和添加具有jar文件的目录Java的CLASSPATH。没有这些选项的作用。事实上,当我使用 - 罐
..
当我使用命令斌/ Cassandra的安装在Git中的bash它显示这个错误: $错误:无法找到或加载主类org.apache.cassandra.service.CassandraDaemon 它完成的“CMD”,但是当我使用斌/ cqlsh 我得到这个错误:连接错误:('无法连接到任何服务器“, {“127.0.0.1”:错误(10061,“试图连接到[(”127.0.0.1“,904
..
我需要从与出区分大小写卡桑德拉获取数据。请帮我。 解决方案 有在卡桑德拉不区分大小写的概念。所有的数据都存储为字节[] ,所以它甚至不是一个字符串。 您可以创建一个自定义比较器(看到API ),其将字节[] 为String而忽略如此。 另一件事要做的仅仅是获取数据并将其转换在客户端上。 其实,你的问题是什么是你的目标还不是很清楚,所以我不能透露更多的细节。 更新:运行,从数据库获取
..
我试图安装卡桑德拉datastax PHP驱动程序,当我运行以下命令: PECL安装分机/ package.xml中 检查出来的Git后,我得到以下信息:配置:错误:无法加载libcassandra错误:`的/ tmp /梨/温度/卡桑德拉/配置'失败 任何人都可以点我在正确的方向,才能成功安装此驱动程序吗? 卡桑德拉我使用的版本是2.1.8,所以也许司机尚未更新连接到卡桑德拉的最新
..
我打算用的NoSQL项目开始用于数据存储。我试图找到在谷歌约卡桑德拉的信息,但我发现很基本的信息。 任何人都知道在哪里可以找到卡桑德拉知识的良好来源(刨的数据结构,数据(也许从MySQL迁移工作吗?)等等)? 解决方案 DataStax具有COM prehensive卡桑德拉文档 HTTP ://www.datastax.com/docs/1.0/index “卡桑德拉高性能菜谱”是一
..
我有远程Ubuntu服务器上安装的Apache Cassandra的。如何允许一个Apache Cassandra的数据库远程访问?而如何进行连接? 解决方案 要卡桑德拉远程访问是经由其节俭端口(尽管注意到JMX的端口可以被用于执行一些有限的操作)。 节俭端口在 cassandra.yaml 的 rpc_port 参数,定义默认为9160.您卡桑德拉节点应绑定到服务器的网卡的IP地址 - 它
..
LIKE条件允许我们在SQL语句的where子句中使用通配符。这使我们能够执行模式匹配。 LIKE条件可以在任何有效的SQL语句中使用 - 选择,插入,更新或删除。像这样 SELECT * FROM用户 其中用户名,如“巴布%'; 喜欢同样的上述操作有任何疑问都可以在卡桑德拉CLI。 解决方案 答案很简单:不存在等价的 LIKE
..