cassandra 第107页 - IT屋-程序员软件开发技术分享社区

通过Spark在一个Java Maven项目在卡桑德拉数据查询

我试图做一个简单的code其中我创建模式，插入一些表，然后拉一些信息，并打印出来。不过，我得到一个错误。我使用的是Datastax卡桑德拉火花接口。我一直在使用这两个例子来帮助我试图做到这一点： https://gist.github.com/jacek-lewandowski/278bfc936ca990bee35a ..

发布时间：2016-05-22 15:45:52 java maven cassandra apache-spark connector Java开发

SparkSQL下推过滤的星火卡桑德拉连接器不工作

我有一个表模式作为 APPNAME文字， randomnum INT， addedtime时间戳 shortuuid文字， ASSETNAME文字，名优产品文字，PRIMARY KEY（（应用程序名称，randomnum），addedtime，shortuuid） addedtime是聚集键现在，当我使用聚类关键addedtime下推过滤器，我没有看到它得到应用 VAL RDD = ..

发布时间：2016-05-22 15:43:51 apache-spark cassandra 其他开发

通过RDD值从卡桑德拉表滤波器

我想查询从卡桑德拉根据我在RDD值的一些数据。我的做法是这样的： VAL用户id = sc.textFile（“/ tmp目录/ user_ids”）keyBy。（E =＆GT; E） VAL T = sc.cassandraTable（“密钥空间”，“用户”）。选择（“用户id”，“USER_NAME”） VAL用户名= {userIds.flatMap =用户id＆GT; t.wher ..

发布时间：2016-05-22 15:43:24 scala cassandra apache-spark rdd 其他开发

为什么星火卡桑德拉连接失败，NoHostAvailableException？

我有越来越星火卡桑德拉连接器在Scala中工作的问题。我使用这些版本：斯卡拉2.10.4 火花核心1.0.2 卡桑德拉 - 节俭2.1.0（我装Cassandra是V2.1.0）卡桑德拉 - clientutil 2.1.0 卡桑德拉驱动核心2.0.4（推荐用于连接器？）火花卡桑德拉连接器1.0.0 我可以连接和交谈卡桑德拉（W / O火花），我可以跟星火（W / ..

发布时间：2016-05-22 15:38:24 scala cassandra apache-spark 其他开发

分布在宽行装载到星火从卡桑德拉

假设我们有一个RF = N和含有宽行表的卡桑德拉集群。我们的表可以有一个索引是这样的： PK / CK1 / CK2 / .... 如果我们创建从表中的行的RDD如下： VAL wide_row = sc.cassandraTable（KS，表）。选择（“C1”，“C2”）。其中（“PK =？”，PK）我注意到一个星火节点有数据的100％，其他没有。我想这是因为火花卡桑德拉连接器没 ..

发布时间：2016-05-22 15:37:14 scala cassandra apache-spark 其他开发

照片下面塞纳里奥：火花的应用程序（Java实现）使用卡桑德拉数据库加载，转换为RDD和处理数据。还应用程序被蒸从其也由定制接收器处理的数据库中的新的数据。流传输过程的输出被存储在数据库中。实现从与数据库集成使用Spring数据卡珊德拉。 CassandraConfig： @Configuration @ComponentScan（basePackages = {“org.foo”}） @Pr ..

发布时间：2016-05-22 15:29:16 java cassandra apache-spark spring-data-cassandra Java开发

阿帕奇星火：驱动程序（而不只是执行人）试图连接到卡桑德拉

我想我还没有完全理解星火如何工作的。下面是我的设置：我运行在单机模式下的星火集群。我使用的是4机这样的：一个是法师，另外三个是工人。我写了从卡桑德拉集群中读取数据的应用程序（请参阅https://github.com/journeymonitor/analyze/blob/master/spark/src/main/scala/SparkApp.scala#L118). 三节点卡 ..

发布时间：2016-05-22 15:23:13 scala apache-spark cassandra 其他开发

为什么我的星火流的应用程序这么慢？

我有4个节点的集群：3星火节点和1 Solr的节点。我的CPU是8个核心，我的内存是32 GB，磁盘空间是SSD。我用卡桑德拉作为我的数据库。我的数据量为22GB 6小时后，我现在有大约3,4百万行，应在5分钟读取。但已经不能完成这段时间的任务。我的未来计划是在5分钟阅读 100万行。我不知道我可以增加或做的更好，以实现这一结果，现在，以及实现我未来的目标。是，甚至有可能还是会更好地使用火花的 ..

发布时间：2016-05-22 15:22:48 apache-spark cassandra pyspark spark-streaming datastax-enterprise 其他开发

卡桑德拉内部存储

我想明白当行（列）插入一个定制列表样式表究竟是什么内部发生在存储引擎的水平。 CREATE TABLE LOG_DATE（用户ID BIGINT，时间timeuuid，类文字，子类的文字， itemid的文字，诠释计数，价格INT， PRIMARY KEY（（用户ID），时间） - ＃1 PRIMARY KEY（（用户ID），时间，类别，子类别， ..

发布时间：2016-05-22 15:22:30 cassandra apache-spark time-series cql 其他开发

星火JoinWithCassandraTable上的滞时间戳分区键

我想通过在一个巨大的C *表中的一小部分过滤： VAL snapshotsFiltered = sc.parallelize（STARTDATE至结束日期）.MAP（TableKey（_））。joinWithCassandraTable（“监听器”，“snapshots_tspark”）的println（“完成加入”） // ******* //只得到快照和创建RD ..

发布时间：2016-05-22 15:22:17 mysql scala cassandra apache-spark datastax-enterprise 数据库

如何计算汇总统计上卡桑德拉表星火数据帧？

我试图得到一些卡桑德拉/ SPARK数据的最小，最大意思，但我需要用JAVA做。进口org.apache.spark.sql.DataFrame; 引入静态org.apache.spark.sql.functions *。数据帧DF = sqlContext.read（） .format（“org.apache.spark.sql.cassandra”）。选项 ..

发布时间：2016-05-22 15:19:05 java scala apache-spark cassandra statistics Java开发

星火Datastax的Java API Select语句

我使用的是这里的教程在这个Github上使用Java Maven项目上运行卡桑德拉火花：的 https://github.com/datastax/spark-cassandra-connector 。我已经想通了如何使用直接CQL语句，因为我有previously问了一个关于此问题： ..

发布时间：2016-05-22 15:18:40 java cassandra apache-spark connector datastax Java开发

阿帕奇星火服用5至6分钟，从卡桑德拉的陀飞轮1排简易计数

我用的是星火卡桑德拉连接器。它需要5-6分钟，取卡珊德拉从表中的数据。在星火我已经看到了很多日志任务和执行人。其原因可能是火花分割过程中的许多任务！下面是我的code例如：公共静态无效的主要（字串[] args）{ SparkConf的conf =新SparkConf（真）.setMaster（“本地[4]”） .setAppName（“APP_NAME” ..

发布时间：2016-05-22 15:17:29 java cassandra apache-spark spark-cassandra-connector Java开发

如何加载星火卡桑德拉连接器的外壳？

我试图使用星火卡桑德拉连接器在星火1.1.0 。我已经成功地构建从GitHub上的主分支jar文件，并已经得到了包括演示工作。然而，当我尝试将jar文件加载到火花壳我无法导入任何从 com.datastax.spark类的.connector 包。我已经使用尝试 - 罐子在火花shell选项和添加具有jar文件的目录Java的CLASSPATH。没有这些选项的作用。事实上，当我使用 - 罐 ..

发布时间：2016-05-22 15:16:01 cassandra apache-spark datastax-enterprise 其他开发

如何修复错误的安装和连接共赢阿帕奇卡桑德拉？

当我使用命令斌/ Cassandra的安装在Git中的bash它显示这个错误： $错误：无法找到或加载主类org.apache.cassandra.service.CassandraDaemon 它完成的“CMD”，但是当我使用斌/ cqlsh 我得到这个错误：连接错误：（'无法连接到任何服务器“， {“127.0.0.1”：错误（10061，“试图连接到[（”127.0.0.1“，904 ..

发布时间：2016-05-21 14:39:48 git bash apache cassandra nosql 服务器开发

如何读取出区分大小写卡桑德拉数据

我需要从与出区分大小写卡桑德拉获取数据。请帮我。解决方案有在卡桑德拉不区分大小写的概念。所有的数据都存储为字节[] ，所以它甚至不是一个字符串。您可以创建一个自定义比较器（看到API ），其将字节[] 为String而忽略如此。另一件事要做的仅仅是获取数据并将其转换在客户端上。其实，你的问题是什么是你的目标还不是很清楚，所以我不能透露更多的细节。更新：运行，从数据库获取 ..

发布时间：2016-05-21 14:34:13 apache cassandra 服务器开发

在Ubuntu上安装PHP datastax驱动程序

我试图安装卡桑德拉datastax PHP驱动程序，当我运行以下命令： PECL安装分机/ package.xml中检查出来的Git后，我得到以下信息：配置：错误：无法加载libcassandra错误：`的/ tmp /梨/温度/卡桑德拉/配置'失败任何人都可以点我在正确的方向，才能成功安装此驱动程序吗？卡桑德拉我使用的版本是2.1.8，所以也许司机尚未更新连接到卡桑德拉的最新 ..

发布时间：2016-05-20 00:46:41 php apache cassandra datastax datastax-php-driver PHP

知识来源为Apache卡桑德拉

我打算用的NoSQL项目开始用于数据存储。我试图找到在谷歌约卡桑德拉的信息，但我发现很基本的信息。任何人都知道在哪里可以找到卡桑德拉知识的良好来源（刨的数据结构，数据（也许从MySQL迁移工作吗？）等等）？解决方案 DataStax具有COM prehensive卡桑德拉文档 HTTP ：//www.datastax.com/docs/1.0/index “卡桑德拉高性能菜谱”是一 ..

发布时间：2016-05-20 00:30:00 apache nosql cassandra 服务器开发

Apache的卡桑德拉远程访问

我有远程Ubuntu服务器上安装的Apache Cassandra的。如何允许一个Apache Cassandra的数据库远程访问？而如何进行连接？解决方案要卡桑德拉远程访问是经由其节俭端口（尽管注意到JMX的端口可以被用于执行一些有限的操作）。节俭端口在 cassandra.yaml 的 rpc_port 参数，定义默认为9160.您卡桑德拉节点应绑定到服务器的网卡的IP地址 - 它 ..

发布时间：2016-05-19 23:40:50 apache cassandra remote-access 服务器开发

是否有任何卡桑德拉查询作为同SQL：LIKE条件？

LIKE条件允许我们在SQL语句的where子句中使用通配符。这使我们能够执行模式匹配。 LIKE条件可以在任何有效的SQL语句中使用 - 选择，插入，更新或删除。像这样 SELECT * FROM用户其中用户名，如“巴布％'; 喜欢同样的上述操作有任何疑问都可以在卡桑德拉CLI。解决方案答案很简单：不存在等价的 LIKE ..

发布时间：2016-05-19 23:17:40 sql apache cassandra pycassa 服务器开发

cassandra相关内容