dfs - IT屋-程序员软件开发技术分享社区

Hadoop文件拆分:CompositeInputFormat:内部联接

我正在使用CompositeInputFormat向Hadoop作业提供输入. 生成的分割数是作为CompositeInputFormat输入(用于加入)的文件总数. 这项工作完全忽略了块大小和最大拆分大小(从CompositeInputFormat获取输入时).这会导致Map Tasks长时间运行，并且由于输入文件大于块大小而使系统运行缓慢. 有人知道可以通过哪种方法来管理Co ..

发布时间：2020-05-05 15:42:56 hadoop split mapreduce dfs 其他开发

如何使用spark和elasticsearch-hadoop从不同的ElasticSearch集群读写数据？

我很高兴使用spark和elasticsearch （带有elasticsearch-hadoop驱动程序）与几个巨大的集群。不时，我想拉出整个数据集群，处理每个文档，并把他们都进入了一个不同的Elasticsearch（ES）集群（是的，数据迁移也是如此）。目前，无法将ES数据从集群读取到RDD中，并且使用spark + elasticsearch-hadoop将RDD编写到另一 ..

发布时间：2018-06-06 11:10:56 elasticsearch apache-spark hdfs dfs elasticsearch-hadoop 其他开发

是否更改dfs.blocksizeaffect现有数据的值

我的Hadoop版本是2.5.2。我正在更改主节点上hdfs-site.xml文件中的dfs.blocksize。我有以下问题： $ b $ 1）这个改变会影响HDFS中的现有数据 2）我是否需要将这个改变传播给他所有的节点Hadoop集群或仅在NameNode上就足够了解决方案您应该对所有从站的hdfs-site.xml进行更改。 .. dfs.block大小应该在所有datan ..

发布时间：2018-05-31 20:28:40 hadoop hdfs dfs 分布式计算/Hadoop

hadoop / hdfs / name处于不一致的状态：存储目录（hadoop / hdfs / data /）不存在或不可访问

我已经尝试了关于此主题在stackoverflow上提供的所有不同解决方案，但没有帮助再次询问具体日志和详细信息任何帮助表示赞赏我的Hadoop集群中有一个主节点和5个从节点。 ubuntu用户和ubuntu组是〜/ Hadoop 文件夹的所有者〜/ hadoop / hdfs / data & 〜/ hadoop / hdfs / name 文件夹存在并且这两个文 ..

发布时间：2018-05-31 19:18:30 hadoop nodes dfs 分布式计算/Hadoop

无法使用本地hadoop与azure blob存储进行连接

尝试将本地hadoop 与 AZURE BLOB 存储连接时（例如，使用 blob存储作为HDFS ）with Hadoop Version - 2.7.1，它引发异常在这里，我通过设置属性 $ b成功地创建了本地集群 $ b fs.default.name wasb：//account@storage.blob.core.windows. ..

发布时间：2018-05-31 19:15:39 java azure hadoop hdfs dfs Java开发

获取以下错误“Datanode denied communication with namenode”同时配置hadoop 0.23.8

我试图在我的macbook上配置hadoop 0.23.8，并运行以下例外： org.apache .hadoop.hdfs.server.protocol.DisallowedDatanodeException：Datanode拒绝与namenode进行通信：192.168.1.13：50010 at org.apache.hadoop.hdfs.server.blockmanage ..

发布时间：2018-05-31 19:13:28 hadoop hdfs dfs 分布式计算/Hadoop

Hadoop java.io.IOException：Mkdirs无法创建/ some /路径

当我尝试运行我的Job时，出现以下异常：线程“main”中的异常java.io .IOException：Mkdirs无法在org.apache.hadoop.util.RunJar.ensureDirectory（RunJar.java:106）上创建/ some / path org.apache.hadoop.util.RunJar.main上的（RunJar.java:15 ..

发布时间：2018-05-31 18:24:01 hadoop ioexception dfs 分布式计算/Hadoop

c++ - 用pos作为DFS函数的参数是什么意思？

问题本人大一，写DFS相关题目时，读了很多别人的代码学习写法和思路，发现很多人DFS函数都是这样写的： void DFS(int pos){...} 我自己比较习惯这里是写depth，请问为什么很多人这里写pos？是什么意思呢？position吗？解决方案恩, 就是position ..

发布时间：2017-09-06 02:31:31 c++ 算法 dfs C/C++开发

C ++深度优先搜索（DFS）实现

我试图实现在Competitive Programming 1书中描述的以下DFS代码： #include using namespace std; #define MAX 10 #define DFS_BLACK 1 #define DFS_WHITE -1 typedef pair i ..

发布时间：2016-10-25 14:42:11 c++ vector graph dfs C/C++开发

我怎样才能得到DFS积极UNC路径编程

给定一个DFS路径我怎么会知道什么是活动路径它是目前这是编程。有关〔实施例我有2个服务器股份“\\\\ server1 \\ folder中\\”和“\\\\服务器2 \\文件夹\\”，它已DFS打开，以便它可以在“\\\\ DFS_Server \\文件夹\\”来访问，我怎么会知道什么是主动路径当前“\\\\ DFS_Server \\文件夹\\”是，无论是“\\\\ server1 \ ..

发布时间：2016-08-29 14:31:35 c# wmi dfs C#/.NET

将SCC格局变化，如果我们扭转图（使用Kosaraju的算法）？

假设我们有一个有向图，它不是一个完全图，并具有一个以上的SCC。我不知道的强连通分量的变化模式，如果我们调换图形和使用Kosaraju的算法？说“调换图”我的意思是翻盖边缘的方向。如果我们试图找到SCC的转/反转图形，而不是原来的，将在SCC我们发现是不同的？我想出了这个问题，因为我误解了SCC的算法和我转/反转图形运行它。我得到的是相同的SCC正确的答案/它运行Kosaraju的算法。 ..

发布时间：2015-11-30 22:28:08 algorithm directed-graph adjacency-list dfs adjacency-matrix C/C++

确定是否有图有不使用DFS周期

我来围绕这些问题在我的考试之一： Topologocial使用排序卡恩的算法要求图形为DAG（有向无环图）。我们怎样才能确定一个图中没有循环，而无需使用DFS / BFS第一？我想回答的时间太长了，我感到莫名其妙。任何人都可以指出我的算法判断出图没有周期的不使用DFS或者我应该去横冲直撞我的教练？解决方案如果且仅当，在期间卡恩的算法一些点无源选择（和剩余的图是仍然没有空的）， ..

发布时间：2015-11-30 22:02:33 algorithm graph cycle dfs C/C++

这过程中，我们可以使用迷宫探索BFS或DFS

我知道我们可以使用DFS的迷宫探索。但我认为，我们还可以使用BFS的迷宫探索。我有点困惑在这里，因为大部分我读过的书和文章都使用DFS这个问题。我认为这是在最佳案例 DFS的时间复杂度会比BFS更好。但一般和最坏案例的时间复杂度将是相同的两个BFS和放大器; DFS和这就是为什么我们preFER DFS在BFS。我说得对还是我有一些误解。解决方案我很惊讶，没有人提到迄今为止关于通过 ..

发布时间：2015-11-30 21:50:35 algorithm time-complexity maze dfs bfs C/C++

使用DFS没有递归拓扑排序

我知道做一个拓扑排序的常用方法是使用DFS递归。但是，使用你会怎么办呢堆栈＆LT; INT＆GT; 而不是递归？我需要得到逆转后的订单，但我有点卡住了：图为一个矢量＆lt;矢量＆lt; INT＆GT; ＆GT; 邻接表下面是我想使用的拓扑排序的DFS 布尔参观了[MAX] = {0}; 堆叠＆LT; INT＆GT; DFS，后序; 矢量＆lt; int的＆GT; newVec; 矢量＆l ..

发布时间：2015-11-30 20:50:37 c++ algorithm stack dfs topological-sort C/C++开发

有没有办法重新present静态数据在Haskell？或者有没有其他的优雅算法在Haskell DFS遍历？

我想用递归算法来构建DFS树。伪code因为这是： DFF（G）马克所有节点u，如未访问而有一个未访问过的节点u做 DFS（U） DFS（U）马克u，如参观在ü的邻居各V做如果v是没有标记 DFS（v）的虽然我可以很容易地通过构造某种数据结构UN /访问节点，赋予它们动态分配或某种声明，对哈斯克尔做到这一点在简单的方式势在 ..

发布时间：2015-11-30 20:43:37 algorithm haskell dfs C/C++

拓扑排序找到的路径的数目为t

我要开发一个O（| V | + | E |）算法相关的拓扑排序其中，在一个有向非循环图（DAG），确定的路径数从图中的每个顶点到吨（t是一节点与出度0）。我已经开发了DFS的修改如下： DFS（G，T）：每个顶点u∈V做颜色（U）=白色 paths_to_t（U）= 0 每个顶点u∈V做如果颜色（U）==白色则 ..

发布时间：2015-11-30 16:31:45 algorithm graph dfs topological-sort C/C++

算法的说明寻找铰接点或图形的分割点

我已经搜查了网，但没有找到DFS算法的任何解释查找图的所有关节顶点。即使是没有的wiki页面：（从读书的时候，我得从这里了解基本的事实。 PDF 有一个可变的了，在这实际上是在寻找回来的边缘，寻找最接近和至上节点对根的每个节点。加工边后，它会被发现。但我没有得到如何找到这个向下放大器;截至变量在每个节点中的DFS。这是什么变量做什么呢？请解释算法感谢解决方案查找吐字顶 ..

发布时间：2015-11-30 15:02:59 algorithm graph complexity-theory graph-algorithm dfs C/C++

如何实现深度优先搜索图与非递归aprroach

唉，我花了很多时间针对此问题。但是，我只能找到非递归的方法，树的解决方案：非递归的树递归的图，或递归方法>。和很多的教程（我没有在这里提供的链接）不提供方法为好。还是教程是完全不正确的。请帮我。更新：这真的很难形容：如果我有一个无向图： 1 / | \ 4 | 2 3 / 1-- 2-- ..

发布时间：2015-11-30 14:30:15 algorithm graph dfs non-recursive C/C++

dfs相关内容