dfs相关内容

Hadoop文件拆分:CompositeInputFormat:内部联接

我正在使用CompositeInputFormat向Hadoop作业提供输入. 生成的分割数是作为CompositeInputFormat输入(用于加入)的文件总数. 这项工作完全忽略了块大小和最大拆分大小(从CompositeInputFormat获取输入时).这会导致Map Tasks长时间运行,并且由于输入文件大于块大小而使系统运行缓慢. 有人知道可以通过哪种方法来管理Co ..
发布时间:2020-05-05 15:42:56 其他开发

如何使用spark和elasticsearch-hadoop从不同的ElasticSearch集群读写数据?

我很高兴使用spark和elasticsearch (带有elasticsearch-hadoop驱动程序)与几个巨大的集群。 不时,我想拉出整个数据集群,处理每个文档,并把他们都进入了一个不同的Elasticsearch(ES)集群(是的,数据迁移也是如此)。 目前,无法将ES数据从集群读取到RDD中,并且使用spark + elasticsearch-hadoop将RDD编写到另一 ..

是否更改dfs.blocksizeaffect现有数据的值

我的Hadoop版本是2.5.2。我正在更改主节点上hdfs-site.xml文件中的dfs.blocksize。我有以下问题: $ b $ 1)这个改变会影响HDFS中的现有数据 2)我是否需要将这个改变传播给他所有的节点Hadoop集群或仅在NameNode上就足够了 解决方案 您应该对所有从站的hdfs-site.xml进行更改。 .. dfs.block大小应该在所有datan ..
发布时间:2018-05-31 20:28:40 分布式计算/Hadoop

hadoop / hdfs / name处于不一致的状态:存储目录(hadoop / hdfs / data /)不存在或不可访问

我已经尝试了关于此主题在stackoverflow上提供的所有不同解决方案,但没有帮助 再次询问具体日志和详细信息 任何帮助表示赞赏 我的Hadoop集群中有一个主节点和5个从节点。 ubuntu用户和ubuntu组是〜/ Hadoop 文件夹的所有者 〜/ hadoop / hdfs / data & 〜/ hadoop / hdfs / name 文件夹存在 并且这两个文 ..
发布时间:2018-05-31 19:18:30 分布式计算/Hadoop

c++ - 用pos作为DFS函数的参数是什么意思?

问 题 本人大一,写DFS相关题目时,读了很多别人的代码学习写法和思路,发现很多人DFS函数都是这样写的: void DFS(int pos){...} 我自己比较习惯这里是写depth,请问为什么很多人这里写pos?是什么意思呢?position吗? 解决方案 恩, 就是position ..
发布时间:2017-09-06 02:31:31 C/C++开发

我怎样才能得到DFS积极UNC路径编程

给定一个DFS路径我怎么会知道什么是活动路径它是目前 这是编程。 有关〔实施例我有2个服务器股份“\\\\ server1 \\ folder中\\”和“\\\\服务器2 \\文件夹\\”,它已DFS打开,以便它可以在“\\\\ DFS_Server \\文件夹\\”来访问,我怎么会知道什么是主动路径当前“\\\\ DFS_Server \\文件夹\\”是,无论是“\\\\ server1 \ ..
发布时间:2016-08-29 14:31:35 C#/.NET

将SCC格局变化,如果我们扭转图(使用Kosaraju的算法)?

假设我们有一个有向图,它不是一个完全图,并具有一个以上的SCC。 我不知道的强连通分量的变化模式,如果我们调换图形和使用Kosaraju的算法? 说“调换图”我的意思是翻盖边缘的方向。 如果我们试图找到SCC的转/反转图形,而不是原来的,将在SCC我们发现是不同的? 我想出了这个问题,因为我误解了SCC的算法和我转/反转图形运行它。我得到的是相同的SCC正确的答案/它运行Kosaraju的算法。 ..
发布时间:2015-11-30 22:28:08 C/C++

确定是否有图有不使用DFS周期

我来围绕这些问题在我的考试之一: Topologocial使用排序卡恩的 算法 要求图形为DAG(有向无环图)。我们怎样才能 确定一个图中没有循环,而无需使用DFS / BFS第一? 我想回答的时间太长了,我感到莫名其妙。任何人都可以指出我的算法判断出图没有周期的不使用DFS或者我应该去横冲直撞我的教练? 解决方案 如果且仅当,在期间卡恩的算法一些点无源选择(和剩余的图是仍然没有空的), ..
发布时间:2015-11-30 22:02:33 C/C++

这过程中,我们可以使用迷宫探索BFS或DFS

我知道我们可以使用DFS的迷宫探索。但我认为,我们还可以使用BFS的迷宫探索。我有点困惑在这里,因为大部分我读过的书和文章都使用DFS这个问题。 我认为这是在最佳案例 DFS的时间复杂度会比BFS更好。但一般和最坏 案例的时间复杂度将是相同的两个BFS和放大器; DFS和这就是为什么我们preFER DFS在BFS。 我说得对还是我有一些误解。 解决方案 我很惊讶,没有人提到迄今为止关于通过 ..
发布时间:2015-11-30 21:50:35 C/C++

使用DFS没有递归拓扑排序

我知道做一个拓扑排序的常用方法是使用DFS递归。但是,使用你会怎么办呢堆栈< INT> 而不是递归?我需要得到逆转后的订单,但我有点卡住了: 图为一个矢量<矢量< INT> > 邻接表 下面是我想使用的拓扑排序的DFS 布尔参观了[MAX] = {0}; 堆叠< INT> DFS,后序; 矢量< int的> newVec; 矢量&l ..
发布时间:2015-11-30 20:50:37 C/C++开发

有没有办法重新present静态数据在Haskell?或者有没有其他的优雅算法在Haskell DFS遍历?

我想用递归算法来构建DFS树。 伪code因为这是: DFF(G) 马克所有节点u,如未访问 而有一个未访问过的节点u做 DFS(U) DFS(U) 马克u,如参观 在ü的邻居各V做 如果v是没有标记 DFS(v)的 虽然我可以很容易地通过构造某种数据结构UN /访问节点,赋予它们动态分配或某种声明,对哈斯克尔做到这一点在简单的方式势在 ..
发布时间:2015-11-30 20:43:37 C/C++

拓扑排序找到的路径的数目为t

我要开发一个O(| V | + | E |)算法相关的拓扑排序其中,在一个有向非循环图(DAG),确定的路径数从图中的每个顶点到吨(t是一节点与出度0)。我已经开发了DFS的修改如下: DFS(G,T): 每个顶点u∈V做 颜色(U)=白色 paths_to_t(U)= 0 每个顶点u∈V做 如果颜色(U)==白色则 ..
发布时间:2015-11-30 16:31:45 C/C++

算法的说明寻找铰接点或图形的分割点

我已经搜查了网,但没有找到DFS算法的任何解释查找图的所有关节顶点。即使是没有的wiki页面:( 从读书的时候,我得从这里了解基本的事实。 PDF 有一个可变的了,在这实际上是在寻找回来的边缘,寻找最接近和至上节点对根的每个节点。加工边后,它会被发现。 但 我没有得到如何找到这个向下放大器;截至变量在每个节点中的DFS。这是什么变量做什么呢? 请解释算法 感谢 解决方案 查找吐字顶 ..
发布时间:2015-11-30 15:02:59 C/C++

如何实现深度优先搜索图与非递归aprroach

唉,我花了很多时间针对此问题。但是,我只能找到非递归的方法,树的解决方案:非递归的树递归的图,或递归方法>。 和很多的教程(我没有在这里提供的链接)不提供方法为好。还是教程是完全不正确的。请帮我。 更新: 这真的很难形容: 如果我有一个无向图: 1 / | \ 4 | 2 3 / 1-- 2-- ..
发布时间:2015-11-30 14:30:15 C/C++