pentaho-spoon相关内容

使用 Pentaho 从远程 SFTP 删除超过 7 天的文件

我使用的是 Pentado 数据集成 8.2.我对 Pentaho 的经验很少. 我需要使用 Pentaho 创建一个作业,从远程 SFTP 中删除超过 7 天的文件. 我进行了搜索,但找不到远程 SFTP 的解决方案. 谢谢. 解决方案 您可以使用 Run ssh 组件连接到您的主目录.在 commands 选项卡下的 settings 选项卡中,运行以下命令. fi ..
发布时间:2021-07-23 19:53:09 其他开发

使用正则表达式将字符串分成多列

我是正则表达式的新手,我想使用正则表达式将给定字符串分成 6 个部分.我正在使用 Pentaho 数据集成工具(ETL 工具) 给定字符串: 1x 3.5 mL SST.1x 4.0 mL 灰盖冷冻管. 注意:有更多相同格式的字符串 我希望输出为: 提前致谢!! 解决方案 您提供的 single 字符串数据看起来应该与正则表达式模式匹配: (\d*)x\s(\d* ..

Pentaho 使用附件生成报告和安排邮件作业

我是 Pentaho 的新手.任何人都可以指导我如何使用 PDI 以 PDF 文件格式创建报告并通过邮件作为附件发送.任何教程或演示都会有所帮助 解决方案 Pentaho 数据集成为此提供了一个非常简单的实用程序. 在 PDI 中执行您的报告并使用电子邮件步骤发送报告. ..

pentaho 勺子/PDI:如何创建具有当前日期的文件夹?

正如标题所说,我想知道如何创建一个具有当前日期(dd/mm/yyyy)(在工作中)的文件夹.我看过两个答案,但它们看起来很长,例如这个:pentaho 用 MM-YYYY 创建存档文件夹 有人有想法吗?谢谢:) 解决方案 那个答案也是从 2014 年开始的,更好和更新的 PDI 版本已经出来,这个答案使任务过于复杂. 虽然您确实需要在 KTR 中创建文件夹名称,但您只需使用“创 ..
发布时间:2021-06-15 18:51:13 其他开发

Pentaho 将变量从修改后的 java 脚本值传递到表输入

我需要从修改后的java脚本值中传递变量并将其传递给表输入查询 这是我的 如果我点击预览输出 initator_reference ||'' |1 ||空|2 ||空|3 ||空|4 ||空| 它不应该为空,而是第三个字段上的“测试"字符串不要问我为什么把那个变量放在选择中,它只是为了在我把它放在“where condition=variable"之前进行测试 解决方案 表 ..
发布时间:2021-06-15 18:51:10 其他开发

合并行(差异)是逐行比较,而不是将一行与其他表的整行进行比较

我正在使用合并行(差异)比较两张工作表. 第一个 Excel 表: 第二张 Excel 表格: 和我的 pentaho 交易: 在预览数据显示中,第2行的id 2.0是添加新行,第4行显示相同的数据是删除,假设相同,那么如何实现. 解决方案 合并行 (diff) 要求两个输入流都按合并键排序(编辑步骤的属性时会出现警告). 在合并行(差异)步骤之前在每个流中放 ..
发布时间:2021-06-15 18:50:45 其他开发

在哪里下载 sun.jdbc.odbc.JdbcOdbcDriver(尝试将输出 csv 从 Spoon 连接到 SSMS)

我有一个已在 Kettle/Spoon/PDI 中转换的 csv,我正在尝试将其输出到 SSMS. 在 Spoon 中,这是一个两步过程:读取 csv(并编辑几个类型),然后输出到 SQL. 我收到此错误:“找不到驱动程序类‘sun.jdbc.odbc.JdbcOdbcDriver’,请确保已安装‘MS SQL Server’驱动程序(jar 文件).sun.jdbc.odbc.Jdb ..
发布时间:2021-06-15 18:50:37 其他开发

pentaho 勺子/pid:如何每次将文件移动到不同名称的文件夹?

我每个月都有新的文本文件,从中提取数据并进行一些转换.在每个月底,我需要将这些文件移动到名称为当前日期的文件夹中.这意味着,目标文件夹的名称每次都不同.我在 move files 之前做了一个步骤,它创建了一个文件夹,它的名字是当前日期(exp:2019-06-01, 2019-07-01),然后在 move files代码>步骤,我不知道如何指定目标文件夹.猜测“通配符"仅用于源... 否 ..
发布时间:2021-06-15 18:50:04 其他开发

Pentaho作业未通过运行批处理文件执行

我正在使用Windows框.我安装了PDI 6.0并创建了PDI作业.我创建了一个job.bat文件,当我尝试在Shell中执行作业时,该作业根本没有执行.但是通过使用Pentaho Spoon,这项工作可以很好地完成.我不知道为什么它不使用bat文件在Windows命令提示符下运行.这是我创建的批处理文件 @echo关闭cd D:\ Pentaho \ DataIntegrationSET ..
发布时间:2021-04-15 18:48:01 其他开发

Pentaho将uniqe记录导入数据库

我对Pentaho Spoon还是很陌生,我想将一个csv文件的记录导入数据库表。但是,仅唯一记录应导入数据库表中。这就是为什么我需要将EACH记录与数据库表的所有记录进行比较,以确定该记录是否应该导入。 到目前为止,我已经尝试了建议的CRUD模式如下: 如图片所示,我合并excel输入和表输入(忽略转换步骤。我需要转换一个值,因为它们在float格式方面有所不同:数据库格式为#.00 ..

(stderr)= 256m” =“”。目前在Pentaho Shell脚本中是意外的

这个问题几乎类似于 pentaho:错误(stderr)= 256m在这个时候是出乎意料的。在从作业中调用厨房命令(使用shell脚本作业条目执行dos命令)时 但是由于我提供了确切的详细信息,因此其清晰度有所不同,而且这个问题是3岁,还带来了版本问题。另外,该问题尚未得到解答,互联网上没有其他可用的解决方案,只有很少的页面只有未回答的问题。因此,再次将其发布得更详细。 我正在使用pe ..

每小时从远程数据库获取数据

昨天我下载 Pentaho BI服务器 数据集成 报表设计器 然后,我将报表设计器连接到远程数据库并获取表并成功绘制该数据的图表. 我的问题是,我想通过从远程数据库中获取新数据来每小时运行一次该文件(我在报表设计中创建) 您能指导我逐步进行操作吗,因为我在所有这些方面都是新手. 解决方案 我将回答我自己的问题.因此,要计划数据集成中的作业,您必须遵循以下步骤 第1步: ..
发布时间:2020-07-02 20:30:24 其他开发

Pentaho单个仪表板使用Ajax生成多个报告

我制作了多个仪表板副本,以呈现不同的报告.因此浏览器中每个报表的url更改和整个页面都需要刷新. 前天,我知道可以刷新任何组件[刷新Pentaho CDE仪表板的所有组件] 我想知道我是否可以通过单击不同的按钮/链接使用ajax调用,使用单个pentaho仪表板在单个报告组件上呈现不同的报告? 我觉得应该有一些解决办法. 解决方案 好的,经过多次尝试,我发现我可以使用单个 ..
发布时间:2020-07-02 20:28:03 前端开发

根据文本文件输入元数据进行数据库插入

我正在开发ETL,并且必须执行一些例程来对其进行监视. 首先,我必须在DB上的INSERT中创建一条记录,以通知文件名和开始进程的日期时间.该查询将返回记录的PK,并且必须将其存储.该文件的ETL完成后,我必须更新该记录,以告知ETL成功完成及其结束过程的日期时间. 我使用文本文件输入来查找与其正则表达式匹配的文件,并将其“其他输出字段"添加到流中.但是我找不到一个仅可用于第一条记录并 ..

如何使用Pentaho验证一个csv数据与另一个csv文件的比较?

我有两个csv文件. 在一个文件中,我有10行,在另一数据列表中. 我想做的是,检查第一个csv的一个文件的数据,并将其与另一个csv文件进行比较. 那么我该如何实现呢? 任何帮助都会很棒. 解决方案 您要查找的步骤称为Stream Lookup步骤. 读取CSV和参考文件,并将这两个流放在Stream Lookup中,并将其设置如下: a)查找步骤=读取参考的步骤 b)键/字段= CS ..

如何根据pentaho水壶中的先前输入数据运行不同的sql以获取数据

我在Windows 10中使用pentaho水壶8.2,db是Oracle,现在我有一个要求并且不知道如何实现此功能. 我的要求是: 第1步:从db获取数据1; 步骤2:根据步骤1的数据1的字段从不同的表(sql)获取数据2; 步骤3:根据步骤2中的数据2更新其他数据库. 第1步很容易从一个数据库获取数据,在第2步中,我尝试根据第1步的输出获取数据,我使用Switch/ca ..
发布时间:2020-04-25 11:47:51 数据库