pentaho-data-integration相关内容
我已尝试使用Pentaho 9.2运行作业,但在按厨房运行时未选择作业 ./itchen.sh-rep=repo1-file=/var/lib/jenkins/project/path/etl/Job1.kjb Job1.kjb包含多个子作业。Pentaho 9.2没有选择子作业并显示以下错误。 错误日志: 2022/03/02 05:00:28-作业1-作业执行开始 2022
..
我正在尝试将字符串值转换为日期。该字符串的格式为:yyyy-MM-dd。但是,当我尝试使用选择值进行转换时(在元日期中我选择了fildname,type=Date and Currency=dd/MM/yyyy),我收到以下错误: String : couldn't convert string [2017-01-30] to a date using format [yyyy/MM/dd
..
在Pentaho中,我有两个CSV文件,我需要彼此划分列并将结果写入新表。 1.csv 否 A B 1 10 14 2 8 20 2.csv 否 A B 1 2 7 2 4 10 输出应为 Output.csv 否 A B 1 5 2 2 2 12 每个CSV上至少有500行和500列。如何划分每个CSV并创建包含结果的新表? 推荐答案
..
由于最近 Mogodb 升级到 3.6,pentaho Kettle mongoinput 步骤聚合无法从 Mongodb 中获取数据. 错误信息: com.mongodb.MongoCommandException:命令失败,错误 9:'The'cursor' 选项是必需的,除了带有解释的聚合服务器 localhost:2915 上的参数'.完整的响应是 { "ok" : 0.0,"
..
我是正则表达式的新手,我想使用正则表达式将给定字符串分成 6 个部分.我正在使用 Pentaho 数据集成工具(ETL 工具) 给定字符串: 1x 3.5 mL SST.1x 4.0 mL 灰盖冷冻管. 注意:有更多相同格式的字符串 我希望输出为: 提前致谢!! 解决方案 您提供的 single 字符串数据看起来应该与正则表达式模式匹配: (\d*)x\s(\d*
..
我是 Pentaho 的新手.任何人都可以指导我如何使用 PDI 以 PDF 文件格式创建报告并通过邮件作为附件发送.任何教程或演示都会有所帮助 解决方案 Pentaho 数据集成为此提供了一个非常简单的实用程序. 在 PDI 中执行您的报告并使用电子邮件步骤发送报告.
..
我正在使用合并行(差异)比较两张工作表. 第一个 Excel 表: 第二张 Excel 表格: 和我的 pentaho 交易: 在预览数据显示中,第2行的id 2.0是添加新行,第4行显示相同的数据是删除,假设相同,那么如何实现. 解决方案 合并行 (diff) 要求两个输入流都按合并键排序(编辑步骤的属性时会出现警告). 在合并行(差异)步骤之前在每个流中放
..
我输入的 excel 表的字段有两种不同类型的值列,格式为 YYYY/MM/DD 现在,当我将 Excel 工作表添加到 Pentaho 时,我得到的列和数据类型在日期格式列中显示字符串数据类型.你可以在下面看到 在此之后,我尝试与 postgres 集成,但我无法找到我在下面附加的错误的结果 更新 我尝试使用给定的时间戳格式 yyyy/MM/dd HH:mm:ss 这对我
..
我对 postgres 数据库进行了查询,并带来了两个字段,“USER"和“CREATED"(日期) 我从创建日期中提取年份,然后遍历记录并根据年份和用户创建新的json对象 我想生成一个具有以下结构的json.: [{年:2015,用户[{用户:“安娜"已创建:4},{用户:“佩德罗"已创建:7}]},年份:2016,用户[{用户:“安娜"已创建:4},{名称:“佩德罗"已创建:7
..
我是这个工具的新手,我正在尝试创建到数据库的 MySQL 连接,但是当我按下“测试"按钮时,它出现了这条消息: 连接到数据库时出错 [MySQL (_configuracionesEF)] :org.pentaho.di.core.exception.KettleDatabaseException:尝试连接到数据库时出错找不到驱动程序类“org.gjt.mm.mysql.Driver",请确保安
..
我有两个文件(App.csv和Acess.csv) App.csv有一列称为Application 应用 App-A App-B Access.csv包含3列(应用程序,权利,用户ID) Application, entitlement, userid App-A,ent-A,user1 App-A,ent-B,user1 App-B,
..
由于最近将Mogodb升级到3.6,因此pentaho水壶mongoinput步骤聚合无法从Mongodb中获取数据. 错误消息: com.mongodb.MongoCommandException:命令失败,错误9:'The 需要“光标"选项,但带有说明的汇总除外 服务器本地主机上的“参数":2915.完整的响应为{"ok":0.0, "errmsg":““光标"选项是必需的,但与
..
我对Pentaho Spoon还是很陌生,我想将一个csv文件的记录导入数据库表。但是,仅唯一记录应导入数据库表中。这就是为什么我需要将EACH记录与数据库表的所有记录进行比较,以确定该记录是否应该导入。 到目前为止,我已经尝试了建议的CRUD模式如下: 如图片所示,我合并excel输入和表输入(忽略转换步骤。我需要转换一个值,因为它们在float格式方面有所不同:数据库格式为#.00
..
这个问题几乎类似于 pentaho:错误(stderr)= 256m在这个时候是出乎意料的。在从作业中调用厨房命令(使用shell脚本作业条目执行dos命令)时 但是由于我提供了确切的详细信息,因此其清晰度有所不同,而且这个问题是3岁,还带来了版本问题。另外,该问题尚未得到解答,互联网上没有其他可用的解决方案,只有很少的页面只有未回答的问题。因此,再次将其发布得更详细。 我正在使用pe
..
我正在开发ETL,并且必须执行一些例程来对其进行监视. 首先,我必须在DB上的INSERT中创建一条记录,以通知文件名和开始进程的日期时间.该查询将返回记录的PK,并且必须将其存储.该文件的ETL完成后,我必须更新该记录,以告知ETL成功完成及其结束过程的日期时间. 我使用文本文件输入来查找与其正则表达式匹配的文件,并将其“其他输出字段"添加到流中.但是我找不到一个仅可用于第一条记录并
..
我有两个csv文件. 在一个文件中,我有10行,在另一数据列表中. 我想做的是,检查第一个csv的一个文件的数据,并将其与另一个csv文件进行比较. 那么我该如何实现呢? 任何帮助都会很棒. 解决方案 您要查找的步骤称为Stream Lookup步骤. 读取CSV和参考文件,并将这两个流放在Stream Lookup中,并将其设置如下: a)查找步骤=读取参考的步骤 b)键/字段= CS
..
我对PDI还是陌生的,但仍然对此有所了解.我正在尝试创建一个转换,该转换将从一个文件夹中读取所有的csv文件,检查文件中的数据是否正确,这意味着没有格式缺失/错误/错误的行,然后将其存储在数据库中. 我尝试的是: 使用Text File Input使用Apache Common VFS访问FTP中的CSV文件. 使用Filter Row 验证条件,以检查CSV中的数据(检查文件名,字段
..
我在Windows 10中使用pentaho水壶8.2,db是Oracle,现在我有一个要求并且不知道如何实现此功能. 我的要求是: 第1步:从db获取数据1; 步骤2:根据步骤1的数据1的字段从不同的表(sql)获取数据2; 步骤3:根据步骤2中的数据2更新其他数据库. 第1步很容易从一个数据库获取数据,在第2步中,我尝试根据第1步的输出获取数据,我使用Switch/ca
..