kettle相关内容

如何通过水壶在PostgreSQL表中插入UUID值?

我的水壶改造看起来很简单。“表输入-->表输出”。In TABLE INPUT BLOCK:简单的SQL语句,在服务器上运行良好。 尝试通过水壶将UUID值插入到PostgreSQL表时出错: ERROR: column "UUID_Col1" is of type uuid but expression is of type character varying 我找到this解决 ..
发布时间:2022-03-31 11:45:15 其他开发

将 DB Connection 参数传递给 Kettle,也就是 PDI 表 从 Excel 动态输入步骤

我有一个要求,每当我运行 Kettle 作业时,必须在每次运行时从 Excel 源动态获取数据库连接参数. 假设我有一个列名的 excel:主机名、用户名、数据库、密码. 我想在作业运行时动态地将这些连接参数传递给我的表输入步骤. 这就是我想要做的. 解决方案 您可以通过 来实现 从源(例如 Excel 或在我的示例中为 CSV 文件)读取数据库连接参数 将参数存储 ..
发布时间:2021-12-29 20:06:42 其他开发

pentaho 使用 MM-YYYY 创建存档文件夹

我想通过将文件夹中的每个文件放入另一个名称如下的存档文件夹来存档文件夹中的每个文件:“Archive/myfolder-06-2014" 我的问题是如何检索当前月份和年份,然后如何使用这些数据创建一个文件夹(如果它不存在). 解决方案 这个解决方案可能有点笨拙(由于需要大惊小怪),但它似乎有效.这个想法是在单独的转换中预先计算目标文件名并将其存储为系统变量(TARGET_ZIP_FI ..
发布时间:2021-11-17 03:20:59 其他开发

Kettle - 附加 XML 文件内容

如何附加两个(可能更多)XML 文件?我使用“获取文件名"搜索这些文件.如果找到多个文件,我如何附加它们的内容,以生成只有一个 XML 文件? 谢谢 解决方案 检查“XML Join"步骤.奇怪地命名为它不是真正的连接(虽然当你想到它时我猜它是)但应该做你想做的事. ..
发布时间:2021-11-16 19:48:06 其他开发

Pentaho BI - 由于最近 MongoDB 升级到 3.6,MongoDB 输入聚合错误

由于最近 Mogodb 升级到 3.6,pentaho Kettle mongoinput 步骤聚合无法从 Mongodb 中获取数据. 错误信息: com.mongodb.MongoCommandException:命令失败,错误 9:'The'cursor' 选项是必需的,除了带有解释的聚合服务器 localhost:2915 上的参数'.完整的响应是 { "ok" : 0.0," ..

Pentaho Kettle 8 Kafka 消费者

我在使用新的 Kafka 消费者连接器时遇到了一些问题.我按照文档中的说明使用它,我在转换中单独使用了连接器,并且我在作业中进行了此转换,并从流步骤获取记录. 问题是第一次转换,使用 kafka 消费者,永远不会完成,它一直在运行,没有收到任何东西. 解决方案 跟我来,如下图: ..
发布时间:2021-11-12 03:01:52 其他开发

Pentaho作业未通过运行批处理文件执行

我正在使用Windows框.我安装了PDI 6.0并创建了PDI作业.我创建了一个job.bat文件,当我尝试在Shell中执行作业时,该作业根本没有执行.但是通过使用Pentaho Spoon,这项工作可以很好地完成.我不知道为什么它不使用bat文件在Windows命令提示符下运行.这是我创建的批处理文件 @echo关闭cd D:\ Pentaho \ DataIntegrationSET ..
发布时间:2021-04-15 18:48:01 其他开发

Pentaho水壶-获得所有单词组合

如何通过pentaho水壶获得所有可能的单词组合.有没有做到这一点的步骤? 例如-如果我有3个单词Apple,Banana,Orange 我需要这些单词的所有唯一组合,即 comb1 = Apple; Comb2 =香蕉; Comb3 =橙色; Comb4 =苹果+香蕉; Comb5 =苹果+橙色; Comb6 =香蕉+橙; Comb7 =香蕉+苹果; Comb8 ..
发布时间:2021-02-14 21:12:46 Java开发

Pentaho BI-由于最近将MongoDB升级到3.6而导致的MongoDB输入聚合错误

由于最近将Mogodb升级到3.6,因此pentaho水壶mongoinput步骤聚合无法从Mongodb中获取数据. 错误消息: com.mongodb.MongoCommandException:命令失败,错误9:'The 需要“光标"选项,但带有说明的汇总除外 服务器本地主机上的“参数":2915.完整的响应为{"ok":0.0, "errmsg":““光标"选项是必需的,但与 ..

Kettle/Pentaho数据集成-无法创建数据库连接(XulException:java.lang.reflect.InvocationTargetException)

终于可以启动水壶并且不挂了,我仍然无法使用它,因为当我尝试创建新的数据库连接(创建新的转换之后)时,出现此错误: org.pentaho.ui.xul.XulException: java.lang.reflect.InvocationTargetException 此后,对于相同的操作,我得到了更普遍的错误: General error in dialog 为了再次获得第一个 ..
发布时间:2021-02-14 21:12:40 Java开发

如何将Pentaho Data Integration与Amazon RDS连接

在使用Amazon RDS在Pentaho数据集成(Kettle)上创建新连接时,我遇到了困难, 亚马逊需要一个CA Cert,而且我不知道如何将其输入到连接中. 有人可以帮助我吗? Tkx, 解决方案 从Pentaho(PDI Kettle)建立到AWS(RDS)Aurora/MySQL的安全连接(SSL) 1. You need to create a new use ..
发布时间:2020-08-22 21:50:12 其他开发

在Ubuntu 14.04 64位上运行勺子时出错

我长时间使用了Pentaho数据集成的Spoon工具,并且在我的系统上运行良好.但是由于我将其移至/opt,因此无法再次运行.我在系统上安装了Oracle Java 8,每次尝试运行它时,都会遇到以下异常 Exception in thread "main" java.lang.NoClassDefFoundError: org/eclipse/swt/widgets/Composite a ..
发布时间:2020-04-25 11:48:38 Java开发

Pentaho文本文件输入步骤崩溃(内存不足)

我正在使用Pentaho来读取非常大的文件. 11GB. 该进程有时会因内存不足异常而崩溃,有时它会说进程已终止. 我正在12 GB的计算机上运行该作业,并为该进程分配了8 GB的空间. 是否可以通过一些配置来运行文本文件输入步骤以使用更少的内存?也许更多地使用磁盘? 谢谢! 解决方案 打开spoon.sh/bat或pan/kettle .sh或.bat并更改-Xm ..
发布时间:2020-04-25 11:48:34 其他开发

如何从Pentaho Kettle读取所有文件夹和子文件夹使用SFTP获取文件步骤

“使用SFTP获取文件"步骤能够从指定的源路径(通过FTP)获取所有文件.但是它无法读取源路径中存在的任何文件夹.我尝试使用.*或*或Reg-Exp通配符.等等,但没有用. 在我的用例中,源文件总是放在一个或多个文件夹中(例如,每月特定文件夹中的每月交易文件,或多层文件夹层次结构中按年和按月的文件夹等).如果所有这些文件夹都移到了我的本地计算机上,那么我可以使用“获取文件名"步骤从每个文件夹 ..
发布时间:2020-04-25 11:48:30 其他开发

有人知道Pentaho数据集成(水壶)连接器列表吗?

我正在比较三种开源ETL工具Talend,Kettle和CloverETL. 我可以毫无问题地找到Talend和CloverETL的连接器列表. 但是,我找不到适合水壶的那个. 有人认识他们吗?我在哪里可以找到他们? 非常感谢 解决方案 我假设“连接器"是指输入/输出节点,而不是中间转换.只需查看Kettle GUI,我就会看到: 输入 访问 CSV 从文 ..
发布时间:2020-04-25 11:48:27 其他开发

如何将文件上传到Pentaho用户控制台服务器?

我需要: 1)让用户从本地PC中选择文件 2)将文件上传到pentaho服务器 3)使用水壶转换处理文件 我尝试使用Pentaho用户控制台(PUC)5.0中的csv数据源,但找不到从上传到PUC信息库的.ktr文件访问它的方法.我也尝试将csv文件上传到文件夹,但仍然无法从.ktr文件访问它. 解决方案 我认为此要求有效: 将csv数据文件和.ktr文件上传到PUC ..
发布时间:2020-04-25 11:48:22 其他开发

从大文件中提取数据Excel

我正在使用Pentaho数据集成来创建从xlsx文件到mysql的转换,但是我无法使用Excel 2007 xlsx(apache POI Straiming)从大文件中导入数据.它给了我内存不足的错误. 解决方案 我建议您在运行转换之前增加jvm内存分配.默认情况下,pentaho数据集成(也称为水壶)具有较低的内存分配,这会在运行涉及大文件的ETL时引起问题.您需要修改-Xmx值,以使 ..
发布时间:2020-04-25 11:48:18 其他开发