talend相关内容

如何将 talend 作业导出为单个 fat jar

是否可以仅将 talend 作业导出为一个 jar(包括其所有依赖项)?因为目前导出的 zip 文件有外部依赖. 提前致谢 解决方案 我从未找到一种方法来通过 Talend Open Studio(社区版)实现包含依赖项输出的单个 jar.解决方法是创建一个 Java 应用程序,将库和作业 jar 添加到其中,然后将该 Java 应用程序打包为一个胖 jar. ..
发布时间:2021-09-04 19:25:25 其他开发

如何在 Talend 作业中将当地时间转换为 UTC,反之亦然

我有一个数据库(不是 SQL),其中的时间字段都填充了本地时间.我有一个带有 UTC 时间字段的数据库 (SQL).现在我想在这些数据库之间交换信息,但只有当我可以从本地时间转换为 UTC 时,我才能实现这一点,反之亦然.我如何在 Talend 中实现这一目标? 我知道本地时间数据库中的数据,是荷兰本地时间.(GMT +1(冬季)GMT +2(夏季)) 示例:23-10-2015 16:0 ..
发布时间:2021-09-04 19:25:23 其他开发

更改循环位置时的 tJavaFlex 行为

在工作中遇到一些问题,我怀疑是由于对 tJavaFlex 缺乏了解.我在此测试作业中生成 10 行,并在 tJavaFlex 中生成循环: 因此有 10 行进入,并且在 Start 和 End 部分中有一个循环.我期望对于每一行进入,它会产生 10 行相同的输出.而且我会看到每行的迭代次数为 0,1,2,3....9. 我得到的是这个.在我看来,整个作业运行了 10 次,因此我有 10 ..
发布时间:2021-09-04 19:25:20 其他开发

将数据库值设置为 talend 中的上下文变量

我有一份这样的工作. tAccessDatabse_1 --->tFileOutputXML_1. 现在,我的数据库有一个架构,包含用户名和用户 ID.我的任务是从数据库创建/发送数据到 xml 文件,文件名和用户名,即,必须为每个用户创建一个文件,使用他/她的名字. 我尝试创建一个conetxt变量,但如何从数据库中将用户名设置为该上下文变量?? 解决方案 从表中选择不同的用 ..
发布时间:2021-09-04 19:25:17 其他开发

Talend - 限制处理的行数

我正在使用 Talend ETL 在两个 Salesforce 组织之间传输数据.我正在尝试运行初步测试以确保一切设置正确. 有没有办法限制传输的行数?数据库有 50,000 多行,我只想发送超过 15 或 20 行. 谢谢. 解决方案 在 Talend 方面,您可以使用 tSampleRow 仅处理检索到的有限数量的行.例如,您可以使用行号范围仅处理第 1-50 行. ..
发布时间:2021-09-04 19:25:14 其他开发

talend , mongoDB 连接

我遇到了 mongo DB 连接问题. 我已成功将 tMongo 组件导入到我的 Talend Open Studio 5.1.1 并通过将 mongo 1.3.jar 文件复制到 lib/java 文件夹,我的 Mongo DB 作业成功运行,但问题是即使我提供了一些mongoDB 的假服务器路径(IP)和假端口,我的工作运行没有错误,它给了我 1 行没有数据.正确的 IP 和端口也是如此 ..
发布时间:2021-09-04 19:25:12 其他开发

SVN 中的 Talend 项目

我需要通过 SVN 使用 Talend Open Studio.我应该放在存储库中的文件夹是什么? 解决方案 嗯,“官方"的答案是升级到 Talend 集成套件 (TIS),其中包括 SVN 集成.使用共享存储库同步多个开发人员的活动大有帮助. 如果 TIS 不适合您,您可能会通过将 Talend Open Studio (TOS) 的项目目录置于 SVN 控制下而取得一些成功.这是 ..
发布时间:2021-09-01 19:45:58 其他开发

Talend:java.lang.UnsatisfiedLinkError:java.library.path 中没有 sapjco3

我在 Talend lib 目录中有 jar 和 dll.路径和类路径已设置.我还下载并安装了 VC++ 2005 redistribution sp 1 补丁和 SAP 提供的缺少的 dll.我曾尝试在 Windows 2003 机器和 XP 机器上运行此 ETL 作业,结果相同.任何人都可以在这里帮助我. 在 2014 年 3 月 10 日 13:57 开始工作退款.[统计] 连接到端口 3 ..
发布时间:2021-07-14 20:05:23 其他开发

Talend 解析日期“yyyy-MM-dd'T'HH:mm:ss'.000Z'"

我在 Talend 中解析日期时出错.我的输入是字符串形式的 excel 文件,输出是具有以下 Salesforce 格式“yyyy-MM-dd'T'HH:mm:ss'.000Z'"的日期 我有一个带有这个连接的 tMap TalendDate.parseDate("yyyy-MM-dd'T'HH:mm:ss'.000Z'",Row1.firstDate) 但抛出以下错误: ..
发布时间:2021-07-14 19:44:53 其他开发

talend 的 utf8mb4 设置 - 不起作用

我正在将数据从 sql server 迁移到 mysql.我正在使用工具 Talend(ETL). 当我在源 (sql server) 中有表情符号时,问题就出现了,它没有插入到 mysql 的表中.所以,我知道我必须在 mysql 端使用 utf8mb4. 必须设置客户端设置字符编码,才能插入笑脸.数据库、表和服务器都在utf8mb4上 但是,客户端,即 talend 不是 u ..
发布时间:2021-06-05 20:08:44 数据库

如何在Talend最新版本的tHiveRow中运行多个配置单元查询

我已经尝试过使用 tForEach ,但是由于它不能包含大于130个字符的值,因此存在局限性. 因此,我转向了 tFixedFlowInput ,但是在这里似乎不可能对多个查询进行迭代运行. 我遵循了这个在Talend中使用tHiveRow组件运行多个配置单元查询 有人可以帮助我实现我的目标吗? 解决方案 这可以通过将配置单元脚本保存在文本文件中来实现.现在读取行分隔符为 ..
发布时间:2021-05-14 19:09:22 其他开发

Talend(7.0.1)-无法在运行时修改mapred.job.name

我在Talend OS中为大数据运行一个简单的tHiveCreateTable作业时遇到了一些麻烦(打印我遇到此错误的工作).Hive连接良好,并且可以正常工作,直到在群集中激活Ranger为止. 护林员之后,我开始获得以下日志: [统计信息]连接到端口3345上的套接字【统计】联系处理语句时出错:无法在运行时修改mapred.job.name.它不在允许在运行时修改的参数列表中[统计资 ..
发布时间:2021-05-14 19:08:55 其他开发

Talend如何将一个数据库复制到另一个数据库

我需要将很多af表从一个数据库复制到另一个数据库.我想快速地做到这一点.那么,最快的方法是什么呢?我是talend的新手,我知道可以做这样的事情:toracleinput-> map-> toracleoutput.但是要为40张桌子花费很多时间. 解决方案 如果要转移所有表,则可以使用有关详细信息,请参见图像. ..
发布时间:2021-04-28 20:00:30 数据库

如何使用bufferedReader捕获csv文件中的字段值

csv文件如下所示: 我正在尝试获取诸如name之类的字段值,它是$$ NAME $$之后的值(标识符后面有一个空格).如何使用Java中的BufferedReader存储每个字段的值?字段可以是任何行号,而不是固定的位置或格式,并且如果遇到任何特殊字符或遇到null值,也会引发错误. int n = 100;//最大行数弦线;尝试(BufferedReader br = new Buf ..
发布时间:2021-04-27 19:54:03 Java开发

talend:csv列中间的换行符

我正在使用tSoap组件获取数据,在该组件中,我将XML格式的结果作为逗号分隔的值来获取. 之后,我使用tExtractXMLField组件从响应中提取数据. 但是在数据中,我在字符串中包含"\ n",将其视为新行.我尝试使用tReplace组件使用正则表达式删除引号内的\ n,但数据太大,导致导致StackOverflowError. 我也尝试使用tNomalize组件使用CS ..
发布时间:2021-04-27 19:45:34 其他开发

使用Python运行Talend作业

我正在尝试自动化一些本应手动执行的操作,因此我可以运行一个python脚本,而无需执行大量步骤.我想找到一种从python脚本运行Talend作业的方法. 我该如何完成?甚至有可能吗? 解决方案 糟糕!对不起. 在Studio中,构建作业以获得可以从命令行启动的自主作业. 从生成的存档中提取文件. 搜索文件夹"script/yourJobname". 根据您喜欢的哪一种,从. ..
发布时间:2021-04-12 20:40:38 Python

无法获得主Kerberos主体作为Talend批处理作业的续订者

我们正尝试使用talend批处理(spark)作业来访问Kerberos群集中的配置单元,但出现以下“无法获取主Kerberos主体作为更新程序"错误. 当我们从没有数据的表中选择count(*)时,它将返回"NULL",但如果Hdfs(table)中存在某些数据,则失败并显示错误“无法获取主Kerberos主体用作更新程序". 我不确定是什么原因导致了令牌问题.有人可以帮助我们知道根 ..
发布时间:2021-04-08 20:01:24 其他开发

Talend和Apache Spark?

我对Talend和Apache Spark在大数据生态系统中的适合位置感到困惑,因为Apache Spark和Talend都可以用于ETL. 有人可以举例说明吗? 解决方案 Talend是一种基于工具的大数据方法,并支持带有内置组件的所有大数据应用程序.火花是代码基础方法,您需要编写用例代码. ..
发布时间:2021-04-08 19:59:39 其他开发

tRest并使用tExtractJSONField和TALEND映射JSON

我对Talend并不陌生,我一直坚持使用tRest获取JSON数据. 我们假设我正在尝试从社交网络获取所有帖子. 这就是为什么我使用 https://tagboard.com 来获取以JSON格式格式化的数据的原因. 这是我尝试过的场景之一. 我有来自 https://post-cache.tagboard的输出JSON数据. com/search/tunisie?count = ..
发布时间:2021-02-13 21:18:28 其他开发