flat-file相关内容

从文件或数据库服务器访问数据更快吗?

如果我有一个由文件夹和文件组成的静态数据库,考虑到将在CGI脚本中使用它,访问和操作是否比SQL Server类型的数据库要快? 使用文件和文件夹时,提高性能的诀窍是什么? 解决方案 我将添加到它 这种问题没有通用答案,但在很大程度上取决于当前的情况。我什至最近甚至将一些数据从SQL数据库移到了平面文件系统,因为数据库的开销以及一些数据库连接可靠性问题使使用平面文件成为更好的选 ..
发布时间:2020-09-30 21:20:36 其他开发

BizTalk FlatFile架构多个重复记录

我有一个平面文件,我需要创建一个架构,以便可以将该平面文件转换为XML并将其带到BizTalk中. 我已经使用平面文件架构向导创建了一个架构,但是它不起作用.我已经手动对其进行了修改,但仍无法正常工作.我将解释什么不起作用. Flat File structure: File header Batch header Detail (repeating records) Address ..
发布时间:2020-09-21 18:47:42 其他开发

BizTalk Flat File Schema-如何接受LF或CRLF作为行定界符

我们的客户向我们发送了一个平面文件作为输入,然后我们将其接收并转换为XML文件,然后再发送至目标系统. 平面文件包含多行,每行由LF或CRLF分隔. 如何创建平面文件架构,以便BizTalk能够解释每行数据,而不管该行是由LF(0x0A)还是由CRLF(0x0D 0x0A)分隔? 解决方案 问题已解决.这是万一其他人想知道的解决方案: 由于LF和CRLF都共享LF字符,因此我 ..
发布时间:2020-09-21 18:37:37 其他开发

Spark从蜂巢中选择还是从文件中选择是更好的选择

我只是想知道人们对从Hive读取与从.csv文件,.txt文件或.ORC文件或.parquet文件进行读取的想法是什么.假设基础Hive表是具有相同文件格式的外部表,是从Hive表中读取还是从基础文件本身中读取,为什么? 迈克 解决方案 tl; dr:我会直接从实木复合地板文件中读取 我正在使用Spark 1.5.2和Hive 1.2.1 对于500万行X 100列的表格,我记 ..
发布时间:2020-09-04 06:18:06 其他开发

使用自定义管道将平面文件拆分为较小的文件(按行计数)

我正在尝试为BizTalk 2010创建一个自定义管道组件,该组件将传入的平面文件拆分为多个较小的文件.我想将文件(可以说约3万行)分割成每个约5000行或更少的文件(可以说如果文件包括33000行). 我尝试使用 Selvan的很好的例子的自定义反汇编管道无效. 我已经使用了管道组件向导来生成管道框架,但是对于如何进行反汇编阶段代码和拆分大文件的任何技巧或指针,我将感到非常满意.我是 ..
发布时间:2020-07-30 20:24:11 C#/.NET

为什么在导入UTF-8平面文件时SSIS不能识别换行{LF}行定界符?

我正在尝试使用SSIS将数据从utf-8编码的平面文件导入SQL Server 2008.这是行尾数据在Notepad ++中的样子: 我还有几张图像显示文件连接管理器的外观: 您可以在文件连接管理器预览中看到数据正确显示.当我尝试导入此数据时,不会导入任何行.我收到一条错误消息,指示未找到行分隔符.您可以在文件连接管理器图像中看到,标题行分隔符和行分隔符都设置为{LF}.这足以生成正 ..
发布时间:2020-07-13 02:51:23 数据库

SSIS-平面文件始终为ANSI从未UTF-8编码

具有非常简单的SSIS程序包: 通过视图获取数据的OLE DB源(db表nvarchar或nchar中的所有字符串列). 派生列以格式化现有日期并将其添加到数据集中(数据类型DT_WSTR). 多播任务,用于在以下情况之间分割数据集: OLE DB命令将行更新为“已处理". 平面文件目标-的连接管理器设置为代码页65001 UTF-8,并且未选中Unicode.所有字符串列都映射到D ..
发布时间:2020-07-13 02:45:43 其他开发

如何从.txt文件导入数据以填充SQL Server中的表

每天,带有客户数据的PPE.txt文件(用分号分隔并且始终具有相同的布局)存储在特定的文件目录中. 每天都有人必须根据此PPE.txt从我们的数据库中更新特定的表. 我想通过SQL脚本自动化此过程 我想将是一种解决方案,就是通过脚本将文件从此.txt文件导入到创建的表中,然后执行更新. 到目前为止,我有 IF EXISTS (SELECT 1 FROM Sysobje ..
发布时间:2020-07-11 23:20:42 数据库

如何跳过ssis平面文件源中的错误行

我正在将一个17列CSV文件读入数据库. 有时文件具有“少于17列"的行. 我试图忽略该行,但是即使所有列都设置为忽略,我也无法忽略该行,并且包装失败. 如何忽略那些行? 解决方案 解决方案概述 您可以通过添加一个Flat File Connection Manager来添加数据类型为DT_WSTR且长度为4000 (假设其名称为Column0)的一列-因此所有列都被视为一个大 ..
发布时间:2020-07-11 21:56:28 数据库

如何加载混合记录类型的定宽文件?并且文件包含两个标题

我有一个任务来加载格式异常的文本文件.该文件也包含不需要的数据.它包含两个背对背的标头,并且每个标头的数据在备用行上指定.标题行在------之后开始.我需要同时读取标头及其对应的数据,并使用将其转储到某些Excel/表目标中.让我知道如何使用SSIS中的任何转换或脚本来解决此问题. 不知道该如何使用脚本任务. 现在,我正在读取文件的一列,并使用派生的列手动尝试使用substring函数对其 ..
发布时间:2020-07-11 21:50:18 数据库

无法识别SSIS衣衫file的文件CRLF

在SSIS中,我尝试从平面文件加载数据. 平面文件具有固定宽度的列,但行中不存在某些列(一列可以具有CRLF,必须为新行) a b c the first rowok iu jjrjdd this is a newline 如何在输出中拥有完全相同数量的行和数据? 我建立了一个平面文件连接,类型参差不齐. 在此示 ..
发布时间:2020-07-11 20:41:57 数据库

Strawberry Perl为什么不删除这些换页符?

我当前正在WinXP上运行Strawberry Perl,并且正在尝试处理Unix格式的平面文件.平面文件使用换行符来分隔字段,并使用换行符来分隔记录.我正在尝试将FF转换为其他任何格式(CRLF,“;",TAB等).我尝试使用以下perl一线客机,但未成功: perl -p -e 's/\f/\r\n/g' dos.txt perl -p -e 's/\x0c/\ ..
发布时间:2020-07-10 01:46:08 其他开发

替换ffdf对象中的NA

我正在使用在某些列中具有NA的ffdf对象. NA是使用 merge.ffdf 进行左外部合并的结果.我想将NA替换为0,但无法做到这一点. 这是我正在运行的代码: library(ffbase) deals ..
发布时间:2020-06-14 19:18:13 其他开发

如何遍历多个文件夹多个文件和将数据转储到具有相同文件名的SQL表中? SSIS

这将是我提出的问题的更新在这里之前. 我需要遍历文件夹&将txt文件转储到具有相同名称(禁止扩展名为.txt)的SQL表中 我的文件夹/文件结构如下所示设置 现在,文件A,B,C在所有文件夹中均保持一致&服务器上恰好有一个[dbo].[FileA],[dbo].[FileB],[dbo].[FileC]等. 因此Data1文件夹将具有FileA,FileB ... File ..
发布时间:2020-05-19 22:13:52 数据库

平面文件与数据库-速度?

我正在制作一个聊天程序,我需要一个存储消息的地方.客户端将每隔x秒与服务器联系一次,并获取最后收到的消息ID,然后服务器将在客户端已加入的房间中找到ID大于此ID的所有消息. 由于我不会永远存储东西,因此我考虑使用仅包含最后40条左右消息的平面文件(每个房间一个,以及直接消息).但是我认为,通过比较数字,数据库会更快. 我应该使用哪种数据存储方式? 解决方案 平面文件可能会更快 ..
发布时间:2020-05-15 04:10:08 PHP

源文件连接(平面文件)-不读取列元数据

当我创建SSIS包时,它需要引用一个文件来拾取文件元数据.例如,列标题将为ColumnA,ColumnB. 我一直认为文件中必须存在这些列名称才能加载它.最近,由于某种原因,业务将文件中的列名之一更改为其他名称,因此文件包含ColumnA,NotColumnB.当SSIS程序包运行时,它将忽略此操作并加载文件.我以为它会失败.我的假设是正确的,并且发生了一些奇怪的事情,还是我的假设不正确,如 ..
发布时间:2020-05-09 01:58:21 其他开发

为什么日志文件通常是平面的?

日志文件不是要由机器读取而是由用户读取吗?我想知道是否有用于任何日志记录框架的文件追加器,将它们的输出写入XML. 解决方案 “登录到XML"是相当普遍的要求,因为没有标准日志文件格式之类的东西.但是由于XML文件是文本文件,日志框架可以编写,并且其中许多框架都允许配置日志行格式,所以我认为用所选的XML标签定义日志输出没有问题. 对于log4j,可能是这样的: log4j.a ..
发布时间:2020-05-03 06:49:16 其他开发

简单,快速的SQL查询平面文件

是否有人知道使用类似于SQL的声明性查询语言来提供简单,快速的平面文件查询的工具吗?我宁愿不支付将文件加载到数据库中的开销,因为输入数据通常在查询运行后几乎立即被抛出. 考虑数据文件"animals.txt": dog 15 cat 20 dog 10 cat 30 dog 5 cat 40 假设我想为每只独特的动物提取最高价值.我想写些类似的东西: cat animals. ..
发布时间:2020-05-01 10:57:27 服务器开发

有没有一种聪明的方法来编写固定长度的平面文件?

是否有任何框架/库可以帮助在java中编写固定长度的平面文件? 我想将bean /实体的集合写入平面文件而不用担心转换,填充,对齐,填充等等 例如,我想解析一个bean,如: public class Entity { String name =“name”; //长度= 10;左对齐;用空格填充 整数id = 123; //长度= 5;左对齐;用空格填充 整数序列= 321 ..
发布时间:2019-01-02 13:50:02 Java开发