data-warehouse相关内容

在redshift中更新

我有一个DW表,我将从其中的临时表中插入数据.DW表包含5列,而我实际上是在从暂存表中进行选择时检查DW表中是否已经存在所有5列的组合,如果存在,那么我不进行插入(或更新)操作并跳过该行(因为它已经存在). 另一方面,如果有任何行不包含5列的组合,那么我将进行插入. 有没有一种方法可以使用upsert来实现.由于我在这里不执行任何更新操作(仅插入和删除(忽略插入)).我不确定upser ..

如何在VS 2017中按日期访问TFS仓库来获取任务ID,功能ID,完成工时?

如何获取任务,功能ID,按日期完成的小时数 SQL SERVER QUERY 。 让我们说有一个 任务123,其中在开始日期为7月1日(1.1.2018)和结束于7月10日(10.7.2018)的Sprint中创建。 任务123个小时的工作时间为5个小时。完成时间为0,而重命名时间为1-7-2018 5小时。 并且在7月5日的努力是5个小时完成2个小时,而重命名时间是3个小时。 并且 ..
发布时间:2020-10-18 03:26:35 C#/.NET

设计具有多个数据源的维度

我正在设计具有多个数据源的几个维度,想知道其他人为对齐每个数据源的多个业务密钥做了什么。 我的示例: 我有2个数据源-订购​​系统和执行系统。订购系统包含有关付款以及应如何处理的详细信息;执行系统包含有关实际发生情况的详细信息(花费了多长时间等,由谁执行了订单)。来自两个系统的数据都需要创建一个单一事实。 在Ordering and Execution系统中,它们都是一个Locati ..
发布时间:2020-10-18 03:26:34 其他开发

如何在Kimball式数据仓库中对这种关系进行维度建模?

所以我在数据仓库中有两个维度: dim_machine -------- ----- 机器密钥 机器名称 机器类型 dim_tool ------------ 工具键 工具名称 机器类型 我要确保的是两个维度中的machine_type字段具有相同的数据。我应该在雪花与雪花之间创建第三个维度吗? 解决方案 我不确定到底是什么问题你想解决?这听起 ..
发布时间:2020-10-18 03:25:32 其他开发

需要帮助来了解SSIS中SCD的替代方法

我正在从事一个数据仓库项目,该项目将涉及集成来自多个源系统的数据。我已经建立了一个SSIS程序包,该程序包可以填充客户维度,并使用缓慢变化的维度工具来跟踪对客户的更新。 我遇到了一些问题。举个例子: 源系统A可能有类似这样的记录: 名字,姓氏,邮编 简,美国能源部(Doe),14222 源系统B可能为同一客户端记录如下: 名字,姓氏,邮政编码 简,母鹿,未知 ..
发布时间:2020-10-18 03:25:27 数据库

在ETL中进行分阶段:最佳实践?

当前,我使用的体系结构采用了一些数据源,因为其中的数据源托管在云中,因此这些数据源是在本地暂存的。无论如何,其他都在本地托管,因此我执行的ETL直接从源头获取。我看不出为其他来源创建舞台的意义。 1)将本地托管的源复制到本地阶段是否有明显的好处? 2)将舞台托管在单独的计算机上还是与Warehouse托管在同一台计算机上是个更好的主意? 3)如果我想减少ETL时间,那是什么?这样 ..
发布时间:2020-10-18 03:24:18 其他开发

分区交换作为SQL Server中的发布技术?

我熟悉使用Oracle中的分区作为发布表的增量添加(在DW上下文中)的技术的概念。 (例如以下示例) 例如。数据集市事实表的每日快照将在后台隐藏在表的分区中。例如,以date为分区键(1个分区表,只有一个分区)。一旦完成加载并验证了内容,就可以将其作为字典事件“交换”到真正的目标表(1个分区表,其中有很多分区)。 SQL Server 2008是否可以使用相同类型的发布模型? ..
发布时间:2020-10-18 03:24:17 数据库

收集年度汇总数据以便以后快速访问

我有许多以 year 作为参数并生成给定年份的年度报告的SQL查询。 这些查询非常麻烦,并且需要花费大量时间(20分钟-40分钟)执行。 为了使我的用户能够在需要时查看年度报告,我正在考虑预先执行这些查询并存储结果以供以后使用。 一种解决方案是安排执行这些查询并将结果插入到某些临时表中。 但是我正在寻找一种更聪明的方法,该方法不涉及为所有这些查询编写数十个立即执行语句或自定 ..

DateKey YYYYMMDD是否应为char(8)?

仓库中到处都是两个最重要的字段,分别是UserAccountKey和DateKey。 DateKey是(int,不为空) UserAccountKey为(int,不为空) 这些是正确的数据吗 WH创建于2006年,所以虽然我们现在正在运行,但类型 Date 不是一个选项。 2008-R2 ,因此它现在是WH的下一个迭代的选项。这是一个完善的WH,其中包含多个多维数据集和整个报告 ..
发布时间:2020-10-18 03:22:12 其他开发

我们应该在解决方案中的多个项目之间分隔sis软件包吗?

我使用 SSIS2012 。我在数据仓库中创建了三个架构( STG , TRSF , DW )。 STG架构用于登台表。我所有的源文件都是CSV文件。我正在将数据从源传输到stg模式中的每个表。我为每个表都有一个单独的包(例如:如果我有20个csv文件,我将有20个包,我将在stg模式中填充20个表) 之后那就是我正在将 stg 模式转移到 trsf 模式。在那些过程中,我有生意。我确 ..

SSIS-ETL-从许多服务器传输表/数据库?

我有6-7个相同的数据库(几乎)。我想将这些服务器的每个EACH表中的数据复制到一个服务器的对应表中。即,多个源和一个目标服务器。所有服务器具有不同的IP。我该怎么做? for循环是否适合于此。如果是,那是什么好方法呢? 我可能会执行一些Transform。目前尚不确定。为了安全起见,我想使用SSIS。 解决方案 这里概述了如何设置FOR EACH LOOP来遍历数据库,只要表是相同 ..
发布时间:2020-10-18 03:22:06 数据库

SQL数据仓库,需要使用TSQL SELECT或更好的替代方法来填充我的DIMENSION的帮助吗?

我在SQL Server中有一个表,用于从ERP系统中“暂存”我的数据仓库摘录。 从此暂存表(表名: DBO.DWUSD_LIVE ),我建立了维度并加载了事实数据。 示例维度表称为“ SHIPTO”,此维度包含以下列: : “ shipto_id ” shipto“ ” salpha“ ” ssalpha“ “收货方地址” “收货方名称” “收货方城市” ..
发布时间:2020-10-18 03:22:02 其他开发

将数据从SAP传输到SQL Server的最佳方法是什么?

我们希望基于SAP Tables从头开始构建新的数据仓库。对于提取,转换和加载(ETL)程序,我们要使用Microsoft SQL Server Integration Services。市场上有许多供应商,例如Theobald,CData等,它们提供了访问SAP数据的框架。但是,SAP本身也提供了一个SAP .NET Connector 3.0,可以通过RFC访问数据。 您对这些不同的解决 ..
发布时间:2020-10-18 03:20:59 其他开发

事实表,其中包含可在源系统中定期更新的信息

我正在建立一个维度数据仓库,并学习如何从我的仓库中的源系统中为各种业务流程建模。 我目前正在为“出价”(工作出价)作为事实表从数据系统中的源系统中获取,其中包含以下信息: 出价金额 预计收入 销售员工 出价状态(有效,待处理,已拒绝等) 等。 问题是出价(或我尝试执行的大多数其他过程)模型)可以经历各种状态,并可以在源系统中的任何给定时刻更新其信息。根据Ralph Kim ..
发布时间:2020-10-18 03:20:52 其他开发

关于BI尺寸度量的思考

我正在与一位顾问合作,他建议创建一个度量维度,然后将度量维度键添加到我们的事实表中。 我可以看到如何通过仅添加行而不是在事实表中实际创建列来使添加新度量更加容易。我还可以看到它如何为ETL流程添加工作,如何向星型架构添加另一个联接,实际上是一个通用列以容纳所有度量数据等。 我对其他人如何处理这种情况很感兴趣。目前,我们有将近二十种度量。 解决方案 本能地,我不喜欢它:它是EAV ..
发布时间:2020-10-18 03:20:48 其他开发

在Apache Hive的维度表中使用代理键或nk + effective_time是否更好

可以说,这里有一个SCD2尺寸表-位置。自然键是国家,州和城市的总和。由于它是SCD2表,因此eff日期也是键的一部分。 最好将替代键设置为usavirginarichmond20110101或使用row_number()创建实际的数字键 为什么一种方法优于另一种方法? 解决方案 (术语说明:自然键的组合称为“复合键”,而不是替代键,它仍然是“自然键”。替代键(又称合成键)是无 ..
发布时间:2020-10-18 03:20:47 其他开发

ETL操作-返回主键

我正在使用Talend填充数据仓库。我的工作是将客户数据写入维度表,将交易数据写入事实表。事实表上的代理键(p_key)是自动递增的。插入新客户时,我需要我的事实表以反映相关客户的ID。 正如我提到的,我的p_key是自动auto_incrementing,所以我不能只是为p_key插入任意值。 是否曾考虑过如何在维度表中插入一行并仍然检索要在我的事实记录中引用的主键? 更多信息 ..
发布时间:2020-10-18 03:19:44 其他开发

数据仓库教程

我的老板发现了一本新杂志,其中提到了数据仓库。因此,我正在寻找有关数据仓库的良好教程或书籍。我还将接受有关停止老板阅读的建议。 解决方案 关于数据仓库的主要作者有两个: Bill Inmon-主要撰写大型企业数据仓库 Ralph Kimball-主要撰写小型,部门数据仓库 熟悉这两个概念是个好主意。 数据仓库是一个成熟而复杂的领域,除非您有很多经验或有一个非常简单的项目 ..
发布时间:2020-10-18 03:19:41 其他开发

合并具有重复数据的表

对于一个SQL Server数据仓库,我需要匹配2个包含大致相同数据的表。 显然,它不止如此,因此重新定义任务是不是一个选择:-) 给出两个表A和B 表A: id | fid |键入 ------------------- 100 | 1 |饼干 110 | 1 |松饼 120 | 1 |松饼 表B: id | fid |输入 --- ..
发布时间:2020-10-18 03:19:40 数据库