SAP HANA - SQL数据分析

SQL数据分析任务用于理解和分析来自多个数据源的数据.它用于删除不正确,不完整的数据并防止数据质量问题在加载到数据仓库之前.

以下是SQL数据分析任务的好处 :

  • 有助于更有效地分析源数据.

  • 它有助于更好地理解源数据.

  • 在将数据加载到数据仓库之前,它会删除不正确,不完整的数据并提高数据质量.

  • 它与提取,转换和加载任务一起使用.

数据概要分析任务检查概要文件这有助于理解数据源并识别必须修复的数据中的问题.

您可以使用Integration Services包中的Data Profiling任务来分析存储在SQL中的数据服务器并识别数据质量的潜在问题.

注意 : 数据事件探查任务仅适用于SQL Server数据源,不支持任何其他基于文件或第三方的数据源.

访问要求

运行包中包含数据概要分析任务,用户帐户必须具有对tempdb数据库具有CREATE TABLE权限的读/写权限.

Data Profiler Viewer

数据Profile Viewer用于查看分析器输出.数据配置文件查看器还支持向下钻取功能,以帮助您了解配置文件输出中标识的数据质量问题.此向下钻取功能将实时查询发送到原始数据源.

数据概要分析任务设置和查看

设置数据概要分析任务

它涉及执行包含数据概要分析任务的包以计算概要文件.该任务将XML格式的输出保存到文件或包变量.

查看配置文件

要查看数据配置文件,请发送输出到文件然后使用数据配置文件查看器.此查看器是一个独立的实用程序,它以摘要和详细信息格式显示配置文件输出,并具有可选的向下钻取功能.

数据分析;配置选项

数据概要分析任务具有以下方便的配置选项 :

通配符列

配置时在配置文件请求中,该任务接受'*'通配符代替列名称.这简化了配置,并且更容易发现不熟悉数据的特征.当任务运行时,任务会为每个具有适当数据类型的列配置文件.

快速配置文件

您可以选择快速配置文件来配置任务很快.快速配置文件使用所有默认配置文件和设置对表或视图进行配置.

数据配置任务可以计算八种不同的数据配置文件.其中五个配置文件可以检查单个列和剩余的三个分析 - 多列或列之间的关系.

数据分析;任务输出

数据概要分析任务将所选概要文件输出为XML格式,其结构类似于DataProfile.xsd模式.

您可以保存本地副本架构并在Microsoft Visual Studio或其他架构编辑器中,在XML编辑器或文本编辑器(如记事本)中查看架构的本地副本.