数据未排序时,根据列值汇总数据范围 [英] Summarize data range based on column value when data is not sorted

查看:12
本文介绍了数据未排序时,根据列值汇总数据范围的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我正在尝试为他们活跃的时期创建客户之旅。基本数据是无序的,如下所示:

我希望首先查找Status=ACTIVE时的日期,然后查找Status=INACTIVE时的后续日期,并在时段中查找,然后对外观的下一个实例重复此操作。我正在寻找的输出是创建一个如下所示的表:

任何有关如何在Teradata SQL中执行操作的指导都将非常有帮助。

推荐答案

这里是SQL(dbfiddle link):

WITH active_status
     AS (SELECT customerid,
                Row_number()
                  OVER (
                    partition BY customerid
                    ORDER BY start_date) id,
                start_date
         FROM   (SELECT customerid,
                        CASE
                          WHEN status = 'Active' THEN dt
                        END "start_date"
                 FROM   cust) x
         WHERE  start_date IS NOT NULL),
     inactive_status
     AS (SELECT customerid,
                Row_number()
                  OVER (
                    partition BY customerid
                    ORDER BY end_date) id,
                end_date
         FROM   (SELECT customerid,
                        CASE
                          WHEN status = 'Inactive' THEN dt
                        END "end_date"
                 FROM   cust) x
         WHERE  end_date IS NOT NULL)
SELECT acta.customerid,
       acta.start_date,
       COALESCE(inacta.end_date, '2099-12-31') end_date
FROM   active_status acta
       LEFT OUTER JOIN inactive_status inacta
                    ON acta.customerid = inacta.customerid
                       AND acta.id = inacta.id
ORDER  BY start_date; 

由于Teradata SQL方言类似于PostgreSQL,我在dbfiddle link中使用了它。DBfiddle不支持用于测试的Teradata。 Teradata中仅有的重要部分是row_number()分析函数和coalesce()。

这篇关于数据未排序时,根据列值汇总数据范围的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆