GENERATE函数也可以生成笛卡尔积组合,但与CROSSJOIN函数不同的是,GENERATE函数可以根据不同行来与不同的表产生笛卡尔积。
语法和作用
语法:GENERATE ( Table1, Table2 )
作用:对Table1的每一行计算出该行所对应的Table2,然后返回Table1的每一行与其对应的Table2的笛卡尔积。其中,Table1和Table2都需要是返回表的表达式,其中Table1在外部计值环境中计算,Table2则在外部计值环境和Table1的每一行的行上下文中计算。
注意:若针对Table1的某一行所计算出的Table2是空表,那么该行在最终结果中会被移除。另外与CROSSJOIN函数一致,Table1与Table2中不能出现相同列,否则会报错。
辅助理解的例子
1、如果Table2的计算不依赖于Table1的行上下文,即对于Table1的所有行来说Table2都一致,那么此时的GENERATE函数等价于CROSSJOIN函数。如下图所示:
2、由于GENERATE函数可以根据不同行来与不同的表产生笛卡尔积,因此可以用于 “计算各个产品类别下销售额排名前三的产品” 这样的场景。如下图所示:
3、对于GENERATE函数,若针对Table1的某一行所计算出的Table2是空表,那么该行在最终结果中会被移除。如下图所示:
如果想要显示Table2为空的那些行,那么可以使用GENERATEALL函数,如下图所示:
GENERATEALL函数与GENERATE函数的行为和计值流程等均完全一致,唯一区别就是GENERATEALL函数会返回Table2为空的那些行,而GENERATE函数则不会。
4、可以使用GENERATE函数提高添加多列时的代码复用性,从而提高计算效率,如下图所示:
在ADDCOLUMNS函数中,各个派生列之间无法互相引用,因此无法复用之前计算好的对象,而在GENERATE函数中则可以借助VAR变量和ROW函数来实现这一点。
总结
GENERATE函数可以按行来生成不同的笛卡尔积组合,其灵活性和实用性都更高,可以应用于许多场景中,建议掌握。