Flink之DataSet 的Join、Cross使用

最新推荐文章于 2024-04-26 17:07:49 发布

11号车厢

最新推荐文章于 2024-04-26 17:07:49 发布

阅读量1.4k

点赞数

CC 4.0 BY-SA版权

分类专栏： Flink 文章标签： Flink

本文链接：https://blog.csdn.net/greenplum_xiaofan/article/details/99547128

本文探讨了Flink中的DataSet API如何进行Join和Cross操作。详细解释了内连接（默认）、左连接、右连接及全连接的用法，并举例说明了笛卡尔积的实现，展示了输出结果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Join 默认就是内连接，还有leftOuterJoin，rightOuterJoin，fullOuterJoin
cross 笛卡尔积

package com.ruozedata.flink

import org.apache.flink.api.scala.ExecutionEnvironment
import org.apache.flink.api.scala._
import scala.collection.mutable.ListBuffer

object FlinkJoinApp {
   
   
  def main(args: Array[String]): Unit = {
   
   

    val env=ExecutionEnvironment.getExecutionEnvironment

    val data1=ListBuffer[(Int,String)]()
    data1.append((1,"ruoze"))
    data1.append((2,"jepson"))
    data1.append((3,"xingxing"))

    val data2=ListBuffer[(Int,String)]()
    data2.append((1,"beijing"))
    data2.append((2,"shanghai"))
    data2.append((4,"hangzhou"))

    val a