随着 Spark >= 3.3(在 3.4 中更加成熟)中引入的存储分区连接(Storage Partition Join,SPJ)优化技术,您可以在不触发 Shuffle的情况下对分区的数据源 V2 表执行连接操作(当然,需要满足一些条件)。
关注时代Java