一、功能简介
GBase 8a新增支持创建hudi Catalog,支持通过Catalog 实现 hudi表的读写功能,实现 GBase 8a 直接读取hudi表数据以及直接写入数据到hudi表。GBase 8a 新增支持Hudi 外部表功能,支持创建、查看、删除、查询Hudi 外部表,可以导入Hudi 外部表数据到8a的内部表,也支持向Hudi外部表写入数据。
二、简单应用
(1)往hudi插入数据
1.hudi写入数据
docker exec -it adhoc-1 bash
spark-shell -jars SHUDI_UTILITIES_BUNDLE --conf “spark.serilizer=org.apache.spark.serializer.KryoSerializer”
import org.apache.hudi.DataSourceWriteOptions
import org.apache.hudi.config.HoodieWriteConfig
import org.apache.hudi.common.model.HoodiTableType import org.apache.spark.sql. {SparkSession, Row}
import java.sql. Date
import java.sql. Timestamp
import org.apache.spark.sql.types. {StructType, StructField, IntegerType, StringType, DoubleType, DateType, TimestampType, DecimalType, ByteType, ShortType, LongType, FloatType, Booleant ype}
val data = Seq(
Row (“time”, java.sql. Date.valueof (“2022-10-10”)) .
Row (“tia fli”, java.sql.Date.valueOf (“9999-12-31”)) ,
Row ("ti1i ",j
06-09
2186

02-14
9537

12-20
2254

07-06
1万+

07-11
1342

06-15
4824
