mysql通过字符串计算hashcode更新到原表和多表关联优化
一. 需求描述
现有表a,要求通过每条数据中的三个字段计算hashcode值更新到原表做为shopid.
二. 第一种做法
最好的方式是通过spark sql计算出来更新,但是spark sql不能update,要想update要设计到改源码。
所以就退而求其次选择用JDBC更新,缺点是慢。
把主要代码贴一下:
result.foreachPartition(
it => {
var url = "jdbc:mysql://localhost/test?characterEncoding=utf8"
val conn = DriverManager.getConnection(url, "root", "1234")
val pstat = conn.prepareStatement("update t_test set shop_id=? where id=?")
for (obj <- it) {
pstat.setString(1, obj._2)
pstat.setInt(2, obj._1)
pstat.addBatch
}
try {
pstat.executeBatch
} finally {
pstat.close
conn.close
}
}
)
三.第二种方法是用到spark和MySQL结合。这种虽然看着麻烦