腾云悦智
- namenode ha如何切换?zkfc
- hadoop集群100台变50台,纠删码原理?
- hadoop怎么迁移?
- edit文件存放位置,和namenode一起?name node ha模式怎么同步edit?
- 2nn除了秘书作用还有啥作用?恢复nn数据
- hbase region分裂原理,不是问到哪个数据量分裂?
- region server 挂了两台会怎么样?
- spark内存模型?spark提交流程
- java -jar运行任务,如果任务很慢怎么排查
- flink interval 原理,如果数据量大,里面的map不就是数据量会很大吗?怎么处理
- hive迁移?
腾讯
- 各种场景模拟,1亿数据,20亿用户,大表处理
- 如何确定某个java程序将CPU跑满之后导致该原因的线程?
- Phoenix 和HBase是如何关联的?一个SQL是怎么同步写入到HBase的?
- 一年的窗口怎么每5分钟输出一次结果。(RK状态+CK时间点+定时器)
- flink 和 spark Streaming对比?
- flink的时间语义,精准一次性这些
- HBase的二级索引?大表的处理?
- spark SQL 和hive on spark有什么区别?
- flink的精准一次?幂等和事务使用有什么问题?ck连续超时有什么影响?
- hbase如果问怎么快速检索1亿数据?布隆过滤器已经开辟了最大长度,不能在开辟了怎么处理?
- spark 场景题和对应的优化处理?
- flink 事务 sink写文件,是怎么处理的?对应的文件存在哪里?详细说下
- 一个flink任务一直在重启?怎么判断原因?
- CBO和RBO的区别?说说常见的RBO的规则?
- flink的反压你们是怎么处理的?怎么判定的?
- flink SQL的整个底层执行过程