阿里，网易云音乐以及商汤科技的大数据面试经

哲洛别闹

于 2018-05-26 17:13:48 发布

阅读量175

点赞数

本文涵盖Java核心技术知识点，包括内存模型、GC回收算法、类加载机制等，并深入解析大数据技术，如MapReduce过程、Spark运行机制、HDFS读取流程及HBase的工作原理。此外还介绍了常用的数据结构与算法问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

项目方面：项目闪光点、优化点、涉及到的关键技术这些基本都会问，事先最好准备一下、如果有开源项目经验就更好。

语言方面：

至少精通一门语言Java或C/C++等（以Java为例），java内存模型、gc回收算法、各种gc回收器的使用场景；

类加载机制以及涉及到的一系列问题;volatile特性、主内存与工作内存交互、happen before原则、内存栅栏；

类加载过程（class文件到jvm这个过程）；

callable runnable 区别；

synchronized与lock区别；

进程线程区别；

hashMap和treeMap的区别，以及实现；

concurrenthashmap怎么实习同步？各个版本的实现方案？

PS：最好再掌握一门脚本语言。如Python或者Scala等。

大数据方面：

MapReduce过程；

spark排序实现流程，reduce端怎么实现的；

HashPartitioner与RangePartitioner的实现，以及水塘抽样；

spark有哪几种join，使用场景，以及实现原理；

dagschedule、taskschedule、schedulebankend实现原理；（网易云音乐）

宽依赖、窄依赖；（网易云音乐）

画一个yarn架构图，及其通信流程；

hdfs数据读取流程，实现原理；

HBase和传统数据库的区别；

HBase读数据过程；

HBase Master和Regionserver的交互；

HBase的HA，Zookeeper在其中的作用；

Master宕机的时候，哪些能正常工作，读写数据；

region分裂；

Spark数据倾斜，怎么定位、怎么解决（阿里）；

Mysql的索引类型及其实现原理；同时哪些存储引擎支持B树索引，哪些支持Hash索引；为什么mysql索引要用B+树而MongoDB用B树？如何优化；主键和唯一索引的区别；事务的隔离机制，mysql默认是哪一级；；实现二次排序;用MapReduce实现两表join;用MapReduce实现一个存储kv数据的文件，对里面的v进行全量排序;

spark运行架构:

算法数据结构方面：

图怎么存的、有哪些图算法;红黑树怎么实现、如果树里面有两个值相等的节点，怎么识别？

问题：一排正整数，每次只能去两头的数，甲乙两个人轮流取，如果甲先取，问最后谁取得数相加和最大，最大和为多少？典型博弈论问题（可以看看海盗分金问题），大致两个动态规划方程。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。