阿里,网易 云音乐以及商汤科技的大数据面试经

本文涵盖Java核心技术知识点,包括内存模型、GC回收算法、类加载机制等,并深入解析大数据技术,如MapReduce过程、Spark运行机制、HDFS读取流程及HBase的工作原理。此外还介绍了常用的数据结构与算法问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

项目方面:项目闪光点、优化点、涉及到的关键技术这些基本都会问,事先最好准备一下、如果有开源项目经验就更好。

语言方面:

至少精通一门语言Java或C/C++等(以Java为例),java内存模型、gc回收算法、各种gc回收器的使用场景;

类加载机制以及涉及到的一系列问题;volatile特性、主内存与工作内存交互、happen before原则、内存栅栏;

类加载过程(class文件到jvm这个过程);

callable runnable 区别;

synchronized与lock区别;

进程线程区别;

hashMap和treeMap的区别,以及实现;

concurrenthashmap怎么实习同步?各个版本的实现方案?

PS:最好再掌握一门脚本语言。如Python或者Scala等。

大数据方面:

MapReduce过程;

spark排序实现流程,reduce端怎么实现的;

HashPartitioner与RangePartitioner的实现,以及水塘抽样;

spark有哪几种join,使用场景,以及实现原理;

dagschedule、taskschedule、schedulebankend实现原理;(网易 云音乐 )

宽依赖、窄依赖;(网易 云音乐 )

画一个yarn架构图,及其通信流程;

hdfs数据读取流程,实现原理;

HBase和传统数据库的区别;

HBase读数据过程;

HBase Master和Regionserver的交互;

HBase的HA,Zookeeper在其中的作用;

Master宕机的时候,哪些能正常工作,读写数据;

region分裂;

Spark数据倾斜,怎么定位、怎么解决(阿里);

Mysql的索引类型及其实现原理;同时哪些存储引擎支持B树索引,哪些支持Hash索引;为什么mysql索引要用B+树而MongoDB用B树?如何优化;主键和唯一索引的区别;事务的隔离机制,mysql默认是哪一级;;实现二次排序;用MapReduce实现两表join;用MapReduce实现一个存储kv数据的文件,对里面的v进行全量排序;

spark运行架构:

算法数据结构方面:

图怎么存的、有哪些图算法;红黑树怎么实现、如果树里面有两个值相等的节点,怎么识别?

问题:一排正整数,每次只能去两头的数,甲乙两个人轮流取,如果甲先取,问最后谁取得数相加和最大,最大和为多少?典型博弈论问题(可以看看海盗分金问题),大致两个动态规划方程。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值