-
讲述唯品会实习有代表性的项目,说了storm实时计算
-
storm的拓扑结构,集群架构,分组策略及特点
-
统计虎牙各个直播间每五分钟的网页访问流量:
- 各个url的时间窗口计数
- 高并发,数据流大,不存redis直接内存计算
- 使用离线修复做容灾
-
stom的可靠性怎么实现的
-
手写冒泡排序
-
一个大文件存放一系列url和该url的访问次数(同一url会多次出现){key:‘www.github.com’, value:2},内存不能容纳全部数据,累加求和求出访问量最大的10个url
-
tomcat架构
-
Filter的实现原理
-
JDBC用过吗(说用过一两次,没继续问下去)
-
写出一个生产者消费者模型
-
写网络爬虫一般的分析过程和反爬应对策略,顺便说了写爬虫时遇到的一个奇葩反爬
-
websocket原理,项目里怎么使用的
-
怎么爬弹幕(这个没接触过,直接说不会,面试官就教我怎么爬)
-
synchronize实现原理
-
问我在哪学到这些的,看过哪些书
-
java.util包下的类结构,HashMap原理,HashSet原理
-
Redis和MySQL原理的了解程度(扯到了Redis底层数据结构,InnoDB索引原理)
-
一个情景题,考点是联合索引的什么情况下会用到索引,什么时候不会(奸诈地给我设坑,还好看过哈哈)
-
web,大数据和爬虫三个方向,更想做哪个。讲了一下他们大数据部门主要的工作和技术栈
-
一个Web请求经过哪些流程
-
实习参与的爬虫项目
-
写网络爬虫一般的分析过程和反爬应对策略
-
IP代理池怎么实现
-
怎么识别一张图片。
-
图片降噪是怎么实现的(直接说没研究过)
-
有什么职业规划
这个面试官贼好玩,带我去找地方面试的路上闲聊了很多,涉及到情感,两性,大学,青少年,潮汕人。。。
-
问了一个自己完整实现的WEB项目
-
用websocket的哪个协议
-
服务有多种,客户端访问,怎么确定它需要的服务 (不太理解问的什么,随便答了几个)
- DNS域名解析
- 一个节点维护一个注册了服务名和服务主机ip的map,做服务映射并转发
-
实习参与的实时计算项目
-
storm计算中如何保障消息的有序性,顺便扯了遇到的消息乱序的问题
-
spark跟storm的区别,hadoop的原理(概念层面回答了一下)
接下来就是了解一些个人情况和Q&A
-
对之前面试的评价
-
觉得面试官水平怎么样
-
为什么要来虎牙
-
讲了一下薪资待遇和转正时间,再问我到岗时间
-
Q&A
-
面试大都是围绕简历中的内容提问,简历应当多提到自己使用的技术和代表性实现(要有亮点)
-
面试官有些问题会比较泛或者浅,这时候不要简单回答,要把问题延伸到自己有去研究过的方面,例如问我util包下的类结构,我再扯到hashmap,引导他问我hashmap原理,然后再顺便扯了一下hashmap的两个版本区别和hashset就是基于hashmap实现。
-
先准备一两个代表性bug,提问项目的时候,顺便扯一下解决过程。体现出项目真实性和自己是真的参与项目而不是打酱油
-
场景题:就算是看过的题也要故作沉思一番再回答
-
知之为知之,不知为不知。大致了解但不清楚的话在回答前要先说好,例如:我不太了解这方面,但我可以说一下我的思路,可能不太对。