绿盟科技安全服务面试题 (绿盟科技校招面试题)

绿盟科技--武汉

绿盟科技python面试题,绿盟科技实习开发工程师面试题

学长1

(1)Flink的job提交流程?

(2)Flink中的watermark除了处理乱序数据还有其他作用吗?

(3)Spark中stage和task的划分?RDD的join操作会导致stage的划分吗?为什么?

(4)Sparkstreaming中用到redis去重,创建的链接是长链接还是短链接?长连接和短链接的区别?

(5)3个线程如何实现按顺序执行?

(6)Spark中的算子的分区数怎么得来?比如说上游和下游算子的分区数如何确定?

学长2

(1)netstat tunlp | grep出来的有什么两种状态(啥我也没听清楚)分别有什么不同

(2)LaunchExecutor可以封装几个executor的资源(主要是问可以封装一个还是多个),LaunchExecutor可以替代applicationMaster吗

(3)flink把streamgraph转化成jobGraph是在哪个阶段

(4)定义三个线程A,B,C,如何让他们按照A,B,C中的顺序执行(我答的是可重置锁,synchronized关键字和线程间的通信方法,感觉他不是很满意)

(5)可重置锁和synchronized关键字的区别(主要卡在两者在jvm层次的区别上了)

(6)数据表为啥要用按日分区

(7)说一说hive中一条sql语句的执行流程(我答的是calcite的架构)

(8)说一说SparkSql的原理,它是如何触发job的

(9)sparkstreaming和flink在执行任务上有啥区别,不是简单的流处理和微批,sparkstreaming提交任务是分解成stage,flink是转换graph,有啥区别

学长3

1)一面

1、经验介绍

2、es有没有测过性能 你们es和hive的使用场景是怎样的 全文检索如何保证 分词呢

3、hbase和hive的使用场景有什么差异

4、你们的集群规模有多大 是内部使用吗 关于数据分析你接触过什么算法吗

5、你们flink做什么

6、hive数据倾斜怎么处理

7、数据处理流程是怎样的 离线的以及实时

8、flume优化指的是哪些

9、有没有接触过logstash

10、presto和druid

11、hdfs有多少节点 负载测试过吗

12、java分布式框架有没有接触过

13、脚本语言有接触过

14、python工作需要学可以学吗

15、azkaban介绍一下

16、sqoop是在做什么

17、介绍了一下分层

18、你对于网络安全有什么了解

19、问问题

2)二面

1、介绍经历

2、你用什么语言开发 解决什么问题

3、你在北京吗 准备回西安?

4、你的团队和你做同样的有几人 研发团队有多少

5、你有做过相关安全之类的工作吗

6、介绍他们薪资 工资、股票、期权 奖金(2-4) 200话补 每日15餐补 不加班 加班会有补助 你期望薪资多少?

7、离职了吗

8、你还有问题吗