最近秋招结束了。从去年8月底开始,参加了datacastle、阿里天池、牛科举办的数据挖掘比赛。com(全部前10)。今年4月份去百度和腾讯实习。现在,秋招就要结束了,已经快一年了。最后,更重要的报价主要是腾讯和百度。华为三家企业的报价都是sp。以下是一年来一些经验的简要总结,不一定是最合适的方法,但是在没有头绪的时候,可以参考一下。(2016)
(一) 简介1.首先介绍一下企业对这个岗位的一些能力要求,直接在这个方向贴bat的相应岗位jd:
工程能力=C/Java/Python编程+分布式计算和数据处理
1)几种模型(svm、lr、gbdt、em)的原理和公式推导;
2)RF和gbdt的区别;gbdt和xgboost的区别(烂街的问题最好从底层原理来分析回答);
3)决策树处理连续值的方法;
4)特征选择方法;
5)过拟合的解决方案;
KMeans的原理、优缺点及其改进;
7)常用分类模型(svm、决策树、贝叶斯等)的优缺点。),适用场景以及如何选择;
8)SVM为什么要引入拉格朗日优化方法;
9)假设面试官什么都不懂,详细解释CNN的原理;
10)计算海量项目文本相似度的优化方法;
11)梯度下降的优缺点;
12)em和kmeans之间的关系;
13)L1与L2的区别以及如何解决L1的衍生难题;
14)如何在保证模型性能的同时,用尽可能少的样本训练模型;
15)说明word2vec的原理和哈夫曼树的改进;
16)对推荐算法未来的看法;
17)如何评价模型训练迭代中的效果;
18)有几个G文本,每行记录访问ip的日志。如何快速统计出IP数最高的前10个IP;只使用linux指令怎么办?
19)绳子烧坏需要1小时。假设所有绳子的材质都不一样,不均匀,如何取出1小时15分钟;
20)假设有一个M*N的正方形,从左下角开始到右上角,一次只能向右或向上走,问走多少条路,假设中间有几个不能走的正方形,走多少条路;
21)实现hmm的状态转移码;
22)最短路径码;
23)拼车软件如何定价和优化;
24) 100张牌,一次只能抽一张,抽的牌会丢失,如何选择最大的牌;
25)如何预测降雨量;
26) kmeans代码;
27) mr方案求解矩阵乘法的代码;
28)SQL语句的一些优化技巧;
29)掌握了多少关于集群调度技巧的经验;
30)设计一个可以实时统计过去一个小时内任何一个ip的访问量的系统;
31)设计LRU系统
PS:以上面试问题仅供参考,主要是提供一个方向,大致了解一下这个岗位的面试考核方向,更具体的刷脸经典。
结束。
微信公众号大数据人才家园
PPV级大数据——专注于大数据培训,中国领先的大数据学习社区
1.《数据挖掘工程师培训 学习攻略 | 数据挖掘工程师学习路线图》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《数据挖掘工程师培训 学习攻略 | 数据挖掘工程师学习路线图》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/shehui/751931.html