你应该是一阵风丫

2020-09-17   阅读量: 934

机器学习 大数据

机器学习求职60问

扫码加入数据分析学习群

类型一:基础概念类
问题1:过拟合与欠拟合(定义、产生的原因、解决的方法各是什么)。
问题2:L1正则与L2正则(有哪些常见的正则化方法?作用各是什么?区别是什么?为什么加正则化项能防止模型过拟合)。
问题3:模型方差和偏差(能解释一下机器学习中的方差和偏差吗?哪些模型是降低模型方差的?哪些模型是降低模型偏差的?举例说明一下)。
问题4:奥卡姆剃刀(说一说机器学习中的奥卡姆梯刀原理)。
问题5:模型评估指标(回归模型和分类模型各有哪些常见的评估指标?各自的含义是什么?解释一下AUC?你在平时的实践过程中用到过哪些评估指标?为什么要选择这些指标)。
问题6:风险函数(说一下经验风险和结构风险的含义和异同点)。
问题7:优化算法(机器学习中常见的优化算法有哪些?梯度下降法和牛顿法的原理推导)。
问题8:激活函数(神经网络模型中常用的激活函数有哪些?说一下各自的特点)。
问题9:核函数(核函数的定义和作用是什么?常用的核函数有哪些?你用过哪些核函数?说一下高斯核函数中的参数作用)。
问题10:梯度消失与梯度爆炸(解释一下梯度消失与梯度爆炸问题,各自有什么解决方案)。
问题11:有监督学习和无监督学习(说一下有监督学习和无监督学习的特点,举例说明一下)。
问题12:生成模型与判别模型(你知道生成模型和判别模型吗?各自的特点是什么?哪些模型是生成模型,哪些模型是判别模型)。
类型二:模型原理类
问题13:线性回归(线性回归模型的原理、损失函数、正则化项)。
问题14:KNN模型(KNN模型的原理、三要素、优化方案以及模型的优/缺点)。
问题15:朴素贝叶斯(朴素贝叶斯模型的原理推导,拉普拉斯平滑,后验概率最大化的含义以及模型的优/缺点)。

问题16:决策树(决策树模型的原理、特征评价指标、剪枝过程和原理、几种常见的决策树模型、各自的优/缺点)。
问题17:随机森林模型(RF模型的基本原理,RF模型的两个“随机”。从偏差和方差角度说一下RF模型的优/缺点,以及RF模型和梯度提升树模型的区别)。
问题18:AdaBoost(AdaBoost 模型的原理推导、从偏差和方差角度说一下AdaBoost、AdaBoost模型的优/缺点)。

问题19:梯度提升树模型(GBDT模型的原理推导、使用GBDT模型进行特征组合的过程、GBDT模型的优/缺点)。
问题20:XGBoost(XGBoost模型的基本原理、XGBoost模型和GBDT模型的异同点、XGBoost模型的优/缺点)。
问题21:Logistic回归模型(LR模型的原理、本质,LR模型的损失函数,能否使用均方损失、为什么)。
问题22:支持向量机模型(SVM模型的原理,什么是“支持向量”?为什么使用拉格朗日对偶性?说一下KKT条件、软间隔SVM和硬间隔SVM的异同点。SVM怎样实现非线性分类?SVM常用的核函数有哪些?SVM模型的优/缺点各是什么)。
问题23:K-Means聚类(K-Means聚类的过程和原理是什么?优化方案有哪些?各自优/缺点是什么)。
问题24:层次聚类(层次聚类的过程、原理和优/缺点)。
问题25:密度聚类(密度聚类的基本原理和优/缺点)。
问题26:谱聚类(谱聚类的基本原理和优/缺点)。
问题27:高斯混合聚类(高斯混合聚类的原理和优/缺点)。
问题28:EM算法(EM算法的推导过程和应用场景)。
问题29:特征分解与奇异值分解(特征分解与奇异值分解的原理、异同点、应用场景)。
问题30:主成分分析(PCA模型的原理、过程、应用场景)。
问题31:线性判别分析(LDA模型的原理、过程、应用场景)。
问题32:局部线性嵌入(LLE模型的原理、过程、应用场景)。
问题33:词向量(Word2Vec模型和Doc2Vec模型的类别,各自原理推导、应用和参数调节)。
问题34:深度神经网络(深度神经网络模型的原理,反向传播的推导过程,常用的激活函数,梯度消失与梯度爆炸问题怎么解决?说一下深度神经网络中的Dropout、早停、正则化)。
类型三:模型比较类
问题35:LR模型与SVM模型的异同点。
问题36:LR模型与朴素贝叶斯模型的异同点。
问题37:K近邻模型与K-Means模型的异同点。
问题38:ID3决策树、C4.5决策树、CART决策树的异同点。
问题39:PCA模型与LDA模型的异同点。

问题40:Bagging模型与Boosting模型的异同点。
问题41:GBDT模型与XGBoost模型的异同点。
问题42:Word2Vec模型中CWOB模式与Skip模式的异同点。
问题43:Word2Vec模型和Doc2Vec模型的异同点。
类型四:模型技巧类
问题44:模型调参(随便选一个上述涉及的模型,说一下它的调参方式与过程)。
问题45:特征组合(常见的特征组合方式有哪些?各自特点是什么)。
问题46:特征工程(结合实践解释一下你所理解的特征工程)。
问题47:缺失值问题(说一下你遇到的缺失值处理问题,你知道哪些缺失值处理方式?你使用过哪些,效果怎样)。
问题48:样本不平衡问题(你知道样本不平衡问题吗?你是怎样处理的?效果怎么样?除上采样和下采样外,你还能自己设计什么比较新颖的方式吗)。
问题49:特征筛选(特征筛选有哪几种常见的方式?结合自己的实践经验说一下各自的原理和特点。)
问题50:模型选择(你一般怎样挑选合适的模型?有实际的例子吗?)
问题51:模型组合(你知道哪些模型组合方式?除了运用AdaBoost和RF,你自己有使用过Bagging和Embedding方式组合模型吗?结合实际例子说明一下)。

问题52:A/B测试(了解A/B测试吗?为什么要使用A/B测试)。
问题53:降维(为什么要使用降维?你知道哪些降维方法?你用过哪些降维方式?结合实际使用说明一下)。
问题54:项目(你做过哪些相关的项目?挑一个你觉得印象最深刻的说明一下)。
问题55:踩过的坑(你在使用机器学习模型中踩过哪些坑?最后你是如何解决的)。
类型五:求职技巧类
问题56:机器学习求职要准备哪些项?各项对应如何准备?
问题57:机器学习相关的学习内容有哪些?学习路线应该怎么定?有什么推荐的学习资料?
问题58:机器学习岗位求职的投递方式有哪些?什么时间投递最合适?投递目标应该怎样选择?
问题59:机器学习岗位求职的简历最好写哪些内容?所做的项目应该如何描述?
问题60:面试过程中自我介绍如何说比较合适?求职心态应该如何摆正?如果遇到压力该如何面对?面试过程中如何掌握主导权?怎样回答面试官最后的“你还有什么要问我的”问题?怎样面对最后的人力资源面试?


添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
35.9124 1 0 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子