目录
6.要让一个机器人在各种未知的地形中行走,你会使用什么类型的机器学习算法?
13.基于模型的学习算法搜索的是什么?它们最常使用的策略是什么?它们如何做出预测?
15.如果模型在训练数据上表现很好,但是应用到新实例上的泛化结果却很糟糕,是怎么回事?能给出三种可能的解决方案吗?
1.如何定义机器学习?
答:机器学习是构建出利用数据进行学习的模型
2.机器学习在哪些问题上表现突出,你能给出四种类型吗?
答:1.机器学习适合运用在没有算法可以解决的问题上,比如分类和回归。
2.四种类型:有监督学习 、无监督学习 、半监督学习 、强化学习
3.什么是被标记的训练数据集?
答:每个训练样本都有目标值or目标类别
4.最常见的两种监督学习任务是什么?
答:分类和回归
5.你能举出四种常见的无监督学习任务吗?
答:聚类、可视化、降维和关联规则学习
6.要让一个机器人在各种未知的地形中行走,你会使用什么类型
的机器学习算法?
答:强化学习
7.要将顾客分成多个组,你会使用什么类型的算法?
答:聚类or分类
8.你会将垃圾邮件检测的问题列为监督学习还是无监督学习?
答:监督学习
9.什么是在线学习系统?
答:在线学习系统能够进行增量学习,它能够快速适应不断变化的数据和自动系统,并能够处理大量数据。
10.什么是核外学习?
答:核外算法可以处理无法容纳在计算机主内存中的大量数据。核外学习算法将数据分成小批量并使用在线学习技术从这些小批量数据中学习。
11.什么类型的学习算法依赖相似度来做出预测?
答:基于实例的学习系统努力通过死记硬背来学习训练数据。然后,当给定一个新的实例时,它将使用相似性度量来查找最相似的实例,并利用它们来进行预测。
12.模型参数与学习算法的超参数之间有什么区别?
答:一个模型具有一个或多个模型参数,这些参数确定在给定一个新实例的情况下该模型将预测什么(例如,线性模型的斜率)。一种学习算法试图找到这些参数的最优值,以使该模型能很好地泛化到新实例。超参数是学习算法本身的参数,而不是模型的参数(例如,要应用正则化的数量)。
13.基于模型的学习算法搜索的是什么?它们最常使用的策略是什
么?它们如何做出预测?
答:1.基于模型的学习算法搜索模型参数的最优值,以便模型可以很好地泛化到新实例。
2.我们通常通过最小化成本函数来训练这样的系统,该函数测量系统对训练数据进行预测时有多不准确,如果对模型进行了正则化则对模型复杂性要加上惩罚。
3.为了进行预测,我们使用学习算法找到的模型参数值,再将新实例的特征输入到模型的预测函数中。
14.你能给出机器学习中的四个主要挑战吗?
答:数据的缺乏、数据质量差、数据的代表性不足、信息量不足、模型过于简单而欠拟合训练数据以及模型过于复杂而过拟合数据。
15.如果模型在训练数据上表现很好,但是应用到新实例上的泛化
结果却很糟糕,是怎么回事?能给出三种可能的解决方案吗?
答:1.过拟合
2.正则化、简化模型、增加样本量、减少训练样本的噪声
16.什么是测试集,为什么要使用测试集?
答:1.测试集是用来预估模型实际效果的
2.为了避免过拟合,通过观察模型在训练集和测试集上的效果可以得知是否过拟合
17.验证集的目的是什么?
答:验证集是用于比较模型。这样就可以选择最佳模型并调整超参数。
18.如果你用测试集来调超参数会出现什么错误?
答:最后你得到的模型可能是偏向测试集的,你也无法得知是否过拟合