更多“同一个数据集上,通常使用随机森林的方法训练分类模型需要的时间比C4.5决策树更长。”相关的问题
第1题
为进行分类模型的训练和性能评价,需要将输入的标注数据划分为()。
点击查看答案
第3题
()采用自顶向下分而治之的思想,将训练集不断分割成子数据集来不断扩展树枝,当满足一定条件时停止树的生长。
点击查看答案
第4题
k 近邻方法不需要事先学习分类模型,当需要预测的时候,根据预测样本的特性和已知训练数据集中的数据进行类别的判断。
点击查看答案
第5题
在机器学习中,如果数据较少,同时采用的模型较复杂,得到的模型在给定的训练集上误差非常小,接近于0,但是在训练集之外的数据上预测效果很差,这种现象称为()。
点击查看答案
第6题
在机器学习中,如果数据较少,同时采用的模型较复杂,得到的模型在给定的训练集上误差非常小,接近于0,但是在训练集之外的数据上预测效果很差,这种现象称为()。
A.欠拟合(under-fitting)
B.过拟合(over-fitting)
C.损失函数(loss function)
D.经验风险(empirical risk)
点击查看答案
第7题
作为分类器的性能评价方法,K折交叉验证把数据集划分为K份,其中K-1份作为训练集,1份作为测试集,全部轮流使用,总计循环()次来评估算法的性能。
点击查看答案
第8题
机器学习系统中通常将数据集划分为训练集和测试集,其中被用来学习得到模型中参数值的是()。
A.训练集
B.测试集
C.训练集和测试集
D.以上答案都不对
点击查看答案
第9题
下列说法正确的是
A.过拟合是由于训练集多,模型过于简单
B.过拟合是由于训练集少,模型过于复杂
C.欠拟合是由于训练集多,模型过于简单
D.欠拟合是由于训练集少,模型过于简单
点击查看答案