更多“1.完成数据预处理 2.完成数据探索,构建训练集与测试集 3.合理分析并选择特征 4.构建并评估预测模型 5.补充要求(选做)”相关的问题
第1题
题目要求: 请根据本章第2.14节定义的卷积网络,用Keras框架完成其模型定义,并将该模型用于上述手写体数字的分类识别。最后绘制模型的准确率曲线图、保存模型,生成模型在测试集上的预测结果。 评分要点参考如下标准: 【1】导入库 ---- 10分 【2】读入数据集 --10分 【3】构建训练集 ----10分 【4】数据归一化 -----5分 【5】重构特征集维度 ----5分 【6】对标签做 One-Hot 编码 --- 10分 【7】划分训练集和验证集 -- 10分 【8】定义模型 --- 10分 【9】模型编译 --5分 【10】模型训练 --5分 【11】绘制准确率曲线 ----10分 【12】保存模型 --- 5分 【13】模型预测并保存预测结果到predict_result.csv ----5分 详情参见参考答案。 作业详细描述请见附件:作业描述与要求。 数据集请见附件。
点击查看答案
第2题
对银行贷款拖欠率数据进行logistics回归,数据见附件中“bankloan.csv”。将数据分成训练集和测试机,用训练集构建回归模型并进行回归诊断和自变量选择,并利用构建好的模型对测试机进行预测。 实验步骤如下: 1)打开R软件,把bankloan.csv数据导入R中(数据见附件)。 2)使用sample()把数据随机分成两个部分:一部分用于训练(80%);另一部分用于测试(20%)。 3)使用glm()函数及训练数据构建logistic回归模型。 4)使用step()函数对模型进行自变量选择。 5)使用回归诊断相关诊断对模型进行异常值检验、多重共线性检验、误差自相关性检验。 6)使用predict()函数对测试集进行预测,并把预测结果合并至测试数据集中。
点击查看答案
第3题
在R中利用iris数据集构建决策树的分类树模型,70%作为训练集,30%作为测试集,利用K折交叉验证和剪枝构建最优的决策树模型。进一步,根据合奏学习原理利用R中的randomForest包构建随机森林。对比结果并进行简要分析。需要上传程序代码。
点击查看答案
第4题
在R中利用MASS包中的Boston数据集构建决策树的回归树模型,70%作为训练集,30%作为测试集,利用K折交叉验证和剪枝构建最优的决策树模型。进一步,根据合奏学习原理利用R中的randomForest包构建随机森林。对比结果并进行简要分析。需要上传程序代码。
点击查看答案
第5题
一般地,不会把给定的整个数据集都用来训练模型,而是将其分成训练集和测试集两部分,使用训练集对模型进行训练或学习,然后把测试集输入训练好的模型并评估其表现。
点击查看答案
第6题
在R中利用MASS包中的Boston数据集构建决策树的回归树模型,70%作为训练集,30%作为测试集,利用K折交叉验证和剪枝构建最优的决策树模型。进一步,根据合奏学习原理利用R中的randomForest包构建随机森林。对比结果并进行简要分析。需要上传程序代码。
点击查看答案
第7题
基于bankpep数据集,划分训练集与测试集,建立分类模型。 1) 使用决策树建立分类模型,记录模型在测试集上的性能; 2) 自学朴素贝叶斯、支持向量集建立分类模型的方法,记录模型在测试集上的性能; 3) 使用使用梯度提升机以及XGBoost训练分累模型,并与步骤1、2的结果进行比较。 4) 本次作业需提交源代码和结果分析报告,分析报告说明使用的数据集,数据集特征项、数据量大小、尝试的每种方法、获得的结果。最后绘图比较这些方法在性能上的差别。
点击查看答案
第8题
数据集一般划分为训练集、验证集和测试集三部分,训练集用于建模,验证集(开发集)用于模型验证与矫正,测试集用于模型的最终评估。
点击查看答案
第9题
QSAR模型的外部验证环节中我们利用测试集进行评价,测试集test set从研究的化合物中挑选出合理数量和结构特征的样本组成预测集,预测集中的样本不参加模型的构建。
点击查看答案
第10题
使用5折交叉验证选择模型参数时,应将整个数据集按比例分割为训练集,验证集,测试集,再开展模型训练及测试,并将上述步骤重复5次。
点击查看答案