1.完成数据预处理 2.完成数据探索，构建训练集与测试集 3.合理分析并选择特征 4.构建并评估预测模型 5.补充要求（选做)

答案

更多“1.完成数据预处理 2.完成数据探索，构建训练集与测试集 3.合理分析并选择特征 4.构建并评估预测模型 5.补充要求（选做)”相关的问题

第1题

题目要求：请根据本章第2.14节定义的卷积网络，用Keras框架完成其模型定义，并将该模型用于上述手写体数字的分类识别。最后绘制模型的准确率曲线图、保存模型，生成模型在测试集上的预测结果。评分要点参考如下标准：【1】导入库 ---- 10分【2】读入数据集 --10分【3】构建训练集 ----10分【4】数据归一化 -----5分【5】重构特征集维度 ----5分【6】对标签做 One-Hot 编码 --- 10分【7】划分训练集和验证集 -- 10分【8】定义模型 --- 10分【9】模型编译 --5分【10】模型训练 --5分【11】绘制准确率曲线 ----10分【12】保存模型 --- 5分【13】模型预测并保存预测结果到predict_result.csv ----5分详情参见参考答案。作业详细描述请见附件：作业描述与要求。数据集请见附件。

点击查看答案

第2题

对银行贷款拖欠率数据进行logistics回归，数据见附件中“bankloan.csv”。将数据分成训练集和测试机，用训练集构建回归模型并进行回归诊断和自变量选择，并利用构建好的模型对测试机进行预测。实验步骤如下： 1）打开R软件，把bankloan.csv数据导入R中（数据见附件）。 2）使用sample（)把数据随机分成两个部分：一部分用于训练（80%）；另一部分用于测试（20%）。 3）使用glm（)函数及训练数据构建logistic回归模型。 4）使用step（)函数对模型进行自变量选择。 5）使用回归诊断相关诊断对模型进行异常值检验、多重共线性检验、误差自相关性检验。 6）使用predict（)函数对测试集进行预测，并把预测结果合并至测试数据集中。

点击查看答案

第3题

在R中利用iris数据集构建决策树的分类树模型，70%作为训练集，30%作为测试集，利用K折交叉验证和剪枝构建最优的决策树模型。进一步，根据合奏学习原理利用R中的randomForest包构建随机森林。对比结果并进行简要分析。需要上传程序代码。

点击查看答案

第4题

在R中利用MASS包中的Boston数据集构建决策树的回归树模型，70%作为训练集，30%作为测试集，利用K折交叉验证和剪枝构建最优的决策树模型。进一步，根据合奏学习原理利用R中的randomForest包构建随机森林。对比结果并进行简要分析。需要上传程序代码。

点击查看答案

第5题

一般地，不会把给定的整个数据集都用来训练模型，而是将其分成训练集和测试集两部分，使用训练集对模型进行训练或学习，然后把测试集输入训练好的模型并评估其表现。

点击查看答案

第6题

点击查看答案

第7题

基于bankpep数据集，划分训练集与测试集，建立分类模型。 1) 使用决策树建立分类模型，记录模型在测试集上的性能； 2) 自学朴素贝叶斯、支持向量集建立分类模型的方法，记录模型在测试集上的性能； 3) 使用使用梯度提升机以及XGBoost训练分累模型，并与步骤1、2的结果进行比较。 4) 本次作业需提交源代码和结果分析报告，分析报告说明使用的数据集，数据集特征项、数据量大小、尝试的每种方法、获得的结果。最后绘图比较这些方法在性能上的差别。

点击查看答案

第8题

数据集一般划分为训练集、验证集和测试集三部分，训练集用于建模，验证集（开发集）用于模型验证与矫正，测试集用于模型的最终评估。

点击查看答案

第9题

QSAR模型的外部验证环节中我们利用测试集进行评价，测试集test set从研究的化合物中挑选出合理数量和结构特征的样本组成预测集，预测集中的样本不参加模型的构建。

点击查看答案

第10题

使用5折交叉验证选择模型参数时，应将整个数据集按比例分割为训练集，验证集，测试集，再开展模型训练及测试，并将上述步骤重复5次。

点击查看答案

账号：尚未登录

登录没有账号？去注册

搜题记录

联系客服

购买搜题卡

功能	扣减规则
功能	基础费（查看答案）	加收费（AI功能）
文字搜题、查看答案	1/每题	0/每次
语音搜题、查看答案	1/每题	2/每次
单题拍照识别、查看答案	1/每题	2/每次
整页拍照识别、查看答案	1/每题	5/每次