题目
A.kmeans算法各聚类中心与其几何重心是重合的,对于凸型数据集初始的假设聚类中心尽量距离远一些。
B.在计算样本之间的距离时,对样本不同量纲的数据属性进行标准化是必要的。
C.Kohonon神经网络在计算过程中需要计算样本之间的距离。
D.当聚类的组数比较多时,可以把距离较近的簇合并。
第1题
A.k-均值聚类需要大量的迭代,因此不能使用分布式计算。
B.k-均值的分布式实现需要MapReduce的各个数据节点共享假设的聚类中心。
C.k-均值算法的大量迭代运算在分布式环境下的效率一般更高。
D.k-均值在Spark内存计算框架下运行要比Hadoop MapReduce下运行要快的多。
第5题
A.每种算法都有其使用范围,因此选择算法需要考虑具体处理的问题
B.判断机器学习算法好坏在数据需求阶段就可以确定
C.在分类前可以先做聚类分析
D.对聚类问题可以任选一种聚类算法
第9题
A.K-means算法能够解决有离群点的聚类问题
B.K-modes能够解决离散数据的聚类问题
C.K-means++能够解决初始点影响聚类效果的问题
D.K中心点能够解决有离群点的聚类问题
为了保护您的账号安全,请在“赏学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!