题目
A.kmeans算法各聚类中心与其几何重心是重合的,对于凸型数据集初始的假设聚类中心尽量距离远一些。
B.在计算样本之间的距离时,对样本不同量纲的数据属性进行标准化是必要的。
C.Kohonon神经网络在计算过程中需要计算样本之间的距离。
D.当聚类的组数比较多时,可以把距离较近的簇合并。
第1题
A.kmeans算法各聚类中心与其几何重心是重合的,对于凸型数据集初始的假设聚类中心尽量距离远一些。
B.在计算样本之间的距离时,对样本不同量纲的数据属性进行标准化是必要的。
C.Kohonon神经网络在计算过程中需要计算样本之间的距离。
D.当聚类的组数比较多时,可以把距离较近的簇合并。
第3题
A.kmeans算法对于非凸型的聚类不能产生聚类结果。
B.在确定样本集是否可以使用kmeans算法时,可以先对数据集进行可视化观察样本集的大致分布。
C.初始聚类中心的选择会影响kmeans算法的收敛速度。
D.kmeans需要多次迭代,因此对于大的样本集速度求解比较慢。
第4题
A.kmeans只能处理凸型分布的非数值型样本。
B.kmeans算法需要在聚类前确定类数k,这个k值需要有助于解释各类的业务含义。
C.kmeans聚类的过程与初始的k个假设的聚类中心的选择没关。
D.kmeans算法对异常样本非常敏感,因此在聚类前要把异常样本直接删除。
第5题
A.k-均值聚类需要大量的迭代,因此不能使用分布式计算。
B.k-均值的分布式实现需要MapReduce的各个数据节点共享假设的聚类中心。
C.k-均值算法的大量迭代运算在分布式环境下的效率一般更高。
D.k-均值在Spark内存计算框架下运行要比Hadoop MapReduce下运行要快的多。
为了保护您的账号安全,请在“赏学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!