聚类要注意的问题 聚类结果主要受所选择的变量影响.如果去掉一些变量,或者增加一些变量,结果会很不同.相比之下,聚类方法的选择则不那么重要了.因此,聚类之前一定要目标明确._另外就分成多少类来说,也要有道理.只要你高兴,从分层聚类的计算机结果可以得到任何可能数量的类.但是,聚类的目的是要使各类距离尽可能的远,而类中点的距离尽可能的近,而且分类结果还要有令人信服的解释.这一点就不是数学可以解决的了.判别分析要注意的问题训练样本中必须有所有要判别的类型,分类必须清楚,不能有混杂. 要选择好可能由于判别的预测变量.这是最重要的一步.当然,在应用中,选择的余地不见得有多大. 要注意数据是否有不寻常的点或者模式存在.还要看预测变量中... |