（简答题）

简述ID3算法的基本思想及其主算法和建树算法的基本步骤。

正确答案

首先找出最有判别力的因素，然后把数据分成多个子集，每个子集又选择最有判别力的因素进一步划分，一直进行到所有子集仅包含同一类型的数据为止。最后得到一棵决策树，可以用它来对新的样例进行分类。
主算法包括如下几步：
①从训练集中随机选择一个既含正例又含反例的子集（称为窗口）；
②用“建树算法”对当前窗口形成一棵决策树；
③对训练集（窗口除外）中例子用所得决策树进行类别判定，找出错判的例子；
④若存在错判的例子，把它们插入窗口，重复步骤②，否则结束。
建树算法的具体步骤如下：
①对当前例子集合，计算各特征的互信息；
②选择互信息最大的特征A_k；
③把在A_k处取值相同的例子归于同一子集，A_k取几个值就得几个子集；
④对既含正例又含反例的子集，递归调用建树算法；
⑤若子集仅含正例或反例，对应分枝标上P或N，返回调用处。

答案解析

略

相似试题

（简答题）
ID3算法主要存在的缺点是什么？
答案解析
（简答题）
简述Apriori算法的思想，谈谈该算法的应用领域。
答案解析
（简答题）
简述K-means算法的基本操作步骤（包括算法的输入和输出）。
答案解析
（填空题）
Aprior算法包括（）和（）两个基本步骤
答案解析
（简答题）
请描述主成份分析（PCA）算法步骤
答案解析
（简答题）
简述k-means算法，层次聚类算法的优缺点。
答案解析
（简答题）
简述K-平均算法的输入、输出及聚类过程（流程）。
答案解析
（简答题）
简述K-中心点算法的输入、输出及聚类过程（流程）。
答案解析
（单选题）
在基本K均值算法里，当邻近度函数采用（）的时候，合适的质心是簇中各点的中位数。
答案解析