已知数据元组中age的值如下(按递增序): 13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,33,35,35,35,35,36,40,45,46,52,70。 (a)使用min-max规范化,将age值35转换到[0.0,1.0]区间。 (b)使用z-score规范化转换age值35,其中,age的标准偏差为12.94年。 (c)使用小数定标规范化转换age值35。
正确答案
(b)已知均值为30,标准差为12.94,则可将35规范化为:
(c)使用小数定标规范化可将35规范化为:35/100=0.35
答案解析
相似试题
(单选题)
假定用于分析的数据包含属性age。数据元组中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:()。
(简答题)
假定用于分析的数据包含属性age,数据元组中age的值如下(按递增序): 13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,33,35,35,35,35,36,40,45,46,52,70。 (a)使用按箱平均值平滑对以上数据进行平滑,箱的深度为3。解释你的步骤。评论对于给定的数据,该技术的效果。 (b)对于数据平滑,还有哪些其它方法?
(简答题)
在现实世界的数据中,元组在某些属性上缺少值是常有的。描述处理该问题的各种方法。
(多选题)
在现实世界的数据中,元组在某些属性上缺少值是常有的。描述处理该问题的各种方法有:()。
(简答题)
以下是一个商场所销售商品的价格清单(按递增顺序排列,括号中的数表示前面数字出现次数) 1(2)、5(5)、8(2)、10(4)、12、14(3)、15(5)、18(8)、20(7)、21(4)、25(5)、28、30(3)。 请分别用等宽的方法和等高的方法对上面的数据集进行划分。
(单选题)
规则:age(X,”19-25”)∧buys(X,“popcorn”)=>buys(X,“coke”)是一个()。
(单选题)
建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务?()
(简答题)
何谓粒度?它对数据仓库有什么影响?按粒度组织数据的方式有哪些?
(单选题)
如果规则集中的规则按照优先级降序排列,则称规则集是()。