34.某一特定的X水平上,总体Y分布的离散度越大,即σ2越大,则( A )。 A.预测区间越宽,精度越低 B.预测区间越宽,预测误差越小 C 预测区间越窄,精度越高 D.预测区间越窄,预测误差越大 35.如果X和Y在统计上独立,则相关系数等于( C )。 A.1 B.-1 C.0 D.∞
36.根据决定系数R2与F统计量的关系可知,当R2=1时,有( D )。 A.F=1 B.F=-1 C.F=0 D.F=∞
37.假设两变量线性相关,两变量是等距或等比的数据,但不呈正态分布,计算它们的相关系数时应选用( B )。
A. 积差相关 B.斯皮尔曼等级相关 C.二列相关 D.点二列相关
38.回归模型中,关于检验所用的统计量,下列说法正确的是( D )。 A.服从 B.服从 C.服从 D.服从
39.下面有关HAVING子句描述错误的是(B)。
A:HAVING子句必须与GROUP BY 子句同时使用,不能单独使用 B:使用HAVING子句的同时不能使用WHERE子句 C:使用HAVING子句的同时可以使用WHERE子句 D:使用HAVING子句的作用是限定分组的条件 40. 是( C )分布的密度函数。
A.指数 B. 二项 C. 均匀 D. 泊松
41.根据判定系数R2与F统计量的关系可知,当R2=1时有( C )。 A.F=1 B.F=-1 C.F=∞ D.F=0 42.在SQL查询时,使用WHERE子句指出的是(C)。 A:查询目标 B:查询结果 C:查询条件 D:查询视图
43.SQL查询语句中HAVING子句的作用是(C)。 A:指出分组查询的范围 B:指出分组查询的值 C:指出分组查询的条件 D:指出分组查询的字段
44.SQL的数据操作语句不包括(D)。 A:INSERT B:UPDATE C:DELETE D:CHANGE
45.SQL语句中查询条件短语的关键字是(A)。 A:WHERE B:FOR C:WHILE D:CONDITION
46.SQL语句中修改表结构的命令是(C)。
A:MODIFY TABLE B:MODIFY STRUCTURE C:ALTER TABLE D:ALTER STRUCTURE
47.SQL语句中删除表的命令是(A)。 A:DROP TABLE B:DELETE TABLE C:ERASE TABLE D:DELETE DBF 二、多选题
48.相关有以下几种(ABC)。
A.正相关 B.负相关 C.零相关 D.常相关 49.相关系数的取值可以是(ABC)。 A. 0 B.-1 C. 1 D. 2
50.某种产品的生产总费用2003年为50万元,比2002年多2万元,而单位产品成本2003年比2002年降低5%,则( ACDE )
A、生产费用总指数为104.17% B、生产费用指数为108.56% C、单位成本指数为95% D、产量指数为109.65% E、由于成本降低而节约的生产费用为2.63万元
51.三个地区同一种商品的价格报告期为基期的108%,这个指数是( BE ) A、个体指数 B、总指数 C、综合指数 D、平均数指数 E、质量指标指数 52.有关数据库的说法正确的是(ABCD) A.元数据是描述数据的数据
B.使用索引可以快速访问数据库中的数据,所以可以在数据库中尽量多的建立索引 C.数据库中一行叫做记录
D.数据库中的每一个项目叫做字段
53.统计数据按来源分类,可以分为(BD) A.类别数据 B.二手数据 C.序列数据 D.一手数据 E.数值数据
53.以下哪些变量代表RFM方法中的M:( AB ) A.最近3期境外消费金额 B.最近6期网银平均消费金额 C.信用卡的消费额度 D.距最近一次逾期的月数
54.在作逻辑回归时,如果区域这个变量,当Region=A时Y取值均为1,无法确定是否出现的是哪个问题?(ABD) A. 共线性 B. 异常值
C. 拟完全分离(Quasi-complete separation) D. 缺失值
55.下列Z值( BCD )可以被认为是异常值。 A、0 B、-3 C、6 D、10
56.下列问题( ABC )使用参数检验分析方法。
A、评估灯泡使用寿命 B、检验食品某种成分的含量 C、全国小学一年级学生一学期的平均课外作业时间 D、全国省市小康指数高低 57.两独立样本t检验的前提( ABC )
A、样本来自的总体服从或近似服从正态分布 B、两样本相互独立 C、两样本的数量可以不相等 D、两样本的数量相等 58.两配对样本t检验的前提( ABD )
A、样本来自的总体服从或近似服从正态分布 B、两样本观察值的先后顺序一一对应 C、两样本的数量可以不相等 D、两样本的数量相等 59.下面给出的t检验的结果,( CD )表明接受原假设,显著性水平为0.05。 A、0.000 B、0.039 C、0.092 D、0.124 60.方差分析的基本假设前提包括( AC )
A、各总体服从正态分布 B、各总体相互独立 C、各总体的方差应相同 D、各总体的方差不同 61.下列( ABC )属于多选项问题。
A、购买保险原因调查 B、高考志愿调查
C、储蓄原因调查 D、各省市现代化指数分析 62.层次聚类的聚类方式分为两种,分别是( AB )
A、凝聚方式聚类 B、分解方式聚类 C、Q型聚类 D、R型聚类
一、单选题
1.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?(A) A. 关联规则发现 B. 聚类 C. 分类
D. 自然语言处理
2.以下两种描述分别对应哪两种对分类算法的评价标准? (A) (a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。 (b)描述有多少比例的小偷给警察抓了的标准。 A. Precision, Recall B. Recall, Precision C. Precision, ROC D. Recall, ROC
3.将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?(C) A. 频繁模式挖掘 B. 分类和预测 C. 数据预处理 D. 数据流挖掘
4.当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?(B) A. 分类 B. 聚类 C. 关联分析 D. 隐马尔可夫链
5.什么是KDD? (A) A. 数据挖掘与知识发现 B. 领域知识发现 C. 文档知识发现 D. 动态知识发现
6.使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的哪一类任务?(A) A. 探索性数据分析 B. 建模描述 C. 预测建模
D. 寻找模式和规则
7.为数据的总体分布建模;把多维空间划分成组等问题属于数据挖掘的哪一类任务?(B) A. 探索性数据分析 B. 建模描述 C. 预测建模
D. 寻找模式和规则 8.建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务?(C) A. 根据内容检索 B. 建模描述 C. 预测建模
D. 寻找模式和规则
9.用户有一种感兴趣的模式并且希望在数据集中找到相似的模式,属于数据挖掘哪一类任务?(A)
A. 根据内容检索 B. 建模描述 C. 预测建模
D. 寻找模式和规则
10.下面哪种不属于数据预处理的方法? (D) A变量代换 B离散化 C聚集
D估计遗漏值
11.假设12个销售价格记录组已经排序如下:5, 10, 11, 13, 15,35, 50, 55, 72, 92, 204, 215,将它们划分成四个箱,等频(等深)划分时,15在第几个箱子内? (B) A 第一个 B 第二个 C 第三个 D 第四个
12. 假设12个销售价格记录组已经排序如下:5, 10, 11, 13, 15,35, 50, 55, 72, 92, 204, 215,等宽划分时(宽度为50),15又在哪个箱子里? (A) A 第一个 B 第二个 C 第三个 D 第四个
13.下面哪个不属于数据的属性类型:(D) A 标称 B 序数 C 区间 D相异
14.只有非零值才重要的二元属性被称作:( C ) A 计数属性 B 离散属性
C非对称的二元属性 D 对称属性
15.以下哪种方法不属于特征选择的标准方法: (D) A 嵌入 B 过滤 C 包装 D 抽样
16.下面不属于创建新属性的相关方法的是: (B) A特征提取 B特征修改
C映射数据到新的空间 D特征构造
17.考虑值集{1、2、3、4、5、90},其截断均值(p=20%)是 (C) A 2 B 3 C 3.5 D 5
18.下面哪个属于映射数据到新的空间的方法? (A) A 傅立叶变换 B 特征加权 C 渐进抽样 D 维归约
19.熵是为消除不确定性所需要获得的信息量,投掷均匀正六面体骰子的熵是: (B) A 1比特 B 2.6比特 C 3.2比特 D 3.8比特
20.假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为:(D) A 0.821 B 1.224 C 1.458 D 0.716
21.假定用于分析的数据包含属性age。数据元组ag的值如(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:(A)
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说教育文库CDA题库(6)在线全文阅读。
相关推荐: