77范文网 - 专业文章范例文档资料分享平台

CDA题库(4)

来源:网络收集 时间:2020-05-23 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:或QQ: 处理(尽可能给您提供完整文档),感谢您的支持与谅解。点击这里给我发消息

方式最合理的?(D )

A 将空缺观测全部删除B 用所有客户上网套餐的中位数来替代C用所有客户上网套餐的众数来替代D 单独作为一类或者填充为0

19. 以下哪种方法不属于预测性(有监督学习)模型(C) A.决策树B.线性回归C.关联分析D.判别分析

20. 主成分分析计算分为根据相关系数和协方差矩阵两种方式,以下哪种情况适合用协方差矩阵计算(C)

A.全部变量的量纲相同B.全部变量的方差相同C.全部变量的值域相同D.任何变量都可以 21. 下面关于因子分析的说法正确的是(D)

A 因子分析就是主成分分析B 因子之间互相关也可不相关C 因子受量纲的影响D 可以对因子进行旋转,使其意义更明显

22. 以下哪种聚类方法需要实现指定聚类个数(B)

A.层次聚类B.K均值聚类C.基于密度的聚类D.基于网格的聚类 23.对快速聚类说法错误的是(B)

A 占内存少?计算量小?处理速度快B 可以样本聚类,也可以对变量聚类C 适合大样本 D需要事先确定多少个类别

24. 关于逻辑斯回归分析(logistic regrssion modle)说法正确的是(B) A:逻辑斯回归的因变量为数值变量B:逻辑斯回归的因变量为定性变量 C:逻辑斯回归的因变量只能有两种取值D:逻辑斯回归自变量只能是一个

25. 通过广告费分析销售收入,丙公司的销售经理根据36个月销售收入和广告费用的关系开发了简单线性回归模型。该模型如下所示,且给模型的判定系数为0.90。 Y=20 00元+2.50 X其中,Y代表销售收入,X代表广告费用。

如果丙公司某月的广告费用为2 00元,那么销售收入的估计值为(B) A.2550元B. 2500元C. 2350元D. 500元

26. 以下哪一种方法不能用来分析时间序列数据?(A)

A. 德尔菲法B. 移动平均法C. 最小二乘法D. 指数平滑法

27. 根据时间序列乘法模型的原理,为了测度季节变动,需要从时间序列中(D) A.减去长期趋势和循环变动 B.减去长期趋势、循环变动和不规则变动 C.除去长期趋势和循环变动D.除去长期趋势、循环变动和不规则变动

28. 关于数据挖掘的方法论CRISP-DM说法正确的是(B) A 这是SPSS公司,Daimler Chrysler提出的数据挖掘流程

B 主要分为六步,业务理解,数据理解,数据准备,模型搭建,模型评估与模型发布 C 该方法论已经成功的在SAS EM中进行了实施

D 这六个过程有严格的前后顺序,一气呵成,分析过程中不能逆转或者跳转 29. RFM方法中的F说明客户的(A) A.兴趣度B.粘性C.当前价值D.未来价值

30. 某汽车品牌委托某公司及时收集客户在微博上关于该品牌汽车的负面留言,这属于哪类商业智能系统(D)

A.常规报表B.即席查询 C.多维分析D.预警

31. 某公司的总会计师决定用决策模型应对不确定性问题。目前,丙公司有两种方案可供选择,与另一跨国公司联合投资或不联合投资。总会计师提供了以下信息:

方案1:联合投资的结果和概率:成功概率为60%,投资成本为1 200万元,投资成功的现金流为2 000万元,投资不成功的现金流为200万元,其他成本为0元,至此时已发生的成

本为1 20万元。

方案2:不联合投资的结果和概率:至此时已发生的成本为1 20万元,其他成本为500 000 元。

下列哪项分别正确地反映了联合投资与不联合投资的期望值?(C) A.800 000元和-1 700 000元 B.-700 000元和-500 000元 C. 800 000元和-500 000元 D.-700 000元和-1 700 000元

32. 某公司在进行市场调研,以决定是否推出一款新产品。调研得出的结论是:出现有利结果的概率为60%,出现不利结果的概率为40%。如果结果有利,则产品成功的概率为70%;如果结果不利,则产品失败的概率会达到75%。如果产品成功,该公司预期年利润将达到5 000 000元;如果产品失败,该公司每年将损失2 000 000元。那么,这款新产品的年利润期望值为(B)

A.1 500 000元B.1 640 000元C. 2 000 000元D.2 650 000元 二、多选题

1. 以下哪个分布是右偏分布(BCD)

A .均匀分布B.卡方分布C.F分布D.对数正态分布

2.在假设检验中,当我们做出拒绝原假设而接受备择假设的结论时,表示(ACE) A 有充足的理由否定原假设 B 原假设必定是错误的 C犯错误的概率不大于a D犯错误的概率不大于b

E 在H。成立的情况下发生了小概率事件 3. 若检验统计量F 近似等于1,说明(AD) A.组间方差中不包含系统因素的影响 B.组内方差中不包含系统因素的影响 C.组间方差中包含系统因素的影响 D.方差分析中不应拒绝原假设

4. 以下哪些变量使用RFM方法构造出来的(ABD )

A.最近3期境外消费金额B.最近6期网银消费交易笔数C.信用额度D.距最近一次逾期的月数

5.如下表student中,如何筛选type为包含数学或语文的记录?(BC) IDtypescoreA01数学78A02语文76A03英语90A04数学68A05英语84 A select * from student where type=”数学” and type=”语文” B select * from student where type=”数学” or type=”语文” C select * from student where type in (”数学” , ”语文”) D select * from student where type in (”数学”? ”语文”)

6. 主成分分析计算分选择相关系数计算法时,确定主成分个数的大致原则包括(AC ) A.特征根值大于1B.特征根值大于0.8C.累积特征根值加总占总特征根值的80%以上D.累积特征根值加总占总特征根值的90%以上

7. 以下哪个聚类分析的方法是利用统计学定义的距离进行度量(AB) A.层次聚类法 B.快速聚类法 C.基于密度的聚类法 D.基于网格的聚类法

8 . 以下关于皮尔森相关分析叙述正确的是(AB ) A.两变量独立,两者的皮尔森相关系数必然等于0 B.两变量皮尔森相关系数不等于0,两者必然不独立

C.皮尔森相关系数是否等于零,不能指明两变量是否独立 D.两变量不独立,两者的皮尔森相关系数必然不等于0

9. 在客户关系管理中,客户的生命周期都包括那几个阶段(ABCD) A.潜在客户B.响应客户C.即得客户D.流失客户

10. 天猫分析人员希望通过聚类方法定位代商家刷信用级别的违规者,以下那种操作不应该进行: (BD)

A. 对变量进行标准化

B. 对变量进行百分位秩或Turkey正态性转换 C. 对变量进行因子分析或变量聚类 D. 对变量进行分箱处理

一、单选题 1.统计图中的散点图主要用来( A )。

A.观察变量之间的相关关系 B.主要用来表示总体各部分所占的比例 C.主要用来表示次数分布 D.主要用来反映分类数据的频数分布 2.抽样误差是指( D )

A.在调查过程中由于观察、测量等差错所引起的误差 B.人为原因所造成的误差

C.在调查中违反随机原则出现的系统误差 D.随机抽样而产生的代表性误差 3.检查异常值常用的统计图形:( B ) A、条形图 B、箱体图 C、帕累托图 D、线图

4.线性回归里的残差分析不可能用于诊断( D ) A、残差独立性 B、变量分布 C、异常值侦察 D、最大迭代次数

5.拟合logistic回归模型时有两个分类变量,分别是Gender(水平为female和male),Class(水平为1 、2和3),下表为输出结果,下面哪个选项的说法是正确的?(C) A.变量Gender和Class采用效应编码

B.变量Gender采用引用编码,引用水平为female C.变量Class采用引用编码,引用水平为3 D.变量Gender和Class采用全量编码 6.因子分析的主要作用:( A ) A、对变量进行降维 B、对变量进行判别 C、对变量进行聚类 D、以上都不对

7.关于K-means 聚类过程正确的是:( A )

A、使用的是迭代的方法

B、均适用于对变量和个案的聚类 C、对变量进行聚类 D、以上都不对

8.东北人养了一只鸡和一头猪。一天鸡问猪:"主人呢?"猪说:"出去买蘑菇了。"鸡听了撒丫子就跑。猪说:"你跑什么?"鸡叫道:“有本事主人买粉条的时候你小子别跑!" 以上对话体现了数据分析方法中的( A )

A. 关联 B. 聚类 C. 分类 D. 自然语言处理 9.已知甲班学生“统计学”的平均成绩为86分,标准差是12.8分,乙班学生“统计学”的平均成绩是90分,标准差是10.3分,下列表述正确的是( A ) A. 乙班平均成绩的代表性高于甲班 B. 甲班平均成绩的代表性高于乙班 C. 甲、乙两班平均成绩的代表性相同 D. 甲、乙两班平均成绩的代表性无法比较

10.根据样本资料估计得出人均消费支出Y对人均收入X的回归模型,表明人均收入每增加1%,人均消费支出将增加( B )

A. 0.2% B. 0.75% C. 2% D. 7.5%

11.某企业根据对顾客随机抽样的信息得到对该企业产品表示满意的顾客比率的95%置信度的置信区间是(56%,64%)。下列正确的表述是( A ) A.总体比率的95%置信度的置信区间为(56%,64%) B.总体真实比率有95%的可能落在(56%,64%)中 C.区间(56%,64%)有95%的概率包含了总体真实比率

D.由100次抽样构造的100个置信区间中,约有95个覆盖了总体真实比率 12.以下哪个语句可以将字符型数值date(示例:“2001-02-19”)转换为数值类型? ( A ) A、INPUT(date,YYMMDD10.) B、PUT(date,YYMMDD10) C、INPUT(date,YYMMDD10.) D、PUT(date,YYMMDD10) 13. ,取值范围在[0,1],反映回归曲线的拟合优度,当趋近于0,则回归曲线拟合优度( B ) A.越好 B. 越差 C. 适中 D. 以上都不对 14.分析购买不同产品的频次时,使用以下哪个任务? ( D ) A、列表数据 B、汇总表 C、汇总统计量 D、单因子频数

15.当你用跑步时间(RunTime)、年龄(Age)、跑步时脉搏(Run_Pulse)以及最高脉搏(Maximum_Pulse)作为预测变量来对耗氧量(Oxygen_Consumption )进行回归时,年龄(Age)的参数估计是-2.78. 这意味着什么?( B ) A、年龄每增加一岁,耗氧量就增大2.78. B、年龄每增加一岁,耗氧量就降低2.78. C、年龄每增加2.78岁,耗氧量就翻倍。 D、年龄每减少2.78岁,耗氧量就翻倍。

16.ROC曲线凸向哪个角,代表模型约理想?( A ) A、左上角

B、左下角 C、右上角 D、右下角

17.在所有两位数(10-99)中任取一两位数,则此数能被2或3整除的概率为 ( B) A. 6/5 B. 2/3 C. 83/100 D.均不对 18.对事件A和B,下列正确的命题是 ( D ) A.如A,B互斥,则,也互斥 B. 如A,B相容,则, 也相容

C. 如A,B互斥,且P(A)>0,P(B)>0,则A.B独立 D. 如A,B独立,则,也独立

19.掷二枚骰子,事件A为出现的点数之和等于3的概率为 ( B ) A.1/11 B. 1/18 C. 1/6 D. 都不对

20.A和B两事件,若 P(AUB)=0.8,P(A)=0.2,P()=0.4 则下列 ( B )成立。 A. P()=0.32 B. P()=0.2

C. P(AB)=0.4 D. P()=0.48

21.随机地掷一骰子两次,则两次出现的点数之和等于8的概率为 ( C ) A. 3/36 B. 4/36 C. 5/36 D. 2/36 22.抽样推断中,可计算和控制的误差是 ( D ) A.登记误差 B.系统性误差(偏差) C.抽样实际误差 D.抽样平均误差 23.假设检验中显著性水平是 ( B )

A.推断时犯取伪错误的概率 B.推断时犯取伪弃真的概率 C.正确推断的概率 D.推断时视情况而定 24.抽样调查中,无法消除的误差是 ( A )

A.随机误差 B.工作误差 C.登记误差 D.偏差 25.当时,两个相关变量 ( C ) A.低度相关 B.中度相关 C.高度相关 D.不相关

26.描述一组对称(或正态)分布资料的离散趋势时,最适宜选择的指标是(B) A.极差 B.标准差 C.均数 D.变异系数 27.以下指标中那一项可用来描述计量资料离散程度(D) A.算术均数 B.几何均数 C.中位数 D.极差 28.偏态分布资料宜用下面那一项描述其分布的集中趋势(C) A.算术均数 B.标准差 C.中位数 D.四分位数间距 29.下面那一项可用于比较身高和体重的变异度(C) A.方差 B.标准差 C.变异系数 D.全距 30.正态曲线下,横轴上从均数到+∞的面积为(C) A.97.5% B.95% C.50% D.5%

31.横轴上,标准正态曲线下从0到1.96的面积为: (D) A.95% B.45% C.97.5% D.47.5% 32.下面那一项分布的资料,均数等于中位数。(D)

A.对数正态 B.左偏态 C.右偏态 D.正态 33.K-均值类别侦测要求输入的数据类型必须是( B )。 A整型 B数值型 C字符型 D逻辑型

百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说教育文库CDA题库(4)在线全文阅读。

CDA题库(4).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印 下载失败或者文档不完整,请联系客服人员解决!
本文链接:https://www.77cn.com.cn/wenku/jiaoyu/1069202.html(转载请注明文章来源)
Copyright © 2008-2022 免费范文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ: 邮箱:tiandhx2@hotmail.com
苏ICP备16052595号-18
× 注册会员免费下载(下载后可以自由复制和排版)
注册会员下载
全站内容免费自由复制
注册会员下载
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: