18最常用的调查方法是(C)
A、 重点调查 B、 典型调查 C、 抽样调查 D、 全面调查 19一个95%的置信区间是指(C)
A、 总体参数有95%的概率落在这一区间内 B、 总体参数有5%的概率未落在这一区间内
C、 在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数。 D、 在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数。 20关于时间序列,说法正确的是(C) A、 一组截面数据 B、 一组面板数据 C、 按时间记录的一组数据 D、 按地点记录的一组数据
21在Excel 中,数据类型包括(D)
A、 数值型数据 B、 字符型数据 C、 逻辑型数据 D、 以上全部
22在Excel 2003中,图表被建立在(A) A、 二维坐标系中 B、 一维坐标系中 C、 三维坐标系中 D、 更高维坐标系中
23(A)所有数据相加后除以其个数
A、 算术平均数 B、 几何平均数 C、 加权平均数 D、 调和平均数
24随机变量X服从(D)分布时,DX=EX。
A、 正态 B、 指数 C、 二项 D、 泊松 25在SQL中,建立视图用的命令是(C)
A、 CREATE SCHEMA B、 CREATE TABLE C、 CREATE VIEW D、 CREATE DATABASE
26某企业拟进行一项存在一定风险的完整工业项目投资,有甲、乙两个方案可供选择。已知甲方案净现值的期望值为1000万元,标准差为300万元;乙方案净现值的期望值为1200万元,标准差为330万元。下列结论中正确的是(B)。
A、 甲方案优于乙方案 B、 甲方案的风险大于乙方案 C、 甲方案的风险小于乙方案 D、 无法评价甲、乙方案的风险大小 27无量纲化后各变量的平均值为(A)
A、 0 B、 1 C、 -1 D、 原均值 28无量纲化后各变量的标准差为(B)
A、 0 B、 1 C、 -1 D、 原标准差 29(C)用于计算间隔不等的连续时点序列的评价发展水平。
A、 算术平均数 B、 几何平均数 C、 加权平均数 D、 调和平均数
30甲、乙两个投资项目的期望报酬率不同,但甲项目的标准离差系数大于乙项目,则(C)。 A、 甲项目的风险小于乙项目 B、 甲项目的风险不大于乙项目 C、 甲项目的风险大于乙项目 D、 难以判断风险大小 二、 多选题
1一个成功的问卷设计应该具备的功能有(AB )。
A、 能将所要调查的问题明确地传达给被调查者 B、 设法取得对方合作,最终取得真实、准确的答案 C、 获取尽可能多的被调查者信息
D、 适合任何背景的人群 2数据产生的主要来源有(ABCD)
A、 局域网 B、 离线储存数据 C、 互联网 D、 物联网 3关于移动平均法说法正确的是(ABD) A、 将每个观测值都给予了相同的权数 B、 只要适合对平稳时间序列进行预测
C、 对于同一个时间序列,采用不同的移动步长,预测的准确性相同 D、 只使用最近期的数据,每次计算移动平均值时,移动的间隔均为K 4如果参与分类的变量是连续变量,则适用的聚类方法有(ABC)
A、 层次聚类法 B、 K-均值聚类法 C、 两步聚类法 D、 混合聚类法
5离散趋势的判断指标包括(BCD)
A、 自由度 B、 极差 C、 标准差 D、 方差 6如果参与分类的变量较少时(比如小于100),可以选用的方法是(ABC)
A、 层次聚类法 B、 K-均值聚类法 C、 两步聚类法 D、 混合聚类法
7根据结构化水平,数据可分为(ACD)
A、 结构化数据 B、 大数据 C、 半结构化数据 D、 非结构化数据
8访问法包括(ABCD)
A、 小组访谈法 B、 街头访问 C、 企业调研 D、 网上调查 9可采集到的网站访问数据包括(ABCD)
A、 访问者属性 B、 访问者访问网站的频率 C、 每次访问停留的时间 D、 访问者浏览路径
10以下属于服务器日志的是(ABCD )。
A、 网页浏览日志 B、 apache日志 C、 JSON日志 D、 自定义格式输出日志
11互联网生成的数据包括(ABC)
A、 电子商务 B、 移动互联网APP C、 网络游戏 D、 传感器数据
12下列可描述相关关系的图表类型有(AC)
A、 散点图 B、 饼图 C、 气泡图 D、 瀑布图 13KANO模型定义的顾客需求层次有:(ACD)
A、 兴奋型需求 B、 喜爱型需求 C、 基本型需求 D、 期望型需求
14估计量的评价标准有(ABC)
A、 无偏性 B、 有效性 C、 一致性 D、 随机性 15数据库是一个(ABCD)数据集合 A、 长期存储在计算机内的 B、 有组织的 C、 可共享的 D、 统一管理的 三、 填空题
1用SPSS软件处理下列重复数据,完成下列题目。 需要给重复个案做标记,产生一个新标记变量的SPSS操作是选定“数据”选项下的(标识重复个案)选项。(可填答案“标识异常个案”、“标识重复个案”、“个案选择”
标记重复个案新生成的变量用(0)标记重复个案。(可填答案为0或1) 标记重复个案新生成的变量用(1)标记基本个案。(可填答案为0或1) 删除重复数据时,需要选定数据->选择个案->选定如果条件满足框输入重复标记=1,输出框选择(删除未选定个案)。(可写答案:“过滤掉未选个案”、“将选定个案复制到新数据集”、“删除未选定个案”)
2以下数据是百度2011年-2014年各季度的营业收入,试采用EXCEL数据分析描述统计功能,对成绩进行分析汇总给出相关统计指标。 求营业收入的均值(保留两位小数)(69.18) 求营业收入的中位数(保留两位小数)(62.50) 求营业收入的标准差(保留整数)(32) 求营业收入的最大值(135.2) 3 下表是某单位年终奖金分配表,采用EXCEL数据分析描述统计功能,求解该单位年终奖金分配中的最高金额、最低金额、平均金额、中间金额、众数金额等。 求该单位年终奖金分配中的最高金额(50000) 求该单位年终奖金分配中的最低金额(6000) 求该单位年终奖金分配中的平均金额(22750) 求该单位年终奖金分配中的众数金额(15000)
4以下数据是20个不同产品的两个参数,用SPSS软件按要求进行排序。 排序依据为L1,要求升序排列时,排在第六位的产品编号为(12)。 排序依据为L2,要求降序排列时,排在第十位的产品编号为(9)。
排序依据为L1和L2,要求先按L1升序排列,后按L2降序排列,排在第9位的产品编号为(2)。
排序依据为L1和L2,要求先按L1降序排列,后按L2升序排列,排在第6位的产品编号为(15)。
5某百货公司从1995年到2001年的季度收入情况如下:单位:百万美元用SPSS进行时间序列季节分解预测注意:本案例预测时使用的时间序列的乘积模型如下: Y = T × S × I (即:长期趋势 × 季节指数 × 不规则因素) (1)计算出1995年第一季度的季节指数(0.9126)(保留四位小数) (2)计算出1995年第一季度的非季节变化收入(10168.7458)(保留四位小数) (3)第(4)个季节的季节指数最大.(答案填写阿拉伯数字“1,2,3??”)
(4)用趋势项对时间t做线性回归,建立的回归方程中的常数项系数为(8977.463)。(保留3位小数) 四、 判断题
1聚类分析的对象只能是所观察的多个样本(×)
2如果拒绝的是真的原假设,就可能犯第Ⅰ类错误,一般犯这类错误的概率记为(√) 3变异系数又称标准离差率,是一个相对指标,表示标准差偏离期望值的程度。(√ )
4在多元回归检验中,F检验和T检验的作用是一样的,都是用来检验回归系数的显著性。(×)
5极差用来描述数据的离散趋势。(√)
6提高价格透明度属于直接的短期刺激(×) 7因子得分是各变量的线性组合(√)
8采用JS标记获取网站数据时,当用户禁用JS功能时仍可获取数据。(×)
9访问次数与唯一身份访问者的比率越高表示这段时间内访问者的回访次数越多。(√) 10奢侈品、高消费品的价格弹性小(×)
11市场定位是确定目标市场的地理位置。(×)
12一组数据的个数为奇数时,中位数为中间位置上的数。(√) 13外部数据比内部数据可靠性更强。(×)
14市场细分是指营销者通过市场调研,依据消费者的需要和欲望、购买行为和购买习惯等方面的差异,把某一产品的市场整体划分为若干消费者群的市场分类过程。(√) 15对于简单指数平滑预测中的平滑系数a ,当注重于近期的实际值时,宜选较大的a (√) 一、单选
1.北京市统计局发布2014年度全市职工平均工资为77560元,月平均工资为6463元.众多网友直呼“被平均”,你认为下面哪种统计量测度平均工资会更被信服(D) A 几何平均数 B众数 C极差 D中位数
2. 某企业2000年实现利润为200万元,2005年为300万元,则年平均增长速度为(D) A.5% B.11% C.10% D.8.4% 3. 当一组数据属于左偏分布时,则(D)
A.平均数?中位数与众数是合而为一的 B.众数在左边?平均数在右边 C.众数的数值较小?平均数的数值较大 D.众数在右边?平均数在左边
4. 作为一家制造类企业,以下哪个图适合比较不同产品各年的销售变化情况(D) A .分组饼形图 B.堆叠面积图 C.堆叠柱形图 D.分组柱形图
5. 横截面数据主要注意以下哪个数据问题(A) A .异方差 B.不独立 C.非正态分布 D.不随机
6. 以下叙述正确的是(B) A .极差较少受异常值的影响 B.四分位差较少受异常值的影响 C.方差较少受异常值的影响 D.标准差较少受异常值的影响
7. 某汽车品牌预测到未来不同型号汽车的利润率和销售量会发生变化,希望根据利润最大化得到最优产量,这属于哪类数据分析过程(C) A.预测型建模 B.预报 C.优化 D.报警
8.为研究某种减肥茶减肥效果是否显著,可以采用(C)分析方法。
A、单样本t检验 B、两独立样本t检验 C、两配对样本t检验 D、方差分析 9. 中心极限定理的假设不包括(D)
A.样本相互独立B.样本具有相同分布C.样本足够大D.样本服从正态分布 10. 下列场合下,(C)适合用t检验统计量
A.样本为小样本,且总体方差已知B.样本为大样本,且总体方差已知 C.样本为小样本,且总体方差未知D.样本为大样本,且总体方差未知 11. 方差分析表表如下,值20应填在哪个位置上(B)
方差来源离差平方和自由度均方差F值组间14245.8334748.612.16组内 ABC总和D23
12. 某信用卡公司为了分析客户教育程度对授信额度是否有显著性差异,已知教育程度分为5种,每个教育程度取30个客户,则因素的水平为(D) A 5B 6C 30D 150
13.给出下列结论:(B)
(1)在回归分析中,可用指数系数R方的值判断模型的拟合效果,R方越大,模型的拟合效果越好;
(2)在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好;
(3)在回归分析中,可用相关系数r的值判断模型的拟合效果,r越小,模型的拟合效果越好;
(4)在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高. A.1 B.2 C.3 D.4 14. 下列关系中,属于正相关关系的有(A)
A.合理限度内,施肥量和平均单位产量之间的关系 B.产品产量与单位产品成本之间的关系 C.商品的流通费用与销售利润之间的关系 D.流通费用率与商品销售量之间的关系 15.下列关于SQL的说法错误的是(C) A SQL 对大小写不敏感 B SQL为非过程化编程语言 C 不同的数据库的SQL完全一致
D一种数据库查询和程序设计语言,用于存取数据以及查询?更新和管理关系数据库系统 16. 要查询book表中所有书名中以“中国”开头的书籍的价格,可用(D)语句。 (A) SELECT price FROM book WHERE book_name = ‘中国*’ (B) SELECT price FROM book WHERE book_name LIKE ‘中国*’ (C) SELECT price FROM book WHERE book_name = ‘中国%’ (D) SELECT price FROM book WHERE book_name LIKE ‘中国%’
17. 为名为“zhangsan”的用户分配对数据库“studb”的“stuinfo”表查询和插入数据权限的语句是(B)
A.grant select,insert on studb.stuinfo for‘zhangsan’@’localhost’ B.grant select,insert on studb.stuinfo to ‘zhangsan’@’localhost’ C.grant‘zhangsan’@’localhost’ to select,insert for studb.stuinfo D.grant ‘zhangsan’@’localhost’ to studb.stuinfo on select,insert 18. 对于表TA(tel,net,?),其中tel为手机号,net为订购的上网流量套餐,如50M、100M等,若未订购则为空。为了分析客户上网对客户总费用的影响情况,下列哪种对空值的处理
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说教育文库CDA题库(3)在线全文阅读。
相关推荐: