600275 2005-07-04 600275 2005-07-05 600275 2005-07-06 600296 2005-07-27 600328 2005-07-20 600350 2005-07-12 600350 2005-07-13 600350 2005-07-20 600350 2005-07-21 600356 2005-07-22 600356 2005-07-25 600356 2005-07-28 600356 2005-07-29 600365 2005-07-11 600396 2005-07-28 600399 2005-07-07 600399 2005-07-08 600420 2005-07-18 600420 2005-07-19 600420 2005-07-20 600420 2005-07-21 600444 2005-07-01 600486 2005-07-04 600520 2005-07-21 600555 2005-07-28 600587 2005-07-08 600616 2005-07-19 600626 2005-07-19 600626 2005-07-20 600626 2005-07-21 600649 2005-07-19 600681 2005-07-12 600711 2005-07-29 600740 2005-07-25 600771 2005-07-15 600777 2005-07-01 600777 2005-07-04 600802 2005-07-06 600828 2005-07-07 600828 2005-07-08 600828 2005-07-11 600832 2005-07-05 600863 2005-07-05 600893 2005-07-01 2.03 2.03 2.03 3.88 4.78 4.50 4.50 4.50 4.50 6.40 6.40 6.40 6.40 3.74 4.80 3.90 3.90 7.40 7.40 7.40 7.40 5.85 6.98 3.43 2.80 4.22 9.19 2.28 2.28 2.28 4.78 1.01 5.45 7.08 3.97 3.00 3.00 2.08 3.09 3.09 3.09 13.39 3.50 3.32
600893 2005-07-04 3.32 600893 2005-07-05 3.32 600894 2005-07-04 2.22 600988 2005-07-14 3.83 900925 2005-07-04 0.37 900955 2005-07-12 0.32 900955 2005-07-13 0.32 900955 2005-07-14 0.32 900957 2005-07-20 0.11 ; run;
33. 空格和全半角字符问题的解决方法。
通常从其他数据源得到的数据的格式并不会和我们所要求的一致,而且更严重的问题是,不同的数据源的数据在股票名称的写法上有着很大的差别。有的把A写成全角的,还有些数据源在股票名称中间加入数量不等的空格,如000002股票中,?万?字和?科?字中间有两个空格,而在000006股票中,?星?和?源?之间为一个空格。随着现在股权分置改革的推进,又出现了以G开头的股票,同样面临着全角和半角的G的问题。 为了统一数据库,需要将所有股票名称中间的空格都去除,并且将所有全角的字符换成半角的字符,如000002的?万 科A?需要改成 ?万科A?等等。 例如: A股代码 … 000001 000002 000003 000004 000005 000006 000007 000008 000009 000010 000011 000012 … A股名称 … 深发展A 万 科A PT金田A 国农科技 ST 星 源 深振业A 深达声A 宝 利 来 深宝安A 深 华 新 深物业A 南 玻A … B股代码 … 200002 200003 200011 200012 … B股名称 … 万 科B PT金田B 深物业B 南 玻B … 创建样本数据集:
data example2 (label='例2:空格和全半角字符问题的解决方法例题'); length a_stkcd $6. a_stknm $12. b_stkcd $6. b_stknm $12.; input a_stkcd $6. a_stknm $12. b_Stkcd $6. b_stknm $12.; format a_stkcd $6. a_stknm $12. b_stkcd $6. b_stknm $12.;
label
A_Stkcd=\股代码|Stock Code for A Shares\ A_Stknm=\股名称|Stock Name for A Shares\ B_Stkcd=\股代码|Stock Code for B Shares\ B_Stknm=\股名称|Stock Name for B Shares\cards;
000001 深发展A 000002 万 科A 000003 PT金田A 000004 国农科技 000005 ST 星 源 000006 深振业A 000007 深达声A 000008 宝 利 来 000009 深宝安A 000010 深 华 新 000011 深物业A 000012 南 玻A 000013 *ST石化A 000014 沙河股份 000015 PT中浩A 000016 深康佳A 000017 *ST中华A 000018 深中冠A 000019 深深宝A 000020 *ST华发A 000021 深科技A 000022 深赤湾A 000023 深天地A 000024 招商地产 000025 ST特力A 000026 飞亚达A 000027 深能源A 000028 一致药业 000029 深深房A 000030 ST盛润A 000031 深宝恒A 000032 深桑达A 000033 新都酒店 000034 ST 深 泰 000035 *ST 科健 000036 华联控股 000037 深南电A 000038 深大通A 200002 万 科B 200003 PT金田B 200011 深物业B 200012 南 玻B 200013 *ST石化B
200015 PT中浩B 200016 深康佳B 200017 *ST中华B 200018 深中冠B 200019 深深宝B 200020 *ST华发B 200022 深赤湾B 200024 招商局B 200025 ST特力B 200026 飞亚达B 200028 一 致B 200029 深深房B 200030 ST盛润B 200037 深南电B
000039 中集集团 200039 中 集B 000040 深鸿基A 000042 深长城A 000043 深南光A 000045 深纺织A 200045 深纺织B 000046 光彩建设 000047 ST 中 侨 000048 康达尔A 000049 德赛电池 000050 深天马A 000055 方 大A 200055 方 大B 000056 深 国 商 200056 深国商B 000058 深 赛 格 200058 深赛格B 000059 辽通化工 000060 中金岭南 000061 农 产 品 000062 深圳华强 000063 中兴通讯 000065 北方国际 000066 长城电脑 000068 赛格三星 000069 华侨城A ; run;
34. 将同一个公司的A,B股合并。
在处理公司信息表的时候,通常我们会遇到数据源将同一公司的A,B股分开处理,并写成两条观测的情形。如公司代码为C000002的股票,在这里是以两条记录的形式记录下了该公司发行了A股和B股的情况,在公司信息表中,需要将其整合成一条信息,并分别以A,B股的名称和形式来表示。而且有的公司先发行A股,有的公司却是先发行B股,这也是需要注意的问题。
原始样式: 公司代码 … 日期 … 公司中文名称 … 深圳发展银行股份有限公司 万科企业股份有限公司 万科企业股份有限公司 金田实业(集团)股份有限公司 金田实业(集团)股份有限公司 深圳世纪星源股份有限公司 股票代码 股票名称 股票类型 000001 000002 200002 深发展A 万科A 万科B … A A B B A A A C000001 2005-05-18 C000002 2000-08-15 C000002 2005-06-21 C000003 2000-08-29 C000003 2004-04-30 C000005 2005-05-27 200003 PT金田B 000003 PT金田A 000004 国农科技 000005 ST星源 C000004 2005-07-09 深圳中国农大科技股份有限公司 C000006 2005-05-19 C000007 2005-07-30 C000008 2005-05-21 … …
最终需要形成的样式: 公司代码 深圳市振业(集团)股份有限公司 深圳市赛格达声股份有限公司 广东宝利来投资股份有限公司 … 000006 000007 000008 深振业A 深达声A 宝利来 A A A … 公司中文名称 日期 股票代A股名A股B股名B股股 码 称 股 称 票代码 票代码 A A 万科B … B B B … 000001 深发展A 200002 万科A … … … 深圳发展银行股份有限公司 万科企业股份有限公司 C000001 2005-05-18 C000002 2005-06-21 C000003 2004-04-30 金田实业(集团)股份有限公司 000003 PT金田A C000004 2005-07-09 深圳中国农大科技股份有限公司 000004 国农科技 C000005 2005-05-27 深圳世纪星源股份有限公司 C000006 2005-05-19 深圳市振业(集团)股份有限公司 000006 深振业A C000007 2005-07-30 深圳市赛格达声股份有限公司 000007 深达声A C000008 2005-05-21 广东宝利来投资股份有限公司 000008 宝利来 C000009 2005-07-01 C000010 2005-07-22 中国宝安集团股份有限公司 深圳市华新股份有限公司 000009 深宝安A 000010 深华新 A PT金田B A 深物业B 000005 ST星源 A A A A A A A C000011 2005-06-29 深圳市物业(发展)集团股份有限000011 深物业A 公司 … … … 创建样本数据集
data example3 (label='例3:同一个公司A,B股合成一条记录例子');
input comcd $10. Date: yymmdd10. Comchnm:$100. stkcd:$6. stknm:$12. stktype:$1.; format Date yymmdd10.; label
Comcd=\公司代码|Company Code\ Date=\日期|Date\ Comchnm=\公司中文全称|Company's Chinese Name - Header\ Stkcd=\股票代码|Stock Code \
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库SAS数据处理综合练习题(7)在线全文阅读。
相关推荐: