(ICTCLAS系统工作示意图)
该系统具有中文分词、词性标注、未登录词语识别等功能,经专家组评侧,该系统词性标注处理速度接近32KB/S,分词正确率高达97.58%,中国人名字的识别召回率接近98%[4]。同时,中科院也公布了该系统的基于C++语言的开发接口。使得中文搜索引擎的开发获得了非常有效的中文语句分解工具。
研究智能检索技术的目的是为了解决丰富的信息资源和低效的信息获取手段之间的矛盾,目标是从关键词的智能化选择、检索范围的确定到检索结果的精炼逐一求精,尽可能提高WEB搜索的查全率和查准率。对于提高网络信息资源利用率、增强网络建设的经济效益和社会效益有着非常积极的意义,正因于此,基于WEB的主题搜索技术的发展和演进,已成为有效开启互联网络知识宝库的关键之匙。
参考文献:
[1] 崔维梅.范荣鹏.搜索引擎的技术现状和热点[J].青年记者2005,(15):116~117
[2] 刘平冰 电子电子科技大学硕士学位论文[A]. 2005(5):7~9
[3] Yatin Chawathe,Eric A Brewer.System support for saclabel and fault tolerant Internet
service.Distributed Systems Engineering [M] 2001.7
[4] 杨德仁.顾君忠 一种知识型网络爬虫的设计与实现[J].华东师范大学学报 2006,(3):93~94
[5] 彭曙蓉.王耀南 针对小文本的WEB数据挖掘技术及其应用[J].微计算机信息 2006,(22):73~75
[6] 李刚.宋伟.邱哲 Ajax+Lucece 构建搜索引擎 [M].2006.4
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说计算机基于WEB的智能搜索应用技术探讨(4)在线全文阅读。
相关推荐: