XXXXX 企业搜索平台建议书
微软(中国)有限公司上海分公司
2009/4/20
目 录
一、项目背景 二、项目软硬件配置
2.1 运行平台软件配置 2.2 运行平台硬件配置
三、XXXXX企业搜索平台设计
3.1 总体目标
建设企业信息仓库 提供最好的搜索功能 3.2搜索平台总体架构
3.3提供最好的搜索功能(Best Search Technology) 实现文档级的安全搜索
搜索条件输入框的自动提示功能(Autocompletion) 可调整的相关性排序(Tunable Relevency) 实体提炼(Customizable Entity Extraction) 自动分类 自动聚类
先进的语言学处理功能 高亮度显示和直达功能 关键字
动态导航和动态钻取 搜索管理
四、企业搜索平台功能概要
搜索
搜索功能
搜索结果处理
索引
产品的索引机制?
产品是否支持增量式的索引更新?如果是,如何实现? 产品支持哪些类型的文档?
产品是如何处理和文档相关的元数据的? 产品如何支持XML文档的索引?
同一个引擎能否支持多个数据源的索引和搜索? 产品是否同时支持对文档的索引和检索? 索引的大小有限制吗?请详细解析。
4 5
5 5
8
8 8 8 9 11 11 12 12 14 17 17 17 18 18 18 18
22
22 22 26 29 29 30 30 34 34 34 34 34
索引的文档数量有限制吗?请详细解释。 网路信息采集 提醒功能 管理和监测 管理工具
集成和客户化 集成
客户化与编程接口 安全性
应用安全 管理安全性 技术规格 平台支持 基本架构 部署和运作 可伸缩性 性能指标 可用性
国际化支持
附件 一 FAST ESP?系统架构
相关性 架构
可扩展性和性能 管理
附件 二FAST服务与培训? 附件 三FAST 背景
35 35 36 36 36 38 38 39 41 41 42 42 42 43 45 45 45 45 45
46
50 51 53 54
58 60
一、项目背景
企业员工都在努力工作使业务获得更大发展,当他们需要那些可以公开获取的信息时,他们知道如何通过互联网的搜索引擎找到.但是,当他们需要跟集团业务相关的知识时,他们需要的是企业搜索平台.。
客户和供应商使用XXXXX的门户网站搜索XXXXX相关的产品,服务和数据 。
因此,XXXXX需要建立一套系统,能让使用者非常简单和方便地得到所需要的信息和知识,同时又需要符合IT管理上的安全性和可管理性
FAST根植于挪威,自1997年以来多年来专注于企业级中文信息挖掘领域,在中文语义分析、中文信息挖掘、人工智能、海量信息处理等方面一直处于业界的领先水平。本案利用FAST的独特技术,向XXXXX集团建议增加营业收入和提高企业生产力的基于信息搜索平台的先进的商业运作理念的信息系统。
FAST希望与XXXXX集团分享以往我们在信息系统建设中的一点经验,愿意投入充分的技术力量参与信息系统建设。为XXXXX系统建设贡献一份力量。
二、项目软硬件配置
2.1 运行平台软件配置
操作系统: Windows
企业搜索平台软件:FAST Enterprise Search Platform (ESP) ESP软件包括: FAST ESPTM Key characteristics: ? ? ―On-the-fly‖ data indexing; incremental document indexing Advanced query capabilities including proximity operators, multiple query terms, wild cards, inclusion/exclusion operators, text/integer/Boolean expressions, parametric search and search hit in context Developer’s SDK’s and APIs for customizing document access, query- and result-processing, administration and presentation ? Advanced linguistics for any available language Web Crawler & File Traverser FAST JDBC Connector Search Business Center ? Configurable web crawler for indexing of documents retrieved from web servers, including HTML, PDF, XML, and 225+ other data formats FAST Security Access Module (SAM) FAST In-document Highlighting Categorization & Clustering Live Analytics and Navigation TMSupporting retrieval of searchable data from any JDBC compliant database Graphical tool for managing dictionaries, reporting, as wewll as controlling the ranking of results, optimization of ranking based on business requirements – including absolute and relative boosting – and analysis of query logs The Document Hit Highlighting feature enables you to create a search application where the end-user may browse through the query hits within the full context of a matching document. Automatic document classification into pre-defined categories, dynamic supervised and unsupervised results clustering Dynamic drill-down within results sets based on specified parameters (product attributes, geography, etc.). Support for full-text and multi-level sorting
2.2 运行平台硬件配置
单台机配置: (4 CPUs / 8G RAM / 15,000 RPM HDD / RAID)
节点数: 2台服务器 (Full fail-over mode)
系统逻辑结构图:
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库FAST企业智能化海量信息搜索方案 - 图文在线全文阅读。
相关推荐: