77范文网 - 专业文章范例文档资料分享平台

FAST企业智能化海量信息搜索方案 - 图文

来源:网络收集 时间:2020-04-17 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:或QQ: 处理(尽可能给您提供完整文档),感谢您的支持与谅解。点击这里给我发消息

XXXXX 企业搜索平台建议书

微软(中国)有限公司上海分公司

2009/4/20

目 录

一、项目背景 二、项目软硬件配置

2.1 运行平台软件配置 2.2 运行平台硬件配置

三、XXXXX企业搜索平台设计

3.1 总体目标

建设企业信息仓库 提供最好的搜索功能 3.2搜索平台总体架构

3.3提供最好的搜索功能(Best Search Technology) 实现文档级的安全搜索

搜索条件输入框的自动提示功能(Autocompletion) 可调整的相关性排序(Tunable Relevency) 实体提炼(Customizable Entity Extraction) 自动分类 自动聚类

先进的语言学处理功能 高亮度显示和直达功能 关键字

动态导航和动态钻取 搜索管理

四、企业搜索平台功能概要

搜索

搜索功能

搜索结果处理

索引

产品的索引机制?

产品是否支持增量式的索引更新?如果是,如何实现? 产品支持哪些类型的文档?

产品是如何处理和文档相关的元数据的? 产品如何支持XML文档的索引?

同一个引擎能否支持多个数据源的索引和搜索? 产品是否同时支持对文档的索引和检索? 索引的大小有限制吗?请详细解析。

4 5

5 5

8

8 8 8 9 11 11 12 12 14 17 17 17 18 18 18 18

22

22 22 26 29 29 30 30 34 34 34 34 34

索引的文档数量有限制吗?请详细解释。 网路信息采集 提醒功能 管理和监测 管理工具

集成和客户化 集成

客户化与编程接口 安全性

应用安全 管理安全性 技术规格 平台支持 基本架构 部署和运作 可伸缩性 性能指标 可用性

国际化支持

附件 一 FAST ESP?系统架构

相关性 架构

可扩展性和性能 管理

附件 二FAST服务与培训? 附件 三FAST 背景

35 35 36 36 36 38 38 39 41 41 42 42 42 43 45 45 45 45 45

46

50 51 53 54

58 60

一、项目背景

企业员工都在努力工作使业务获得更大发展,当他们需要那些可以公开获取的信息时,他们知道如何通过互联网的搜索引擎找到.但是,当他们需要跟集团业务相关的知识时,他们需要的是企业搜索平台.。

客户和供应商使用XXXXX的门户网站搜索XXXXX相关的产品,服务和数据 。

因此,XXXXX需要建立一套系统,能让使用者非常简单和方便地得到所需要的信息和知识,同时又需要符合IT管理上的安全性和可管理性

FAST根植于挪威,自1997年以来多年来专注于企业级中文信息挖掘领域,在中文语义分析、中文信息挖掘、人工智能、海量信息处理等方面一直处于业界的领先水平。本案利用FAST的独特技术,向XXXXX集团建议增加营业收入和提高企业生产力的基于信息搜索平台的先进的商业运作理念的信息系统。

FAST希望与XXXXX集团分享以往我们在信息系统建设中的一点经验,愿意投入充分的技术力量参与信息系统建设。为XXXXX系统建设贡献一份力量。

二、项目软硬件配置

2.1 运行平台软件配置

操作系统: Windows

企业搜索平台软件:FAST Enterprise Search Platform (ESP) ESP软件包括: FAST ESPTM Key characteristics: ? ? ―On-the-fly‖ data indexing; incremental document indexing Advanced query capabilities including proximity operators, multiple query terms, wild cards, inclusion/exclusion operators, text/integer/Boolean expressions, parametric search and search hit in context Developer’s SDK’s and APIs for customizing document access, query- and result-processing, administration and presentation ? Advanced linguistics for any available language Web Crawler & File Traverser FAST JDBC Connector Search Business Center ? Configurable web crawler for indexing of documents retrieved from web servers, including HTML, PDF, XML, and 225+ other data formats FAST Security Access Module (SAM) FAST In-document Highlighting Categorization & Clustering Live Analytics and Navigation TMSupporting retrieval of searchable data from any JDBC compliant database Graphical tool for managing dictionaries, reporting, as wewll as controlling the ranking of results, optimization of ranking based on business requirements – including absolute and relative boosting – and analysis of query logs The Document Hit Highlighting feature enables you to create a search application where the end-user may browse through the query hits within the full context of a matching document. Automatic document classification into pre-defined categories, dynamic supervised and unsupervised results clustering Dynamic drill-down within results sets based on specified parameters (product attributes, geography, etc.). Support for full-text and multi-level sorting

2.2 运行平台硬件配置

单台机配置: (4 CPUs / 8G RAM / 15,000 RPM HDD / RAID)

节点数: 2台服务器 (Full fail-over mode)

系统逻辑结构图:

百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库FAST企业智能化海量信息搜索方案 - 图文在线全文阅读。

FAST企业智能化海量信息搜索方案 - 图文.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印 下载失败或者文档不完整,请联系客服人员解决!
本文链接:https://www.77cn.com.cn/wenku/zonghe/979963.html(转载请注明文章来源)
Copyright © 2008-2022 免费范文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ: 邮箱:tiandhx2@hotmail.com
苏ICP备16052595号-18
× 注册会员免费下载(下载后可以自由复制和排版)
注册会员下载
全站内容免费自由复制
注册会员下载
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: