随着因特网的迅猛发展、WEB信息的高速膨胀,以及搜索引擎服务的普及,如何从海量的资料中更精准地找到所需的信息,已被公认为是下一代搜索技术的竞争要点,智能化、个性化以及行业化成为未来搜索引擎的发展趋势。
另一方面,还有约占信息总量80%的信息存在于企业和组织的内部,利用搜索技术和搜索模式整合企业和组织内外部信息资源,拓展和发掘新型的搜索服务,建立企业级搜索引擎也已经成为信息化建设的热点话题。
DOWNET 搜索引擎的应用与价值
目前,国内最大的搜索和内容管理技术提供商DOWNET公司在全文检索、自然语言理解、分布式采集、智能化信息处理、信息个性化服务等方面有着深厚的技术积累和应用实践。DOWNET 搜索引擎相关产品已成为搭建智能化、个性化和企业级搜索引擎的优选平台。
DOWNET 搜索引擎应用包括:构建行业或地方智能搜索引擎、企业搜索引擎以及站内检索等。
DOWNET 搜索引擎架构
DOWNET公司推出的搜索引擎解决方案,利用DOWNET公司业界领先的成熟的全文数据库管理系统DOWNET Database Server作为搜索引擎服务的核心平台,辅以各种数据抓取工具,配套数据内容加工、管理和分发服务模块,构建出一个完整的、能够索引互联网及组织内外各类信息资源的、提供安全分级授权、个性化体验的智能、精确、高效的搜索引擎系统。
DOWNET搜索引擎功能简介
内容实时发现索引
在搜索引擎服务中,首先需要解决如何实时采集和索引大量的多种格式、多种介质形态、多种存储方式的异构内容信息。
DOWNET针对各种异构信息的来源和形式提供了一系列辅助处理工具:
DOWNET网络信息雷达系统(DOWNET InfoRadar)
采用高效的网络搜索技术,监控和采集互联网信息,支持智能分类、自动排重和灵活发布,实现海量网络信息的高效采集、组织。并将采集和分析处理好的数据实时提交到搜索引擎平台服务器DOWNET Database Server中。
DOWNET结构化数据检索网关(DOWNET Gateway for RDBMS)
DOWNET针对系列主流关系型数据库和NOTES检索网关模块,能够将应用中的数据实时地索引到搜索引擎平台服务器DOWNET Database Server中。
DOWNET 数据处理工具(DOWNET DataProcessor)
可对已经DOWNET Database Server数据进行多层次的智能增值加工处理,也可以将文档系统中的信息以灵活方便的方式索引到搜索引擎平台服务器DOWNET Database Server中。
内容海量安全管理
最新版DOWNET 搜索引擎平台服务器DOWNET Database Server 5.0除了具有高效全文检索的功能外,面向搜索引擎服务和信息资源建设的新兴需求,还提供了包括Native XML支持, 集群服务架构,Unicode多语言支持,基于自然语言的智能检索等诸多新功能,特别是DOWNET领先的结构化和非结构化数据联合查询技术,极大地满足了用户搭建搜索引擎应用的专业需求。
同时,DOWNET 搜索引擎平台服务器能提供多种安全机制管理,为安全搜索奠定了坚实基础。
内容智能个性搜索
DOWNET 搜索引擎平台服务器汇聚了DOWNET公司多年在中文智能处理方面的研究成果和多种中文智能处理技术,如智能分词,字词索引结合、主题词表概念扩展等技术的应用,极大地保障了信息查全率和查准率。
内容挖掘分析利用
搜索引擎提供的搜索服务只是内容利用的开始,DOWNET基于应用统计学、自然语言处理和人工智能的最新研究成果,应用智能信息过滤和文本挖掘技术研发而成的DOWNET CKM中文知识挖掘基础件,实现了信息的自动分类、摘要、排重、聚类、敏感词过滤分析等功能,帮助用户以搜索引擎所整合的内容为起点,高效地获取新的知识发现和利用价值。
DOWNET搜索引擎的优势特点
海量信息采集和存储,支持分布式管理、多服务器集群和协作
DOWNET是国内唯一成功的在实际客户处部署了多服务器集群采集和检索系统,处理数千万和上亿条记录的信息的厂商,从而保证了海量信息处理的效率、稳定性和可靠性。
智能信息处理-基于语义理解的文本挖掘技术
DOWNET搜索引擎, 全面内嵌了DOWNET实用文本挖掘技术,使得搜索结果的处理更具智能化,结果相关度更强,排序更合理,使得用户更加迅速、准确、全面的定位目标信息。
一个平台两种应用-融合企业搜索和互联网搜索技术为一体
由于互联网搜索和企业搜索的应用目标不同,所以两者有着不同的应用特点,比如:企业搜索的对象异构和多样、安全性要求更高、检索的准确性和相关性要求更强等。DOWNET 搜索引擎融合企业搜索和互联网搜索技术为一体, 在一种平台上可以实现了两种应用。
智能全文检索-查全和查准的完美结合
传统的搜索引擎采用“预估”的检索策略,保证不了检索结果的全面性, DOWNET 搜索引擎借助中文处理技术、文本挖掘技术、索引技术等实现了查全和查准的完美结合,在保证查全率的同时,提高了信息的查准率。