书籍基本信息:
书籍名称:Internet主题搜索引擎设计与研究
ISBN:9787508495781
作者:梁春燕(著)
出版社:中国水利水电出版社
出版时间:2012-3
电子书格式:pdf
内容简介:
本书以化学化工领域为例,设计了一个完整的主题搜索引擎系统,并基于专业知识库,研究了专业化爬行器、索引和检索的相关策略,以及多语言自动分类技术和个性化技术。这些技术的运用使得主题搜索引擎能够提供更智能化、专业化和个性化的检索服务,更好地满足专业用户的信息需求。
书中首先对Internet搜索引擎进行概述,然后介绍了Internet主题搜索引擎的总体设计和规划,并对其中主要模块的功能和实现思路进行了描述。
接着,书中详细阐述了主题搜索引擎的爬行策略以及检索和排序策略,包括主题爬行器的实现策略、基于倒排索引的关键词检索的实现策略、基于网络链接结构分析的网页评价算法及其对排序的影响。
最后,作者提出了一种适用于专业主题搜索引擎的基于专业词典的多语言自动分类方法,并通过专业数据集对该方法进行测试,验证了其有效性。
内容提要:
随着网络的普及和发展,Internet已经成为信息交流和共享的重要媒介。由于网络的飞速发展,Internet上的信息量始终保持着“爆炸式”的增长,这给用户从海量信息中获取有用、高质量的信息带来了挑战。
主题搜索引擎或者垂直搜索引擎是一种分类精确细致、更新及时的搜索引擎,是搜索引擎的细分和延伸。相对通用搜索引擎的信息量大、查询不准确、深度不够等问题,主题搜索引擎以其“专、精、深”的特点,具有行业色彩。
本书在继承国内外相关研究成果的基础上,以化学化工领域为例,研究在专业知识库的基础上,自动收集和索引Internet专业资源并进行智能处理和智能检索的方法,旨在建立Internet专业主题搜索引擎。
为了适应用户信息需求的个性化特点,本书研究了个性化检索的具体实现策略。通过建立用户兴趣模型,获取网页的用户兴趣信息,并使之与网页的查询相关度和链接重要性相结合,来优化检索结果的排序。
文章精选语句:
搜索引擎作为网络上进行信息检索的工具,随着网络的发展,在不断地发展变化。从最初的Archie到现在的Google,搜索引擎技术经历了多次革新,每一次技术的突破都极大地提高了用户的检索效率和体验。
本书详细介绍了搜索引擎的基本原理和相关技术,包括网络信息收集、网络信息索引、网络信息检索等,这些技术是搜索引擎能够高效运行的基础。
在探讨了搜索引擎的基本技术之后,书中进一步深入研究了主题搜索引擎的爬行策略、检索和排序策略,这些策略的优化对于提升搜索引擎的性能至关重要。
最后,书中对专业信息的自动分类和个性化检索进行了深入探讨,这些技术的应用使得搜索引擎能够更好地理解和满足用户的个性化需求。
目录:
第1章 Internet搜索引擎概述
第2章 Internet主题搜索引擎的总体设计
第3章 Internet主题搜索引擎的信息收集和索引
第4章 Internet主题搜索引擎的检索和排序
第5章 专业信息的自动分类
第6章 Internet主题搜索引擎的个性化检索
第7章 Internet主题搜索引擎的展望