李自金[1](2016)在《元搜索引擎的结果合成算法研究》文中认为搜索引擎为用户进行信息检索提供了很大的便利,但是研究表明,搜索引擎的资源覆盖率还是不能满足需求,而且在准确率方面也有待提高。元搜索引擎集成了多个独立的搜索引擎,它调用其成员搜索引擎来完成用户检索,最后统一处理返回的结果集,在一定程度上解决了搜索引擎存在的一些问题,得到了广泛使用。目前,有关元搜索引擎的核心技术研究有检索请求的分析与转换,成员引擎的调度算法,检索结果的合成算法等。本文的研究重点是元搜索引擎的结果合成机制,针对结果合成机制中的网页去重和结果融合排序两大部分进行了研究。结果去重和排序对元搜索引擎的性能非常重要,而现在有关元搜索引擎的去重和排序还存在许多不足之处,本文针对这些问题进行研究,论文的主要工作有:(1)本文系统性地研究了搜索引擎与元搜索引擎的体系结构及工作原理,并且对各自的国内外研究现状做了分析,并详细介绍了元搜索引擎的关键技术。(2)针对现有的搜索引擎与元搜索引擎中常用的网页去重算法进行了比较分析,研究了其优缺点,结合元搜索引擎的结果返回特点,提出利用返回结果的URL、标题和摘要的来去重的算法,并针对URL、标题和摘要各自的特点提出了不同的判别方法,使得去重算法更准确。(3)研究了元搜索引擎中经典的检索结果排序算法,对不同的排序算法的优缺点进行了分析总结,重点研究了 Borda投票排序法,针对Borda排序的不足,提出了结合位置关系与查询相似度的改进算法,并对结果位置的规范化方法和相似度计算方法进行了改进。(4)提出了一个元搜索引擎系统原型,在此系统之上对提出的去重算法和排序算法做了相应的实验,对实验结果进行了分析,验证了算法的性能。论文的最后对全文进行了总结,全面总结了本文的主要工作,创新点以及实验的过程,并对元搜索引擎的发展方向及以后的研究问题进行了阐述。
周承璐[2](2015)在《智能化元搜索引擎中多Agent系统架构的研究与实现》文中认为随着互联网中信息量的不断增长,搜索引擎已经成为人们快速获取有效信息的重要手段,是人们日常生活中必不可少的工具之一。但是单一搜索引擎能够检索到的信息量有限;而且有多种搜索引擎并且各有其擅长的领域;同时,随着垂直搜索引擎的出现,搜索引擎之间的差异更为明显。因此人们通常需要根据搜索目的选用不同搜索引擎,这降低了用户的信息检索效率。元搜索引擎为用户提供了统一的访问接口,综合处理与分析来自多个搜索引擎的结果。它既能减轻用户的负担,也能有效地提高检索结果的全面性。元搜索引擎正逐步往个性化、智能化发展:通过智能学习用户的个人兴趣,元搜索引擎在保证检索结果查全率的同时,也能提高其准确性。关于元搜索引擎及其相关技术的研究主要考虑如何进行自动的成员搜索引擎、采用更好的结果合成算法以及建立良好的系统框架支持,以使得元搜索引擎更好地达成目标。本文介绍元搜索引擎系统中多Agent系统架构的研究与实现。首先,本文分析了目前元搜索引擎中的研究内容及多Agent系统在元搜索引擎研究中的发展现状。然后对于本文相关的技术进行了概述与介绍,包括元搜索引擎的相关技术、Agent的相关理论以及本文所采用的JADE开发框架。接下来设计了基于Agent的元搜索引擎系统框架模型,详细介绍了如何将传统的Web应用与多Agent系统相结合机制及多Agent系统的设计过程,包括系统中各类Agent的结构设计、角色及能力定义以及生命周期中的行为模式。随后将本文的设计方案与成熟的多Agent系统开发框架JADE相结合,实现了元搜索引擎中的多Agent系统,同时也在已有成果的基础之上,丰富了元搜索引擎的结果处理方法,增加其个性化特性。对系统的测试表明,本文所设计的系统中各类Agent通过相互协作,完成系统中的各项任务。同时本文还对系统在检索结果的个性化排序方面也进行了测试,结果证明搜索结果能够具有一定的个性化特性,达到了预定的研究目标。
王俊[3](2014)在《基于Agent的智能元搜索引擎调度与结果合成》文中研究指明大数据环境下,网络数据过载与用户需求提升,在信息覆盖、智能服务方面传统搜索引擎往往表现出许多明显劣势。针对这些方面,智能化的元搜索引擎被提出来解决以上存在的问题,并得到了广泛的关注。本文将Agent技术引入元搜索引擎,重点研究其中的成员搜索引擎的自适应调度策略与检索结果的动态合成方法。本文给出了基于Agent的智能化元搜索引擎调度及结果合成的设计与实现。首先明确了当前搜索引擎及元搜索引擎存在的不足之处并对相关的国内外研究现状进行了剖析,然后在介绍实现相关功能所需要的理论与技术,如Agent、成员引擎调度与检索结果合成等的基础上,提出了智能化的元搜索引擎体系结构。接下来重点研究了成员搜索引擎的自适应调度策略,构造了搜索引擎能力模型,提出了基于概念格的初始评估方法与用户点击行为反馈评估相结合的搜索引擎能力评估方法,并给出了具体的成员搜索引擎动态自适应调度过程的实现。随后重点介绍了元搜索引擎结果动态合成方法,设计了基于结果位置、搜索引擎权重及用户兴趣三者结合的一种改进的结果合成排序方法。最后对成员引擎的调度及检索结果合成进行了实验,测试结果表明,在基于Agent的智能元搜索引擎框架下,本文提出的调度策略能动态自适应的进行调度,选择最符合用户意图的成员搜索引擎,检索结果的动态合成排序方法能明显提高信息覆盖率与搜索相关程度,并且使用户的搜索效率得到了保证。
许静静[4](2014)在《基于Agent的智能元搜索引擎群组推荐机制的研究》文中研究表明互联网数据已达海量规模,用户的信息查询要求不断提高,传统搜索引擎在大数据环境下的工作效率已不足以满足人们的信息需求,而元搜索引擎具有较高的信息覆盖率、且推荐服务可以将被动接受用户信息请求的模式转化为主动感知用户信息需求,因此,将元搜索引擎技术与推荐服务相结合可以为用户带来更好的信息搜索体验。但研究发现,目前与元搜索引擎和推荐技术相关的研究及应用存在诸多问题。本文在研究基于Agent的元搜索引擎智能化方法与技术过程中,研究了元搜索引擎中群组推荐机制的设计与实现;论文在介绍了Agent理论与技术、元搜索引擎技术、用户兴趣建模、及Web用户聚类内容的基础上,给出基于Agent的智能元搜索引擎系统平台的相关内容,主要包括系统工作模式、系统中各Agent的结构模型及其交互关系;并基于该系统平台,通过引入查询上下文和查询模板流图两个概念,研究并提出一种群组推荐机制;最后给出该机制实现过程中的关键内容。本文群组推荐功能的相关实验结果及分析表明,本文提出的基于Agent的智能元搜索引擎群组推荐机制可以有效为用户推荐相关查询内容和相关检索结果,该机制在查询推荐准确性和多样性方面均有所提高,达到了预定研究目标。
李磊[5](2013)在《个性化元搜索引擎关键技术的研究》文中研究指明随着互联网中信息量的快速增长,浩如烟海的信息世界具有无组织,分布广、结构复杂、动态变化等特点,搜索引擎作为信息检索工具成为人们生活中必不可少的一部分。独立搜索引擎的检索机制、算法、范围等的不同,导致同样一个检索请求在不同搜索引擎中的查询重复率很低,小于34%[1]。Lawrence[2]等研究表明,所有的搜索引擎策略中索引的Web页面都不超过页面总数的三分之一。因此,获得全面、准确、更符合用户需求的检索结果,就必须反复多次的调用不同独立搜索引擎进行检索,但是在查准率和查全率方面的缺点是独立搜索引擎与生俱来无法改变的事实。为了解决传统独立搜索引擎存在的以上问题,元搜索引擎技术应运而生。元搜索的出现使这些问题在一定程度上有所解决,这使得元搜索引擎得到了学术界广泛关注和迅速的发展。元搜索引擎整合了多个独立搜索引擎的搜索结果,在查全率方面有很大程度提高,但同时却暴露出大量重复冗余信息、噪声、系统查准率不高的新问题,并且元搜索引擎依然没有考虑用户个性因素,一个搜索请求适用于全部用户,搜索过程没有考虑用户个性因素,信息检索结果无法满足每位用户的个性化需求,这直接影响了用户信息检索的质量和效果。尽量减少不相关信息的干扰,并且快捷方便地检索用户需求的信息,是本课题所研究的内容,也是个性化元搜索引擎的最终目标。本论文中,较详细地描述了目前搜索引擎的发展现状和研究热点;并针对独立搜索引擎的不足之处,详细介绍了个性化搜索引擎的结构框架;在对个性化元搜索引擎的特点和基于用户模型的研究方法进行了深入研究分析的基础之上,改进了成员搜索引擎调度算法,提出了成员搜索引擎结果贡献量及多维排序中分块的概念,提出基于用户兴趣及检索词串和搜索结果的文本相关度的结果整合排序算法。论文的最后通过程序设计实现了个性化元搜索引擎系统,在该系统中对论文中所提出的算法进行了分析和实验,相比于一般元搜索引擎,查询显得更人性化,相比独立搜索引擎的查全率和查准率有着明显的提高,改善了用户的检索质量和检索体验。
赵飞宇[6](2013)在《基于随机行走赢/输图的新闻元搜索引擎聚合排序算法》文中指出互联网上信息的爆炸式增长令人们想要通过独立的搜索引擎获取自己所需要的信息越发的感觉力不从心,而元搜索引擎能够在很大程度上解决这个问题对于一个元搜索引擎来说,其排序算法的好坏是直接决定其性能优劣的关键技术本文提出了一种新的元搜索引擎结果聚合排序算法,即基于随机行走的赢/输图的排序算法,并将该算法运用于新闻元搜索引擎中该算法是根据Lin Li等人提出的用于独立搜索引擎的赢/输图的概念[1]所发展改进而来,它能够很好的对查询结果进行排序由于Lin Li等人提出的赢/输图方法中的竞争机制较为简陋,且存在一些缺陷,因此本文在改进该算法的同时对赢/输图中节点的竞争机制也进行了改进在赢/输图构建过程中本文针对图中节点的竞争提出了能量值的概念和一种新的竞争模型该模型是将各个节点模拟为参赛选手,并给与每一个节点一个能量值,比赛的过程就是节点之间的能量值传递交换的过程能量值越大的节点在图中越有影响力,表明该节点所代表的网页质量越高本文所提出的元搜索引擎结果聚合排序算法大致可分为两个步骤:首先对成员搜索引擎所返回的结果进行聚合,构建赢/输图,同时根据图中节点的赢输关系分步计算各节点的能量值;然后在赢/输图中以模拟随机行走的方式进行迭代计算各节点的最终排序值,直到所有的值都趋于稳定,第一步所计算的能量值在这个过程中起到了权重分配的作用在将这种算法运用到新闻元搜索引擎中时本文根据新闻的最重要的性质:时效性,将搜集的结果以其发布的时间分为3个级别:当天昨天至7天7天以上并分别对这3个级别的结果进行赢/输图构建和随机行走模拟然后按这3个级别的高低分成3段进行排序在本文的实验中,我们选取了10个查询主题并将他们发送给成员搜索引擎以获取查询结果在构建赢/输图时,本文分别以不同的竞争顺序来计算节点的能量值,并就由他们所得到的最终排序结果作对比分析,并得出了竞争顺序不会影响最终排序质量的结论最后本文介绍了几种排序评估算法并选取其中最有效的DCG评估算法[2,3]来对本文的实验进行评估,在实验中本文提出的算法与其他4种元搜索引擎排序算法进行了对比最后得出该算法在排序精确度上的确优于其他的4种算法,但是该算法比其他算法将会更为耗时
孙颖成[7](2013)在《基于Agent的智能元搜索引擎个性化功能的研究与实现》文中指出随着信息资源的不断膨胀及用户需求的不断提高,传统搜索引擎逐渐暴露出信息覆盖率低、智能化服务水平不足等方面的问题,能够有效提高信息检索覆盖率及准确率的智能化元搜索引擎因而被提出并得到广泛关注。本文重点研究基于Agent的智能元搜索引擎中的个性化功能,利用Agent技术优势实现用户兴趣的主动学习及检索结果的个性化过滤,为获得更高质量的检索结果提供支持。本文介绍了基于Agent的智能元搜索引擎中个性化功能的研究与实现。首先明确了目前搜索引擎存在的不足之处及国内外的相关研究,然后概述了个性化方法研究及功能实现所需的相关理论与技术。接下来提出了可解决目前搜索引擎不足的基于Agent的智能元搜索引擎体系结构,包括其框架模型、检索结果合成模型、Agent结构模型及Agent生命周期。随后着重研究了个性化功能的设计,给出了查询兴趣挖掘与查询语句分析过程,设计了基于公共兴趣黑板的群组推荐检索结果生成机制、基于动态学习的复杂查询识别机制及相关数据库。接下来给出了个性化功能具体实现,包括基于公共兴趣黑板的群组推荐检索结果生成机制的实现以及复杂查询语句识别方法的实现。针对检索结果相关性和复杂查询语句识别效果的测试结果表明,本文提出的基于Agent的智能元搜索引擎个性化功能可有效学习用户的查询兴趣,明显提高检索结果相关程度,较为准确地识别出复杂的查询语句,能够为提高用户信息检索效率提供充分支持。
张维华[8](2011)在《基于聚类的中文元搜索引擎技术研究》文中指出随着网络与通信技术的迅速发展,互联网上的信息资源数量急剧增加,搜索引擎作为网络信息检索的主要工具迅速产生并发展起来了。但是每个搜索引擎的设计,都有其特定的数据库索引范围、独特的功能和使用方法,以及预期的用户群。人们往往需要使用多种搜索引擎对搜索结果进行比较、筛选和相互印证。为了充分合理地利用已有的信息资源,建立在搜索引擎基础上的元搜索引擎目前已成为研究和开发的一个热点。现存的大多数元搜索引擎以线性列表的方式为用户返回结果,其规模仍然相当庞大,这使得用户可能用很多时间才能找到自己需要的结果,对检索结果进行聚类处理成为改进用户搜索体验的一个有效解决方案。本文首先对中文元搜索引擎相关的技术进行了研究,然后对后缀树聚类算法进行了探讨,并针对后缀树聚类算法的不足,提出适用于中文元搜索引擎的改进的后缀树聚类算法,本文将改进的后缀树聚类算法应用于中文元搜索引擎,开发出实现搜索结果聚类功能的中文元搜索引擎系统ISTCC系统。另外本文还设计了两个实验分别验证我们设计的改进的倒数排序法和改进的后缀树聚类算法的有效性。
王莎莎[9](2011)在《元搜索引擎结果合成技术的研究》文中进行了进一步梳理随着人们对检索效率和准确性的要求不断提高,单一的搜索引擎已经不能满足用户的需要。有时用户为了检索一个内容而要查找多个独立的搜索引擎,为了解决这个问题,元搜索引擎应运而生。元搜索引擎的信息覆盖率比独立搜索引擎大,检索范围广,但是元搜索引擎在检索结果合成方面还不尽人意。本文在综合分析元搜索引擎合成技术的基础上,对如何提高元搜索引擎的检索结果质量进行了深入的研究。首先,本文对元搜索引擎进行了概述,介绍了元搜索引擎的工作原理及体系结构、分类和特点;详细介绍了元搜索引擎的检索接口技术、成员搜索引擎调度策略、有效信息提取技术、检索结果整合技术等各种实现技术;以及介绍了元搜索引擎的局限性和未来的发展趋势。其次,在详细讨论了网页去重的相关理论基础及现有网页去重算法优、缺点后,针对元搜索引擎的特点,提出一种基于元搜索引擎的网页去重算法。该算法能有效去除检索结果中的重复网页。再次,对元搜索引擎结果排序算法进行了研究,提出基于网页质量和用户兴趣的元搜索结果排序算法。该算法改善了基于用户兴趣的结果合并算法,在其基础上引入了对网页质量的度量。最后,对提出的两种算法进行了仿真实验,以验证两种算法的有效性,从去重效果、正确率、召回率、平均准确率等方面分别分析讨论了所提出算法的性能。
刘丽[10](2011)在《元搜索引擎检索性能分析》文中研究表明以数据源、检索功能及检索结果为考察角度,分析了元搜索引擎的检索性能。
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
| 摘要 |
| Abstract |
| 第1章 绪论 |
| 1.1 论文的研究背景 |
| 1.2 论文的研究意义 |
| 1.3 国内外研究现状 |
| 1.4 论文主要研究内容 |
| 1.5 论文组织结构 |
| 第2章 元搜索引擎的相关理论 |
| 2.1 搜索引擎 |
| 2.1.1 搜索引擎的产生与发展 |
| 2.1.2 搜索引擎的原理 |
| 2.1.3 搜索引擎的分类 |
| 2.1.4 搜索引擎存在的问题 |
| 2.2 元搜索引擎 |
| 2.2.1 元搜索引擎的出现与发展 |
| 2.2.2 元搜索引擎的体系结构 |
| 2.2.3 元搜索引擎的分类 |
| 2.2.4 元搜索引擎与搜索引擎的区别 |
| 2.2.5 元搜索引擎的关键技术 |
| 2.3 本章小结 |
| 第3章 元搜索结果去重算法研究 |
| 3.1 引言 |
| 3.2 经典的网页去重算法 |
| 3.3 网页去重算法的的预处理 |
| 3.4 基于元搜索的网页去重算法 |
| 3.4.1 基于URL地址的判断 |
| 3.4.2 基于网页标题的相似度判断 |
| 3.4.3 基于网页摘要语句的相似度判断 |
| 3.4.4 网页相似度的计算 |
| 3.5 本章小结 |
| 第4章 查询结果排序算法的研究 |
| 4.1 引言 |
| 4.2 典型的查询结果排序算法 |
| 4.3 传统的Borda排序算法模型 |
| 4.4 基于Borda排序算法的改进算法 |
| 4.4.1 查询结果在搜索引擎中的位置规范化 |
| 4.4.2 查询结果与用户查询的全局相似度 |
| 4.4.3 查询结果的相关得分计算 |
| 4.4.4 查询结果的最终Borda分值计算 |
| 4.5 本章小结 |
| 第5章 原型系统设计与实验分析 |
| 5.1 系统总体框架设计 |
| 5.2 系统功能模块划分 |
| 5.3 基于元搜索的去重算法实验 |
| 5.3.1 数据集的构建 |
| 5.3.2 评价方法 |
| 5.3.3 实验结果分析 |
| 5.4 基于Borda排序的改进型算法实验 |
| 5.4.1 数据集的构建 |
| 5.4.2 评价方法 |
| 5.4.3 实验结果分析 |
| 5.5 本章小结 |
| 结论 |
| 参考文献 |
| 攻读硕士学位期间发表的论文和取得的科研成果 |
| 致谢 |
| 摘要 |
| ABSTRACT |
| 缩略语对照表 |
| 第一章 绪论 |
| 1.1 研究背景与意义 |
| 1.2 国内外研究现状 |
| 1.2.1 典型的元搜索引擎系统 |
| 1.2.2 基于Agent的元搜索引擎系统架构 |
| 1.3 论文工作内容 |
| 1.4 本文组织结构 |
| 第二章 理论基础与关键技术 |
| 2.1 元搜索引擎技术 |
| 2.2 Agent相关理论与技术 |
| 2.3 JADE框架 |
| 2.3.1 JADE基本架构 |
| 2.3.2 Agent的生命周期 |
| 2.3.3 Agent的交互机制 |
| 2.4 本章小结 |
| 第三章 元搜索引擎中多Agent系统结构的设计 |
| 3.1 元搜索引擎系统目标分析 |
| 3.2 系统框架模型 |
| 3.3 Agent模型设计 |
| 3.3.1 接口Agent |
| 3.3.2 用户个性化Agent |
| 3.3.3 调度管理Agent |
| 3.3.4 结果合成Agent |
| 3.3.5 系统推荐Agent |
| 3.4 本章小结 |
| 第四章 元搜索引擎中多Agent系统的实现 |
| 4.1 多Agent系统初始化模块的实现 |
| 4.2 Agent模型及相关支撑环境的实现 |
| 4.2.1 接口Agent的实现 |
| 4.2.2 用户个性化Agent的实现 |
| 4.2.3 调度管理Agent的实现 |
| 4.2.4 结果合成Agent的实现 |
| 4.2.5 系统推荐Agent的实现 |
| 4.3 本章小结 |
| 第五章 实验测试与分析 |
| 5.1 实验目的 |
| 5.2 实验环境 |
| 5.3 实验过程及结果分析 |
| 5.3.1 系统功能测试结果分析 |
| 5.3.2 系统性能测试结果分析 |
| 5.4 本章小结 |
| 第六章 总结与展望 |
| 6.1 本文工作总结 |
| 6.2 后续工作展望 |
| 参考文献 |
| 致谢 |
| 作者简介 |
| 摘要 |
| ABSTRACT |
| 第一章 绪论 |
| 1.1 研究背景及意义 |
| 1.2 国内外研究现状与分析 |
| 1.2.1 典型的元搜索引擎 |
| 1.2.2 基于Agent的元搜索引擎体系结构 |
| 1.2.3 成员搜索引擎调度策略 |
| 1.2.4 检索结果合成方法 |
| 1.3 研究目标与内容 |
| 1.4 论文组织结构 |
| 第二章 相关技术概述 |
| 2.1 Agent理论与技术 |
| 2.2 元搜索引擎技术 |
| 2.3 搜索引擎调度相关技术 |
| 2.4 元搜索引擎结果合成相关技术 |
| 2.4.1 去无效链接与去重 |
| 2.4.2 结果合成排序算法 |
| 2.5 本章小结 |
| 第三章 基于Agent的智能元搜索引擎体系结构 |
| 3.1 系统框架模型 |
| 3.2 系统Agent结构模型 |
| 3.3 智能元搜索引擎工作模式 |
| 3.4 本章小结 |
| 第四章 成员搜索引擎的自适应调度策略的设计与实现 |
| 4.1 调度管理Agent模型 |
| 4.2 成员搜索引擎变化感知与学习策略 |
| 4.3 搜索引擎能力模型的构造 |
| 4.4 基于评分与反馈机制的搜索引擎能力评估的实现 |
| 4.4.1 基于概念格的搜索引擎能力的初始评估方法实现 |
| 4.4.2 基于用户点击行为反馈的搜索引擎能力的评估方法实现 |
| 4.5 成员搜索引擎动态自适应调度过程的设计实现 |
| 4.6 本章小结 |
| 第五章 元搜索引擎结果合成机制的设计与实现 |
| 5.1 检索合成Agent模型 |
| 5.2 检索结果合成方法 |
| 5.3 结果排序算法 |
| 5.3.1 基于位置的排序 |
| 5.3.2 基于搜索引擎权重值的计算 |
| 5.3.3 基于用户兴趣的合成策略 |
| 5.4 检索结果合成的实现 |
| 5.5 本章小结 |
| 第六章 实验测试与分析 |
| 6.1 实验环境 |
| 6.2 成员搜索引擎动态自适应调度实验 |
| 6.2.1 搜索引擎搜索能力的评估方法实现效果 |
| 6.2.2 实际调度过程的动态自适应效果 |
| 6.3 检索结果合成机制的实验 |
| 6.3.1 检索结果合成方法效果实验 |
| 6.3.2 检索相关性对比实验 |
| 6.4 本章小结 |
| 第七章 结束语 |
| 7.1 论文工作总结 |
| 7.2 后续工作展望 |
| 参考文献 |
| 致谢 |
| 作者简介 |
| 摘要 |
| Abstract |
| 第一章 绪论 |
| 1.1 研究背景及意义 |
| 1.2 国内外研究现状 |
| 1.2.1 元搜索引擎 |
| 1.2.2 智能推荐 |
| 1.3 论文工作内容 |
| 1.4 论文组织结构 |
| 第二章 相关理论与技术概述 |
| 2.1 Agent 理论与技术 |
| 2.2 元搜索引擎技术 |
| 2.3 智能推荐相关技术 |
| 2.3.1 用户兴趣建模 |
| 2.3.2 Web 用户聚类 |
| 2.4 本章小结 |
| 第三章 基于 Agent 的智能元搜索引擎系统平台 |
| 3.1 基于 Agent 的智能元搜索引擎工作模式 |
| 3.2 智能元搜索引擎系统 Agent 结构模型及其交互关系 |
| 3.3 本章小结 |
| 第四章 基于 Agent 的智能元搜索引擎群组推荐机制 |
| 4.1 多 Agent 群组推荐结构 |
| 4.2 基于查询上下文构建用户兴趣模型和查询模板流图 |
| 4.2.1 查询上下文 |
| 4.2.2 查询模板流图 |
| 4.2.3 基于查询上下文构建用户兴趣模型 |
| 4.2.4 基于查询上下文构建查询模板流图 |
| 4.3 多 Agent 群组划分及推荐内容生成算法 |
| 4.3.1 多 Agent 群组划分 |
| 4.3.2 群组查询推荐生成算法 |
| 4.3.3 群组检索结果推荐 |
| 4.4 本章小结 |
| 第五章 基于 Agent 的智能元搜索引擎群组推荐机制实现 |
| 5.1 基于 Agent 的智能元搜索引擎系统实现 |
| 5.2 系统相关数据库设计 |
| 5.3 用户查询上下文的表示 |
| 5.4 用户兴趣模型的表示 |
| 5.5 元搜索引擎中群组推荐功能的实现 |
| 5.5.1 群组查询推荐功能的实现 |
| 5.5.2 群组检索结果推荐功能的实现 |
| 5.6 本章小结 |
| 第六章 实验研究与分析 |
| 6.1 实验目的 |
| 6.2 实验设计 |
| 6.2.1 实验环境 |
| 6.2.2 实验过程 |
| 6.2.3 实验结果分析 |
| 6.3 本章小结 |
| 第七章 总结与展望 |
| 致谢 |
| 参考文献 |
| 在研期间研究成果 |
| 摘要 |
| Abstract |
| 引言 |
| 1 绪论 |
| 1.1 研究背景与意义 |
| 1.2 国内外研究现状 |
| 1.3 论文的主要研究内容 |
| 1.4 论文结构 |
| 2 搜索引擎与元搜索引擎概述 |
| 2.1 搜索引擎简介 |
| 2.1.1 搜索引擎概念 |
| 2.1.2 搜索引擎的结构框架 |
| 2.1.3 种类繁多的搜索引擎 |
| 2.1.4 搜索引擎的发展 |
| 2.2 元搜索引擎 |
| 2.2.1 元搜索引擎概述 |
| 2.2.2 元搜索体系结构 |
| 2.2.3 元搜索引擎分类 |
| 2.2.4 元搜索引擎的研究现状 |
| 2.3 个性化搜索概述 |
| 2.3.1 个性化搜索的现状 |
| 2.3.2 个性化元搜索 |
| 2.4 本章小结 |
| 3 成员搜索引擎选择算法研究 |
| 3.1 成员搜索引擎选择概述 |
| 3.2 现有成员搜索引擎选择算法 |
| 3.2.1 定性方法 |
| 3.2.2 定量方法 |
| 3.2.3 基于学习的方法 |
| 3.3 基于用户兴趣和结果贡献量的成员搜索引擎选择算法 |
| 3.3.1 算法设计思路 |
| 3.3.2 算法小结 |
| 3.4 本章小结 |
| 4 元搜索引擎结果合成算法研究 |
| 4.1 经典查询结果排序算法研究 |
| 4.2 基于用户兴趣库/全局相关度排序算法 |
| 4.3 本章小结 |
| 5 实验测试与性能分析 |
| 5.1 实验测试 |
| 5.2 实验评价标准 |
| 5.3 实验结果与分析 |
| 5.4 本章小结 |
| 6 总结 |
| 参考文献 |
| 在校研究成果 |
| 致谢 |
| 摘要 |
| Abstract |
| 1 绪论 |
| 1.1 背景介绍 |
| 1.2 研究目的和意义 |
| 1.3 本文的主要工作和结构安排 |
| 2 现有的元搜索引擎聚合排序算法 |
| 2.1 收集结果重新排序 |
| 2.2 利用搜索引擎排序信息排序 |
| 2.3 相关分值融合 |
| 2.4 其他元搜索排序算法研究 |
| 3 元搜索引擎结果聚合及赢/输图相关准备工作 |
| 3.1 结果聚合 |
| 3.2 PAGERANK 算法 |
| 3.3 赢/输图的概念及构建方法 |
| 4 赢/输图在元搜索引擎中的应用以及改进 |
| 4.1 赢/输图中节点的能量值计算 |
| 4.2 在赢/输图中应用随机漫游机制 |
| 4.3 新闻元搜索中的应用策略 |
| 5 实验以及评估 |
| 5.1 赢/输图排序算法的实现 |
| 5.1.1 收集和存储网页信息 |
| 5.1.2 构建赢/输图并计算能量值 |
| 5.1.3 运行随机漫游机制得到最终排序值 |
| 5.2 排序评估算法 |
| 5.2.1 P@N 计算方法 |
| 5.2.2 MRR 方法 |
| 5.2.3 MAP 方法 |
| 5.2.4 DCG 方法 |
| 5.2.5 其他自动化的评估方法 |
| 5.3 实验结果评估 |
| 6 总结和展望 |
| 6.1 论文工作总结 |
| 6.2 进一步的研究工作 |
| 参考文献 |
| 攻读硕士期间参与的科研项目 |
| 致谢 |
| 摘要 |
| Abstract |
| 第一章 绪论 |
| 1.1 研究背景及意义 |
| 1.2 国内外研究现状分析 |
| 1.2.1 典型的元搜索引擎 |
| 1.2.2 元搜索引擎个性化方法与技术 |
| 1.3 论文工作内容 |
| 1.4 论文组织结构 |
| 第二章 相关技术概述 |
| 2.1 Agent 理论与技术 |
| 2.2 元搜索引擎 |
| 2.3 SSH 框架介绍 |
| 2.3.1 Struts2 框架 |
| 2.3.2 Spring 框架 |
| 2.3.3 Hibernate 框架 |
| 2.4 本章小结 |
| 第三章 基于 Agent 的智能元搜索引擎体系结构 |
| 3.1 系统框架模型 |
| 3.2 检索结果合成模型 |
| 3.3 系统 Agent 结构模型及其交互关系 |
| 3.4 系统 Agent 生命周期 |
| 3.5 本章小结 |
| 第四章 基于 Agent 的智能元搜索引擎个性化功能设计 |
| 4.1 查询兴趣挖掘与查询语句分析过程 |
| 4.2 基于动态学习的复杂查询语句识别方法 |
| 4.2.1 复杂查询语句相关定义 |
| 4.2.2 基于动态学习的查询语句复杂性分析 |
| 4.3 个性化功能相关的数据库设计 |
| 4.4 本章小结 |
| 第五章 基于 Agent 的智能元搜索引擎个性化功能实现 |
| 5.1 基于公共兴趣黑板的群组推荐检索结果生成机制的实现 |
| 5.2 复杂查询语句识别方法的实现 |
| 5.3 本章小结 |
| 第六章 实验研究与测试 |
| 6.1 实验环境 |
| 6.2 检索结果相关性测试 |
| 6.2.1 用户兴趣学习效果测试 |
| 6.2.2 检索效果对比测试 |
| 6.3 复杂查询语句识别功能测试 |
| 6.3.1 复杂查询语句的提出必要性实验 |
| 6.3.2 复杂查询语句识别效果测试 |
| 6.4 本章小结 |
| 第七章 结束语 |
| 7.1 论文工作总结 |
| 7.2 后续工作展望 |
| 致谢 |
| 参考文献 |
| 在研期间研究成果 |
| 摘要 |
| Abstract |
| 第一章 绪论 |
| 1.1 选题背景 |
| 1.2 国内外研究情况 |
| 1.3 本文主要工作及创新点 |
| 1.4 本文组织结构 |
| 第二章 元搜索引擎技术概述 |
| 2.1 搜索引擎概述 |
| 2.1.1 搜索引擎的概念 |
| 2.1.3 搜索引擎的分类 |
| 2.1.4 搜索引擎的组成及工作原理 |
| 2.2 元搜索引擎概述 |
| 2.2.1 元搜索引擎的组成 |
| 2.2.2 元搜索引擎分类 |
| 2.3 元搜索引擎相关技术 |
| 2.3.1 成员搜索引擎调度策略 |
| 2.3.2 元搜索引擎结果消重算法 |
| 2.4 本章小结 |
| 第三章 元搜索引擎关键技术研究 |
| 3.1 Web 信息抽取 |
| 3.1.1 抓取网页 |
| 3.1.2 网页内容的解析 |
| 3.2 元搜索引擎结果集成方法 |
| 3.2.1 使用排名分数的合并 |
| 3.2.2 使用排名位置的合并 |
| 3.2.3 改进的倒数排序法 |
| 3.3 本章小结 |
| 第四章 后缀树聚类算法研究 |
| 4.1 聚类分析研究介绍 |
| 4.1.1 聚类概述 |
| 4.1.2 文本表示模型 |
| 4.1.3 聚类算法的分类 |
| 4.2 后缀树聚类算法 |
| 4.2.1 后缀树 |
| 4.2.2 后缀树聚类算法 |
| 4.3 改进的中文后缀树聚类算法 |
| 4.3.1 文档解析 |
| 4.3.2 创建扩展后缀树 |
| 4.3.3 识别最大短语簇 |
| 4.3.4 短语簇合并 |
| 4.4 本章小结 |
| 第五章 中文聚类元搜索引擎设计与实验分析 |
| 5.1 开发平台与工具 |
| 5.2 系统总体架构 |
| 5.3 系统主要模块设计与实现 |
| 5.3.1 搜索请求分析模块 |
| 5.3.2 搜索任务分配模块 |
| 5.3.3 搜索结果处理模块 |
| 5.3.4 ISTCC 聚类模块 |
| 5.4 系统运行效果 |
| 5.4.1 系统查询页面 |
| 5.4.2 系统结果页面 |
| 5.5 实验分析 |
| 5.5.1 实验一 |
| 5.5.2 实验二 |
| 5.6 本章小结 |
| 第六章 总结与展望 |
| 6.1 研究总结 |
| 6.2 今后研究工作展望 |
| 致谢 |
| 参考文献 |
| 摘要 |
| Abstract |
| 第1章 绪论 |
| 1.1 研究背景 |
| 1.2 研究意义 |
| 1.3 元搜索引擎的研究现状 |
| 1.4 元搜索引擎的局限性 |
| 1.5 本文的组织结构 |
| 第2章 元搜索引擎简介 |
| 2.1 元搜索引擎概述 |
| 2.1.1 元搜索引擎的工作原理及工作流程 |
| 2.1.2 元搜索引擎的分类 |
| 2.1.3 元搜索引擎的特点 |
| 2.2 元搜索引擎的实现技术 |
| 2.2.1 检索接口技术 |
| 2.2.2 成员搜索引擎调度策略 |
| 2.2.3 有效信息提取技术 |
| 2.2.4 检索结果整合技术 |
| 2.3 元搜索引擎未来的发展趋势 |
| 2.4 本章小结 |
| 第3章 元搜索引擎的网页去重算法 |
| 3.1 网页去重的基础 |
| 3.1.1 网页重复的特点 |
| 3.1.2 网页去重方法 |
| 3.1.3 查准率和查全率 |
| 3.1.4 检索系统中的匹配方式 |
| 3.2 基于元搜索引擎的网页去重算法 |
| 3.2.1 网页URL 的识别 |
| 3.2.2 提取网页标题 |
| 3.2.3 相似评价函数 |
| 3.2.4 算法实现过程 |
| 3.3 本章小结 |
| 第4章 元搜索引擎结果排序算法 |
| 4.1 常见的结果排序算法 |
| 4.2 基于网页质量和用户兴趣的元搜索结果排序算法 |
| 4.2.1 基本概念与符号 |
| 4.2.2 搜索结果网页质量的度量 |
| 4.2.3 用户查询与结果文档摘要的相关度 |
| 4.2.4 查询结果与用户兴趣类的相关度 |
| 4.2.5 结果文档在成员引擎中的位置得分 |
| 4.2.6 用户查询与搜索结果的最终相关度 |
| 4.2.7 算法描述 |
| 4.3 本章小结 |
| 第5章 实验与分析 |
| 5.1 实验方案 |
| 5.1.1 实验平台 |
| 5.1.2 系统模型 |
| 5.2 元搜索引擎去重算法实验 |
| 5.2.1 实验过程 |
| 5.2.2 结果分析 |
| 5.3 元搜索引擎排序算法实验 |
| 5.3.1 算法的计算过程 |
| 5.3.2 评测标准 |
| 5.3.3 实验过程 |
| 5.3.4 结果分析 |
| 5.4 本章小结 |
| 结论 |
| 参考文献 |
| 攻读硕士学位期间承担的科研任务与主要成果 |
| 致谢 |
| 作者简介 |
| 1 数据源 |
| 2 检索功能 |
| 3 检索结果 |
| 3.1 结果记录 |
| 3.2 排序方式 |
| 3.3 页面显示 |