计算机科学与通信工程学院江蘇镇江
算法的主题漂移以及单机运行的效率问题,本文首先
利用用户点击率、网页发布时间以及主题内容相关度这三个影响因子改进
最后通过对实验结果数据的分析发现
的爬取和索引的效率提高了
搜索引擎是一种通用的网页信
信息资源的飞速增长,从检索结果来
搜索引擎嘚效果并不十分理想
要表现为返回给用户的检索页面过多
要在大量的页面中找到所需要的页面
并且存在大量与检索关键
缺少主题检索特点、缺少个性化服务;
另一方面在返回结果的排序算法上有
上的浏览行为建立了一个模型
过来的网页必定还是优质网页
算法客观地反应出一個网页
式模拟出人们浏览互联网中网页的过
却未体现网页中各个链接的
竞争关系由于它是根据链接关系进
行平等赋值,新网页只有很少戓者没
有链接指向它对新网页有歧视,以
及会出现主题漂移问题