第3825章 hits算法
作者:admin      更新:2022-08-17 11:43      字数:1572
    对着旁边的工作人员挥了挥手,很快5块白板被抬到了报告台上。


    白板他们准备了很多,原本打算的是给秦洛准备的。


    结果没想到,却先一步用到了乔恩·克莱因伯格的身上。


    “谢谢。”乔恩·克莱因伯格道了声谢,然后目光看向了众人:“在我正式论证之前,我想先像各位讲讲什么是HITS算法。”


    “这是一种,全新的计算模式,当用户输入关键词后,算法对返回的匹配页面计算两种值,一种是枢纽值,另一种是权威值,枢纽值指的是页面上所有导出链接指向页面的权威值之和。权威值是指所有导入链接所在的页面中枢纽之和……”


    “相较于传统的pagerangk算法,HITS算法能够更好地描述互联网的组织特点,而且收敛速度更快,减少了搜索时间……”


    “……”


    洋洋洒洒,乔恩·克莱因伯格将hist算法的优点简单的阐述了一遍。


    内容很多,但是归结起来就是两句话。


    HITS算法的反应速度更快,花费的时间更短。


    简单的对HITS算法做过介绍之后,乔恩·克莱因伯格开始做正式报告。


    “我是这样想的,将查询q提交给基于关键字查询的检索系统,从返回结果页面的集合中取前n个网页(如n=200),作为根集合,记为S,则S满足:


    “1.S中的网页数量较少”


    “2.S中的网页是与查询q相关的网页”


    “3.S中的网页包含较多的权威网页”


    “……”


    “通过向S中加入被S引用的网页和引用S的网页,将S扩展成一个更大的集合T.以T中的Hub网页为顶点集V1,以权威网页为顶点集V2……”


    “V1中的网页到V2中的网页的超链接为边集E,形成一个二分有向图.……。”


    “其中I操作:a(u)=∑h(v);O操作:h(v)=∑a(u)。每次迭代对a(u)、h(v)进行规范化处理……”


    “……”


    刚开始,众人还听的津津有味。


    可是随着论证的深入,众人的眼神开始变得越发的迷茫起来。


    他们竟然有点儿听懂了。


    但是众人却没有丝毫的轻蔑,反而脸上的表情变得越发的郑重起来。


    乔恩·克莱因伯格是谁?

    世界上著名的计算机科学家,现在的他,还是世界级康奈尔学院的教授。


    他会信口胡诌吗?

    那当然是不会的。


    既然乔恩·克莱因伯格的论证没有问题,那么答案就只有一个,他们听不懂的原因,不是因为乔恩·克莱因伯格胡言乱语,而是他表述的知识太过深奥,以至于他们一时间无法理解。


    正是因为听不懂,所以他们才越发的觉得乔恩·克莱因伯格论证的正确。


    乔恩·克莱因伯格的报告还在继续,而且丝毫没有停下来的极限。


    “刚才我说的是HITS算法的具体算法。”


    “接下来我要说说,算法中的伪代码……”