手机浏览器扫描二维码访问
一秒记住【m.xiaoyanwenxue.cc】精彩无弹窗免费!
“重生之我真没想当大佬啊(.shg.tw)”
!
第二天,苏炎直接来到了教学楼,今天是他和陆渊亭约好的日子。
来到陆渊亭的办公室,此刻里面正有三名男子正在办公室里和陆渊亭有说有笑。
看到苏炎的到来,陆渊亭也是起身做了介绍,这三人是计算机院系那边的负责人,这次过来主要就是看看苏炎到底有什么东西,敢夸下海口去和国外的搜索引擎进行竞争。
苏炎简单的打了个招呼后,一行人便在陆渊亭的带领下来到了一处会议室坐着,接下来就是苏炎展示他搜索引擎核心技术的时候了。
搜索引擎这个东西,需要用到网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等,在零一年的这个时候,还用不上自然语言处理技术,大数据处理也更后世的概念不太一样。
但是说白了,所有的搜索引擎核心点其实就是一个东西,算法。
因为每一个东西都是围绕着算法进行的。
“各位都是计算机方面的专家了,对于搜索引擎可能都有自己的看法,所以在一会的讲解中我希望可以按照我的节奏来,要是有异议的话可以提出来,我会进行详细的解答。”
说完苏炎便开始准备进入正题。
“在展示我的算法核心之前,我们先来看看当下的三大主流算法,百度的超链分析,谷歌的pagerank算法以及ibm的hits算法。
而在着三种算法里几乎所有人都觉得百度的超链分析是三个算法中最落后的,但有些事情我们还是要多角度的看一看,百度的超链分析在某种程度上可以算得上是奠定了搜索引擎的发展基础。
通过抓去网页信息,然后用算法机制对这些网页进行排序当用户输入关键词进行搜索时,根据关键词匹配出按照机制进行排列的网页。
当前三大主流算法,其实不管是哪一家的算法,算法基础其实都是一样的。
都是按照上面的步骤来进行的。
甚至有一种说法,谷歌的算法其实是剽窃了百度的超链算法,对此我们不去做过多的研究。
那么同样是搜索引擎为什么百度在国外市场竞争不过谷歌呢?
关键在于百度当前的过于简单的基于在某次搜索的所有结果中被其他网页用超链接指向的越多的网页就价值越高这种基础排序方式。
这种基础排序方式导致有些正确的网页反而被一些劣质网页所覆盖,最终劣币驱逐良币,使用户很难找到自己需要的东西。
而谷歌的pagerank就多了两件很重要的事情,第一件事情是,把a页面到b页面的链接解释为a给b的投票行为,谷歌在这里会同时考评a和b的等级从而形成新的等级。
也就是每一个页面都有pr值,同时你的pr值会成为其他页面pr值的参考。
然后不断的重复计算每个页面的pr。
假设给每个页面一个随机pr值,那么经过不断的重复计算,这些页面的pr值会趋向于稳定,也就是收敛的状态。
这样也就意味着用户用谷歌的搜索引擎可以比百度更为有效的获取到自己所需要的信息。
身为全球顶级富豪继承人的他,原本只想拥有一段美丽的爱情,因此遭到了家族的反对,取消了一切生活来源。本以为爱情握在了手里,却没想到在爱慕虚荣的女友眼里,自己只是一场笑料!既然你如此唾弃,我就恢复本来面目,让你看看我这张狂的世界,到底多么精彩!…...
重生之最强大师作者叶宁慕迎雪重生之最强大师txt下载最强特工修罗,因被人陷害而身死,重生到一个纨绔少爷身上,绝色未婚妻对他冷漠,却又非他不嫁,医院的纯情小护士,警局的暴力警花,妩媚的白领少妇,一个个女人,带来了一堆的麻烦...
...
苏宁大学毕业,送快递送了99天后,终于觉醒快递神豪系统!只要送快递,就有神豪奖励!叮咚,恭喜宿主完成一个特殊快递,奖励十个亿!叮咚,恭喜宿主完成一个特殊快递,奖励兰博基尼毒药一台!叮咚,恭喜...
那女警背后有只女鬼,我奋不顾身的扑上去救人,好吧,我救了人,顺便还把女警的裙子给扯下来了,谁能告诉她我不是故意的救了女警一命,却坏了女鬼的好事,女鬼要报复我,各种恐怖各种诡异,我要保命只能拨开层层迷雾,而这一切才只是开始。恐怖的女鬼,神秘的鬼偶,诡异的回魂术,无法想象的幽灵山庄,背后层层疑云,原来这一切才是揭开面纱,一个跨越几百年的风水奇局,一个庞大的古老传承,带着你的好奇走进来吧,天黑不要闭眼。...
伴随着魂导科技的进步,斗罗大陆上的人类征服了海洋,又发现了两片大陆。魂兽也随着人类魂师的猎杀无度走向灭亡,沉睡无数年的魂兽之王在星斗大森林最后的净土苏醒,它要带领仅存的族人,向人类复仇!唐舞麟立志要成为一名强大的魂师,可当武魂觉醒时,苏醒的,却是旷世之才,龙王之争,我们的龙王传说,将由此开始。...