重要的是要知道可能有一些评分

Talk big database, solutions, and innovations for businesses.
Post Reply
rakibhasanbd4723
Posts: 148
Joined: Sun Dec 22, 2024 8:26 am

重要的是要知道可能有一些评分

Post by rakibhasanbd4723 »

我最喜欢的一个例子是 Google 在电影主题方面变得多么智能。例如,尝试搜索“那部关于一个叫 The Dude 的人的电影”,你会发现 Google 正确地将“谋杀绿脚趾”排在第一位。他们是怎么知道的?他们基本上把“电影”和“The Dude”联系起来了,然后说:“啊哈,这些东西与‘谋杀绿脚趾’最密切相关。这就是搜索者的意图。这就是我们要返回的文档,而不是标题中恰好有‘那部关于一个叫‘The Dude’的人的电影,正是这些词’的文档。”

这是另一个例子。这是《超级马 新加坡电报筛选 里奥兄弟》,《超级马里奥兄弟》可能与很多其他术语和短语相关。因此,搜索引擎可能会理解《超级马里奥兄弟》在语义上与马里奥的联系比与路易吉、任天堂、库巴(跳跃的龙人、背上有尖刺的乌龟——我不确定他到底是什么)和桃子公主的联系要多一些。

往下看,搜索引擎实际上可能有一个主题建模算法,比如潜在语义索引,这是一个早期模型,或者一个后期模型,比如潜在狄利克雷分配,这是一个稍晚的模型,或者甚至是预测潜在狄利克雷分配,这是一个更晚的模型。模型并不是特别重要,尤其是对于我们的目的而言。

搜索引擎(Google、Bing)可以理解其中一些词与《超级马里奥兄弟》的联系比其他词更紧密,也可以反过来。它们可以说《超级马里奥兄弟》与电子游戏有一定联系,但与猫粮没有太大联系。因此,如果我们发现一个页面恰好有《超级马里奥兄弟》的标题元素,但大部分页面内容似乎都是关于猫粮的,那么,即使它有很多带有锚文本“超级马里奥兄弟”的入站链接,或者页面排名或域名权限非常高或诸如此类的东西,我们可能也不应该对其进行排名。

因此,搜索引擎,尤其是谷歌,在蜂鸟算法之后,在连接性和主题建模方面变得非常非常聪明。蜂鸟算法当然是去年秋季的算法更新,它极大地改变了搜索引擎对单词和短语的解释方式。
Post Reply