当前位置:首页 > 常见问答 > 正文

常见的目录式搜索引擎有(百度是目录式搜索引擎吗)

基于了解搜索产品经理的目的,笔者对搜索引擎的发展进行了梳理和分析。希望这篇文章能加深你对搜索产品的理解。

最近和百度大搜的一个产品同学交流了他的作品。经过交流,我意识到我对这份工作的了解还不够系统。当然,我对一份工作的了解不是三言两语的,一个小时的交流就能透彻了解。

我试着在网上找了一些资料,发现网上很少有系统阐述这个立场的文章。本着2020年罗先生在《朋友》中提到的“献身事业”的精神,我试着查阅了一些枯燥的书籍和文献,整理如下,与大家分享。

一.互联网的发展

在讨论如何成为一名搜索产品经理之前,我们需要了解一下搜索引擎的发展。要了解搜索引擎的发展,让我们回到90年代,回顾一下互联网的发展。

90年代,技术和产品的发展为互联网的快速普及和发展做了准备。

1.1 技术上的发展

1991年,蒂姆·伯纳斯·李(蒂姆·伯纳斯·李,万维网的发明者)将超文本的概念引入互联网,同时推出了www的雏形,支持的HTTP传输协议以及相应的Web服务技术。

让我来解释一下这些发明对蒂姆·伯纳斯·李来说意味着什么。

1.1.1超文本的概念

超文本只是一种可以在计算机显示器或其他电子设备上显示的文本。其中的文本包含可以链接到其他域或文档的超链接,允许您直接从当前阅读位置切换到超链接指向的文本。

从技术上讲,超文本是指利用超文本标记语言(HTML)编辑一个包含标记指令的文本文件,并通过URL(统一资源位置)指向其他内容,从而在不同文档或同一文档的不同部分建立联系。使得用户可以通过一个网站访问不同网站的文件。

万维网

万维网(WWW)是一个通过互联网访问的系统,由许多互连的超文本组成。它是一个大规模的在线信息库,英文缩写为Web。利用万维网链接的方法,可以方便地从互联网上的一个站点访问另一个站点,从而主动地按需获取丰富的信息。

5个万维网网站

万维网上有五个网站。他们可以相隔几千英里,但他们都必须连接到互联网。每个万维网网站都保存着许多文档。这些文档通过链接相互连接,有时也称为超链接。这个文档可以链接到远处的另一个文档,经过一定的时间延迟后,从远处发来的文档就可以显示在我们的屏幕上了。

万维网的出现使得网站的数量呈指数级增长,所以万维网的出现可以说是互联网发展的一个里程碑。

HTTP传输协议

HTTP是超文本传输协议的缩写,是一种用于将超文本从万维网服务器传输到本地浏览器的传输协议。

1.2 产品上的发展

1993年,第一个图形浏览器mosaic诞生,网页浏览客户端走向成熟。

Mosaic是第一个可以在同一个窗口显示文本和图片的浏览器。

马赛克

由于上述技术和产品的发展,互联网的用户群体也发生了变化,从最开始的军队、高校,发展到普通个人用户的普及。扩大用户群为互联网商业化奠定了基础。

第二,搜索引擎的发展

综合因素导致互联网信息爆炸式增长。如何从海量信息中找到符合用户需求的信息成为关键点。

随着技术和产品的发展,人们发布信息的门槛降低了。同时,由于用户群体的扩大,互联网上产生了大量的信息。

为了满足用户从海量信息中找到所需信息的需求,一系列搜索引擎商业公司应运而生。如雅虎、InfoSeek、快搜等。

搜索引擎是收集和整理互联网上的信息资源,然后向用户提供查询的系统。它包括三个部分:信息收集、信息整理和用户查询。

2.1 目录搜索引擎

目录搜索引擎是指搜索引擎的信息收集方式,也是搜索引擎的搜索方式。

搜索将收集到的信息资源按照一定的主题进行分类,建立多层次的目录结构。大目录下有子目录,子目录下有子目录。通过策略依次建立包含关系的多级目录。用户在查找信息时,可以通过逐层浏览目录,逐步提炼,找到所需信息。

在搜索引擎中,需要人工收集信息。编辑人员对信息进行检查,形成信息摘要,然后将信息放入相应的分类结构中。

雅虎

雅虎是当时著名的搜索和门户网站。雅虎的目录搜索引擎。

例如,中国雅虎网站的目录搜索引擎:

如果我们想找一个关于著名作家金庸的网页,可以逐步搜索艺术人文|人文|文学|文学类|小说|武侠|作者|金庸,然后就可以达到目的了。

2.1.2常用的中文目录搜索引擎

搜狐网易新浪

目录搜索引擎的优点和缺点:

利:由于加入了人工的因素,因此信息准确、导航质量高。弊:需要人工介入,维护量大,信息量少,信息更新不够及时。

2.2 搜索引擎技术的发展

随着信息的进一步快速发展,信息呈现爆炸式增长,目录搜索引擎的弊端也显现出来,不能满足用户的需求。

在目录搜索引擎技术发展之后,出现了不同的搜索引擎技术:

文本检索链接分析用户中心

这个我就不细说了。

常见的目录式搜索引擎有(百度是目录式搜索引擎吗)  第1张

第三,搜索引擎的目标

搜索引擎的应用形式很简单:用户输入查询词,搜索引擎返回查询结果。

在这个过程中,只涉及到两个主体,用户和搜索引擎。

搜索引擎的目标是提供更完整、更准确、更快速的搜索服务。

在上述三个目标中,准确性是最关键的。

四、搜索引擎的三个核心问题

在我们分析搜索引擎的3个核心问题之前,让我们先来看看单个搜索的简单过程:

4.1 用户需求

根据上图,当用户输入一个查询词时,搜索引擎需要返回查询结果。这个过程可以看作是一种人机交互。

人机交互,也就是人和计算机的交互,第一步是获取用户的意图。

对于搜索引擎来说,这也是非常重要的。只有获得用户的真实意图,才能进行后续的信息-意图匹配。

用户的意图是什么?

不同的用户,输入搜索框的同一个查询词,有可能背后的意图是不一样的。同一个用户,输入搜索框同一个查询词,也有可能因为其所处场景不同,其意图也是不一样的。

如何识别以上区别?这也是搜索系统需要解决的第一个核心问题,即用户此时此刻的真实搜索意图是什么?

4.2 与用户需求相关的信息

在知道用户查询的真实意图后,搜索系统需要从海量信息中找到能够匹配用户需求的内容。

搜索系统是用户的搜索意图如何匹配关键信息的指导思想,还是基于关键词匹配。

当算法系统搜索到与用户包含相同查询词的网页时,搜索到的信息可能与用户想要查找的内容相关,这是最基本的信号。如果这些关键词出现在网页或文本的标题中,就意味着这些信息更有可能与用户想要查找的内容相关。

4.3 分辨出可信赖的信息

搜索的本质是找到符合用户需求的信息。

相关性是衡量信息是否满足用户需求的指标,信息的可靠性也是衡量搜索系统质量的重要指标。

《成为一名搜索产品经理》我会把它写成一个系列,从互联网的发展开始,把我所知道的分享给大家,期待和大家一起探讨,共同进步。

这是《成为搜索产品经理》的第一篇,我会陆续更新的~

#参考资料#

1.蒂姆·伯纳斯·李谈论网络的未来

2.~[https://en . Wikipedia . org/wiki/Mosaic _(web _ browser)](https://en . Wikipedia . org/wiki/Mosaic _(web _ browser))~

3.互联网应用基础教程|游晓东

4.信息检索|陈雅芝

5.这是对搜索引擎核心技术的详细解释。

6.超文本传输协议https://blog.csdn.net/codejas/article/details/79002339

7.谷歌搜索|搜索算法如何工作

本文由@一朵西兰花原创发布。每个人都是产品经理。未经许可,禁止复制。

来自Unsplash的图像,基于CC0协议。

0