搜索引擎是如何搜索内容的 (搜索引擎图片怎么抓取)

想必大家都有过在搜索引擎检索图片的经历吧,大家有没有想过这样一个问题,搜索引擎是怎么知道我们想要一张什么样的图片的?

你可能会说我们想要一张什么样的图片就输入什么样的关键词呗,这有什么大不了的。那么搜索引擎是怎么根据我们输入的关键词来分辨这些图片的?搜索引擎它也有一双眼睛吗?它也认识这些图片中的内容吗?显然,搜索引擎不会认得图片中的小鸡小羊,小马小牛。

我们先在搜索引擎找一张图片,来看看搜索引擎到底是如何检索到这些图片的。

比如我们要找一张狗狗的图片,输入“狗子”我们便可以得到下面图片。

搜索引擎配图,搜索引擎如何查询更准确

图片来源百度

如果我想要的是一张卡通狗狗的图片,并不是上图中真实狗狗的图片,我们只需要再加入一个“卡通”的关键词,便可以得到卡通狗狗的图片了。

搜索引擎配图,搜索引擎如何查询更准确

图片来源百度

同理,如果我们想要的是一张玩具狗狗的图片,只需要改变关键词就可以了。

搜索引擎配图,搜索引擎如何查询更准确

图片来源百度

问题来了,既然搜索引擎并不会认得图片中的内容,那么搜索引擎是如何通过这些关键词,一瞬间精准的找到数以万计我们想要的图片的呢?

这是因为前端的开发人员在开发网页时,会对我们的图片进行一些小手段,而这些小手段正是搜索引擎发现这些图片的诀窍,那我们就一起来看看究竟是些什么小手段吧!

现下的网页大多是通过HTML超文本标记语言编写的,当开发人员在开发网页时要上传一张图片,他们是这么操作的。

搜索引擎配图,搜索引擎如何查询更准确

Atom编辑器上图片的插入

从图片当中我们可以发现一个 <img >的标签,这个标签就是要在网页中插入的图片。我们还发现这个标签有两个属性,分别是“src”和“alt”。

<img >标签的 src 属性是必需的。它的值是图像文件的 URL,也就是引用该图像的文件的绝对路径或相对路径。我们可以看到这三张图片都是存储在C盘的pics文件夹下。

<img >标签的alt属性也是必需的。它的值是图像文件的描述,它规定在图像无法显示时的替代文本。搜索引擎就是通过alt属性来识别不同的图片。

这两个属性不会在图片上显示,但可以在网页源代码中找到,搜索引擎就是通过网页源代码的这两个属性来找到图片的。

了解了这两个属性,大家是不是对于搜索引擎如何找精确找到的图片的工作原理有了一定的了解了呢?