
SEO 应该怎么挖掘关键词?
做一个合格的 SEOer,怎么能不了解搜索引擎呢?知道它的工作原理,对于搜索引擎优化是非常有帮助的。
SEO 人员必须知道搜索引擎要解决什么问题、有哪些技术上的困难、有什么限制、搜索引擎怎样取舍。

搜索引擎的工作过程
搜索引擎的工作过程大体上可以分成三个阶段。
(1)爬行和抓取:搜索引擎蜘蛛通过跟踪链接访问网页,获得页面 HTML 代码存入数据库。
(2)预处理:索引程序对抓取来的页面数据进行文字提取、中文分词、索引等处理,以备排名程序调用。
(3)排名:用户输入关键词后,排名程序调用索引库数据,计算相关性,然后按一定格式生成搜索结果页面。
- 爬行和抓取
搜索引擎用来爬行和访问页面的程序被称为蜘蛛(spider),蜘蛛程序发出页面访问请求后,服务器返回 HTML 代码,蜘蛛程序把收到的代码存入原始页面数据库。
SEO 人员要想让自己的更多页面被收录,就要想方设法吸引蜘蛛来抓取。蜘蛛会尽量抓取重要页面。
哪些页面被认为比较重要呢?有几方面影响因素。
● 网站和页面权重;
● 页面更新度;
● 导入链接;
● 与首页点击距离。
- 预处理
预处理的步骤如下:
1. 提取文字;
2. 中文分词;
3. 去停止词;
4. 消除噪声;
5. 去重;
6. 正向索引;
7. 倒排索引;
8. 链接关系计算;
9. 特殊文件处理。
- 排名
经过搜索引擎蜘蛛抓取页面,索引程序计算得到倒排索引后,搜索引擎就准备好可以随时处理用户搜索了。用户在搜索框填入关键词后,排名程序调用索引库数据,计算排名显示给用户。
首先,搜索引擎会进行搜索词处理,进行中文分词、去停止词、指令处理、拼写错误矫正、整合搜索触发的步骤;
第二步,搜索引擎开始文件匹配并选择初始子集;
下一步,搜索引擎会进行相关性计算,影响相关性的因素很多,包括关键词常用程度、词频、密度、关键词位置、页面权重等。
通过排名过滤后,搜索引擎会显示排名。

高级搜索指令
作为 SEOer,有一些高级搜索指令,可以帮助你在日常的工作中进行竞争对手研究和寻找外链。
双引号
把搜索词放在双引号中,代表完全匹配搜索,也就是说搜索结果返回的页面包含双引号中出现的所有的词,连顺序也必须完全匹配。
使用双引号搜索可以更准确地找到特定关键词的竞争对手。
inurl:
inurl: 指令用于搜索查询词出现在 URL 中的页面。
比如搜索「inurl: 搜索引擎优化」,返回的结果都是网址 url 中包含「搜索引擎优化」的页面。由于关键词出现在 URL 中对排名有一定影响,因此使用 inurl: 搜索可以更准确地找到竞争对手。
Intitle:
intitle: 指令返回的是页面 title 中包含关键词的页面。
title是目前页面优化的最重要因素。做 SEO 的人无论要做哪个词的排名,都会把关键词放进 title 中。使用 intitle 指令找到的文件才是更准确的竞争页面。如果关键词只出现在页面可见文字中,而没有出现在 title 中,大部分情况是并没有针对关键词进行优化,也不是有力的竞争对手。
site:
site: 是 SEOer 最熟悉的高级搜索指令,用来搜索某个域名下的所有文件。比如搜索:
site:suki.xiaohecheng.com,返回的就是 suki.xiaohecheng.com 这个域名下的所有页面。
这个指令是查询网站收录页面数的最直接方法。

关注小禾野君,随时更新 SEO 技巧哦~
更多干货:
干货 | 文案工作者看过来!如何写好文案的开头?
小禾呈干货 | 8分钟学会互联网运营,小白也能1天入门
本文首发于:无锡小禾呈科技 suki.xiaohecheng.com,系本人原创,如需转载请联系。
无锡小禾呈科技有限公司为您提供软件定制、App 开发、网页建设、运营指导等服务。我们有专业的团队,开发经验丰富,欢迎私信联系。
欢迎关注我们:
