#从今天起记录我的2023#

（8-14）21堂信息搜集课，帮你从公开信息中，快速找到赚钱思路

总目录：

00先导课：如何更快掌握这个技能-提高1000倍效率
01先知：做对市场分析，赚钱概率提升10倍
02避险：为什么朋友圈用户调研不靠谱？
03淘金：借助公开信息，准确挖掘赚钱思路
04模仿：关键词思维，快速找到用户真实需求
05组合：2个词，挖掘100+赚钱思路
06增长：举一反三，拓展100+赚钱思路
07高效：借助工具，1分钟胜过别人10小时
08简洁：简单3步，帮你把电脑变黑科技
09实用：300个案例模板，一键套用搜集信息
10传播：1分钟汇集标题，跟踪热点选题
11整合：3步导出文章链接，搭建素材库
12创造：批量获取图片，灵感源源不断
13借力：多维度统计数据，分析用户喜好
14洞察：一键获取搜索结果，挖掘用户痛点
15探索：搜集行业经典书籍，学习高手思维
16智能：自动翻页，喝杯咖啡就能获得数据
17分解：自动抓取内容，建立个人搜索引擎
18本质：搞懂原理，轻松解决任何抓取难题
19地图：一套思路，应对所有类型网站
20升级：7个小技巧，抓取数据更精确
21加餐：20%知识解决80%问题

（8-14）21堂信息搜集课，帮你从公开信息中，快速找到赚钱思路

【信息检索超厉害的课】08简洁___简单3步，帮你把电脑变黑科技

视频加载中...

【信息检索超厉害的课】09实用 300个案例模板，一键套用搜集信息

视频加载中...

【信息检索超厉害的课】10、传播： 1分钟汇集标题，跟踪热点选题

视频加载中...

文字(Text)选择器

如何用 1 分钟抓取 500 个文章标题?

https://www.zhihu.com/people/zhang-ji...

目标效果图

02 问题检测清单

03 适用场景 04 小练习

(1)打开 web scraper (2)创建 Sitemap(网站地图)

(3)设置 selector(抓取规则) (4)开始抓取

(5)导出数据

(1)打开 web scraper

1 打开要抓取的网⻚

2 鼠标右键 —— 检查(审查元素)

(1)打开 web scraper

如果你以前使用过，这里会有一些信息

(2)创建 Sitemap(网站地图

(2)创建 Sitemap(网站地图地址栏:这里可以看到网站，复制粘贴到下面 “4” 处

取个名字

要抓取的网址:可以从地址栏复制，粘贴到这里

点击保存

(2)创建 Sitemap(网站地图注意点

Sitemap name 的格式:

1 字母 + 数字

2 字母开头

3 最少 3 个字符 4 不能重复

(2)创建 Sitemap(网站地图

(3)设置 selector(抓取规则几个概念介绍

微信

包含

朋友

包含

朋友信息

web scraper

包含

Sitemap(s) 某个网站包含

selector(s)

网站中的信息

增删改查

好友信息

名字

链接

好友信息

Sitemap

selector

点赞数

selector

年龄

性别

标题

爱好

评论数

好友信息 selector

selector

(3)设置 selector(抓取规则) 几个概念介绍

好友

乔布斯

知乎

(3)设置 selector(抓取规则这里能看到“zhihu”，说明此刻是在 “zhihu” 这个Sitemap 里创建 selector)

(3)设置 selector(抓取规则

不用选，默认就好

根据抓取信息取个名字，格式要求和 Sitemap 相同，选择 “text”:因为抓取的是“文字”

下一个PPT 如果要抓取多个信息，就勾选“Multiple”

上面全部设置好好，点击保存)

(3)设置 selector(抓取规则 4.2 点击第 1 个标题

这里一开始是空白，执行 4.2、4.3 步后，会出现结果

4.3 点击第 2 个标题 4.4 点击蓝色按钮

4.1 点击“select”，会弹出 4.4 处的工具栏

点击 4.4 蓝色按钮后，这里会出现一些字符，说明设置成功。如果没有，说明 4.2、4.3 执行有误，可以从 4.1 重新操作)

(4)开始抓取这里能看到“zhihu”，说明此刻是在操作 “zhihu” 这个Sitemap

(4)开始抓取

(5)导出数据

*载下**到电脑上的是一个 csv 文件，可以用 excel 打开。文件名前缀 XX.csv，XX 就是 Sitemap 名字。

02 问题检测清单

如果抓取结果不对，可以按照下图清单，检查这几个选项是否正确。如果不对，按照 01 节的方法修改一下。

02 问题检测清单

6 点击“Element preview”，标题应该全部变红，说明第 3 点选对了

02 问题检测清单示例

02 问题检测清单一个你可能会经常看到的警告信息，是正常现象，不用担心⚠

比如，我点击“select”按钮，选择标题后，又选择了作者介绍，就会弹出提示，说明这 2 个信息，不是同一类型

当出现这个提示，说明你选择的 2 个信息，不是同一类型，应该点击“Select”，重新选择

03 适用场景

text 选择器，适用于抓取网⻚上的文字信息。

web scraper 最常用的选择器，几乎抓取任何网站，都需要用到这个选择器。

经常不单独适用。

03 适用场景

我知道，可能你学完这节课，会跃跃欲试想要抓其他网站，例如:微博，公众号等。

但你大概率会失败，抓取的结果和想象中的不一致。

要么数据为 null，要么不完整，要么选不中。

这都是正常的。

因为这节课，我们只学了抓取一种类型信息，

其他网站不一定和这节的案例相同，或许你看起来一样，但其实有差异，后面我们会

学习更多类型抓取方式，学完后，你就能轻松应对各种网站了。

所以，不要着急。

想想看，如果你只学了 ABC，就去考英语四级，也会考不过吧。

03 适用场景如何抓取多⻚数据?

04 小练习用搜狗的微信搜索“不用写代码的爬虫课”，抓取结果的标题

下一节链接(Link)选择器

如何抓取文章链接?

【信息检索超厉害的课】11整合 3步导出文章链接，搭建素材库

视频加载中...

【信息检索超厉害的课】12创造批量获取图片，灵感源源不断

视频加载中...

【信息检索超厉害的课】13借力多维度统计数据，分析用户喜好

视频加载中...

【信息检索超厉害的课】14洞察一键获取搜索结果，挖掘用户痛点

视频加载中...

（此处已添加书籍卡片，请到*今条头日**客户端查看）

（8-14）21堂信息搜集课，帮你从公开信息中，快速找到赚钱思路

本文发布的内容仅为个人学习试用，请在*载下**后24小时内删除，不得用于任何商业用途，否则后果自负。如有侵权请及时联系我们处理。

（8-14）21堂信息搜集课，帮你从公开信息中，快速找到赚钱思路

（8-14）21堂信息搜集课，帮你从公开信息中，快速找到赚钱思路

【信息检索超厉害的课】08简洁___简单3步，帮你把电脑变黑科技

【信息检索超厉害的课】09实用 300个案例模板，一键套用搜集信息

【信息检索超厉害的课】10、传播： 1分钟汇集标题，跟踪热点选题

【信息检索超厉害的课】11整合 3步导出文章链接，搭建素材库

【信息检索超厉害的课】12创造 批量获取图片，灵感源源不断

【信息检索超厉害的课】13借力 多维度统计数据，分析用户喜好

【信息检索超厉害的课】14洞察 一键获取搜索结果，挖掘用户痛点

【信息检索超厉害的课】12创造批量获取图片，灵感源源不断

【信息检索超厉害的课】13借力多维度统计数据，分析用户喜好

【信息检索超厉害的课】14洞察一键获取搜索结果，挖掘用户痛点