功能: 读取本地excel表格里面的问题id跟抓取数量,到知乎进行问答正文采集。包括【问题标题、问题内容、回答列表{评论 赞同 用户名 用户链接 回答正文}】,保存数据到excel表格
运行参数:
(1)先点击一次自动运行后,本地会自动生成C:\Robot\OctopusData\SZBZY_知乎问答正文 文件夹,运行结束关闭运行后,点开C:\Robot\OctopusData\SZBZY_知乎问答正文\配置文件\问题id列表
(2)根据表格模板填写问题id跟要采集的数据量,采集的数据量默认是30。问题id的位置在如下图所示:
question后面带的数字就是问题的id。
(3)无其他参数设置,直接运行。
注意: 需要在内置浏览器中先登录!(第一次运行失败可能是没有在内置浏览器登录的原因,在运行的过程中暂停并登录,即可正常使用,登录完重新运行。)
模板表格:
[问题id列表.xlsx]:
(可以直接下载使用)
运行效果:
生成结果在C:\Robot\OctopusData\SZBZY_知乎问答正文\已处理\【当天日期】