官方定制大数据服务:数据采集、数据清洗、数据标注、机器学习等
糗事百科文章采集爬虫
爬虫
  •  自动接入代理IP
  •  开源
  •  Robots协议

爬虫来源于用户发布,如有侵犯您的隐私或版权,请联系我们

版本:v10(10)
上架时间:2016-03-01
收藏人数:2296 人
更新时间:2017-07-26
免费使用
套餐限制:个人免费版
获取爬虫
分享到
应用详情
版本信息
爬取数据示例
应用介绍

糗事百科文章采集爬虫爬取采集糗事百科(http://www.qiushibaike.com/)所有的文章,包括文章标题、内容和时间等

【温馨提示】:建议在爬虫设置中开启使用企业代理IP后才能稳定爬取~

最新版本:v10(10)更新日期:2017-07-26
更新内容
1、修复目标网站改为https导致爬取失败的问题
历史版本
版本号:v9(9)更新日期:2017-05-22
更新内容
1、糗事百科增加反爬,所以增加反爬,修改为自动切换代理ip爬取。
版本号:v8(8)更新日期:2016-12-13
更新内容
1、修复爬取不了下一页的bug。
版本号:v7(7)更新日期:2016-08-24
更新内容
1、修复由于糗事百科网站页面调整导致之前的代码只能爬取第一页的问题。
版本号:v6(6)更新日期:2016-07-15
更新内容
暂无更新内容
版本号:v5(5)更新日期:2016-06-27
更新内容
暂无更新内容
常见问题

* 什么是爬虫?

爬虫可以实时、批量、自动化地抓取网页上的数据,有助于快速获取大量数据和信息。

* 如何使用?查看更详细的教程

注册神箭手账号,登录
获取爬虫(收费爬虫可免费试用爬取十条数据)
管理爬虫,启停爬虫、发布和导出数据等

* 爬取的数据如何导出?

爬取的数据会存在神箭手上,您可以:
1、导出到本地文件;
2、自动或者手动发布到您的数据库/网站/微信公众号/邮箱等;
3、设置Webhook推送给您的服务器;
4、通过GraphQL请求数据
导出方式多样,具体请查阅详细教程哦~

* 售后服务

个人版套餐客户:请通过 控制台的工单系统 提交问题;
企业版套餐客户:请通过 控制台的工单系统 OR 在线客服 提交问题。
为什么选择神箭手

购买神箭手的服务支出<< 技术人员(8000元/月) + 服务器费(500元/月) +...

关注公众号
手机也能控制爬虫
新手指南
业务咨询
返回顶部