官方定制大数据服务:数据采集、数据清洗、数据标注、机器学习等
华尔街见闻全球资讯文章爬虫
爬虫
  •  Robots协议

爬虫来源于用户发布,如有侵犯您的隐私或版权,请联系我们

版本:v5.3(7)
上架时间:2016-10-21
人气:4939
更新时间:2018-07-11
免费使用
套餐限制:个人免费版
获取爬虫
分享到
应用详情
版本信息
爬取数据示例
自定义项
  请输入获取几天前的数据
  是否采集评论
应用介绍

爬取华尔街见闻的全球资讯版块(http://wallstreetcn.com/news)中的文章,包括标题,概述,内容,发布时间,缩略图,浏览数,主题和分类等。

最新版本:v5.3(7)更新日期:2018-07-11
更新内容
1. 添加采集评论的功能。
历史版本
版本号:v5.2(6)更新日期:2018-05-29
更新内容
1. 目标网站调整,更新爬虫代码。
版本号:v5(5)更新日期:2017-03-23
更新内容
1. 修复爬虫无法爬取数据的问题
版本号:v4(4)更新日期:2016-12-08
更新内容
1. 调整爬虫的去重逻辑,请谨慎更新
注:此次更新会影响之前爬虫的去重逻辑,请新建爬虫并重新爬取数据,否则,仍然会爬取到重复数据!
版本号:v3(3)更新日期:2016-11-03
更新内容
1. 修复爬虫爬取重复数据的问题
2. 修改爬虫字段,请谨慎更新
版本号:v2(2)更新日期:2016-10-21
更新内容
由于华尔街见闻网站改版,做出如下改动:
1. 修改字段的爬取逻辑,给字段增加别名
2. 增加“文章分类”,“文章浏览数”,“文章概述”,“文章缩略图”,“文章主题”和“文章作者头像”字段
3. 重新调整爬取网页的逻辑,使爬虫可以正常使用
常见问题

* 什么是爬虫?

爬虫可以实时、批量、自动化地抓取网页上的数据,有助于快速获取大量数据和信息。

* 如何使用?查看更详细的教程

注册神箭手账号,登录
获取爬虫(收费爬虫可免费试用爬取十条数据)
管理爬虫,启停爬虫、发布和导出数据等

* 爬取的数据如何导出?

爬取的数据会存在神箭手上,您可以:
1、导出到本地文件;
2、自动或者手动发布到您的数据库/网站/微信公众号/邮箱等;
3、设置Webhook推送给您的服务器;
4、通过GraphQL请求数据
导出方式多样,具体请查阅详细教程哦~

* 售后服务

个人版套餐客户:请通过 控制台的工单系统 提交问题;
企业版套餐客户:请通过 控制台的工单系统 OR 在线客服 提交问题。
为什么选择神箭手

购买神箭手的服务支出<< 技术人员(8000元/月) + 服务器费(500元/月) +...

关注公众号
手机也能控制爬虫
新手指南
业务咨询
返回顶部