官方定制大数据服务:数据采集、数据清洗、数据标注、机器学习等
新华网新华社新闻采集爬虫
爬虫
  •  Robots协议

该应用在神箭云市场已下架
您可下载后羿采集器并输入列表页网址进行采集

版本:v3(3)
上架时间:2016-06-21
热度:93
更新时间:2019-09-12
分享到
应用详情
版本信息
爬取数据示例
应用介绍

爬取新华网新华社新闻(http://www.news.cn/whxw.htm),包括新闻标题、内容、发布日期和新闻标签等。新华社新闻一般都是当天的热点新闻,配合神箭手新增监控可以帮助您随时获取新闻热点。

最新版本:v3(3)更新日期:2019-09-12
更新内容
1、目标网站调整,修改爬虫代码。
历史版本
版本号:v2(2)更新日期:2017-03-31
更新内容
1、修复因目标网站改版导致爬取失败的问题。
版本号:v1(1)更新日期:2016-06-21
更新内容
暂无更新内容
常见问题

* 什么是爬虫?

爬虫可以实时、批量、自动化地抓取网页上的数据,有助于快速获取大量数据和信息。

* 如何使用?查看更详细的教程

注册神箭手账号,登录
获取爬虫(收费爬虫可免费试用爬取十条数据)
管理爬虫,启停爬虫、发布和导出数据等

* 爬取的数据如何导出?

爬取的数据会存在神箭手上,您可以:
1、导出到本地文件;
2、自动或者手动发布到您的数据库/网站/微信公众号/邮箱等;
3、设置Webhook推送给您的服务器;
4、通过GraphQL请求数据
导出方式多样,具体请查阅详细教程哦~

* 售后服务

个人版套餐客户:请通过 控制台的工单系统 提交问题;
企业版套餐客户:请通过 控制台的工单系统 OR 在线客服 提交问题。
为什么选择神箭手

购买神箭手的服务支出<< 技术人员(8000元/月) + 服务器费(500元/月) +...

关注公众号
手机也能控制爬虫
新手指南
业务咨询
返回顶部