官方定制大数据服务:数据采集、数据清洗、数据标注、机器学习等
广告法极限词自检监测爬虫
爬虫
  •  开源
  •  Robots协议

该应用在神箭云市场已下架
您可下载后羿采集器并输入列表页网址进行采集

版本:v1.1(2)
上架时间:2019-04-02
热度:92
更新时间:2019-09-12
分享到
应用详情
版本信息
爬取数据示例
自定义项
  需要检测的网站的入口地址
  需要检查的极限词
应用介绍

根据现行广告法的要求,在宣传产品的过程中,不能出现一些极限词

该爬虫会自动对输入的网页的全站进行扫描,凡是发现有极限词的地方,会把极限词本身和网页的地址记录下来。

注意由于极限词本身的含义不一定100%触犯广告法,所以爬虫筛选出来的结果还需要进行人工筛选(爬虫本身已经做了一些优化处理)。

比如:某软件最新版 则是不违反广告法的表述方式,虽然其中含有[最]字。

如果发现爬虫对于极限词的收录不完整或者针对不同行业中有一些特殊的极限词,也可以手动添加到设置中去。


最新版本:v1.1(2)更新日期:2019-09-12
更新内容
1.修复部分极限词判断错误的问题
历史版本
版本号:v1.0(1)更新日期:2019-04-02
更新内容
暂无更新内容
常见问题

* 什么是爬虫?

爬虫可以实时、批量、自动化地抓取网页上的数据,有助于快速获取大量数据和信息。

* 如何使用?查看更详细的教程

注册神箭手账号,登录
获取爬虫(收费爬虫可免费试用爬取十条数据)
管理爬虫,启停爬虫、发布和导出数据等

* 爬取的数据如何导出?

爬取的数据会存在神箭手上,您可以:
1、导出到本地文件;
2、自动或者手动发布到您的数据库/网站/微信公众号/邮箱等;
3、设置Webhook推送给您的服务器;
4、通过GraphQL请求数据
导出方式多样,具体请查阅详细教程哦~

* 售后服务

个人版套餐客户:请通过 控制台的工单系统 提交问题;
企业版套餐客户:请通过 控制台的工单系统 OR 在线客服 提交问题。
为什么选择神箭手

购买神箭手的服务支出<< 技术人员(8000元/月) + 服务器费(500元/月) +...

关注公众号
手机也能控制爬虫
新手指南
业务咨询
返回顶部