应该怎么做呢,大家有什么思路吗?做这样一个系统代码量大吗
有源码的最好了,会追加分数
用java程序实现定期抓取网页的一些信息
答案:3 悬赏:30 手机版
解决时间 2021-03-12 05:14
- 提问者网友:两耳就是菩提
- 2021-03-12 00:24
最佳答案
- 五星知识达人网友:未来江山和你
- 2021-03-12 01:50
思路:
定时器的话java里有Timer.schedule()可定时执行任务;
读取网页可以用httpClient这个封装好的工具,建立http连接
读取网页后,可以Pattern和Match实现正则表达式,匹配相关信息
定时器的话java里有Timer.schedule()可定时执行任务;
读取网页可以用httpClient这个封装好的工具,建立http连接
读取网页后,可以Pattern和Match实现正则表达式,匹配相关信息
全部回答
- 1楼网友:蓝房子
- 2021-03-12 03:06
1. 用jsoup抓取生成页面后的静态信息,非常简单,会jquery的选择器就会用
2. 对于加载页面后通过ajax返回刷新的页面,没办法,请从发出的request返回xml或json的数据一条条分析,看是哪个
爬虫不可能任意条件下都适用的!
- 2楼网友:山君与见山
- 2021-03-12 02:44
看你要多少时间的定期了,自己做肯定工作量大,八爪鱼采集器支持从一个月到1分钟的各种速度定时,目前是免费的,给源码给你的只能说明这个源码没啥用,真正好用的软件,源码肯定不是一般人能买得起的,估计好点的给钱也不卖吧。
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
推荐资讯