永发信息网

使用apscheduler 和 scrapy 做定时抓取爬虫为什么只抓取一次

答案:2  悬赏:40  手机版
解决时间 2021-03-22 23:42
使用apscheduler 和 scrapy 做定时抓取爬虫为什么只抓取一次
最佳答案
代码:
from apscheduler.schedulers.background import BackgroundScheduler
from apscheduler.triggers.cron import CronTrigger
import time
from log.make_log import make_log_file
from scrapy.crawler import CrawlerProcess
from scrapy.utils.project import get_project_settings
from spider.spiders.aqi import AqiSpider
def aqi(crawler, spider):
try:
crawler.crawl(spider)
crawler.start()
except Exception, e:
make_log_file(str(e),'scrapy')

if __name__ == '__main__':
settings = get_project_settings()
crawler = CrawlerProcess(settings)
spider = AqiSpider()
scheduler = BackgroundScheduler()
scheduler.daemonic=False
cron = CronTrigger(second='*/30')
scheduler.add_job(aqi, cron, args=[crawler, spider])
scheduler.start()
while True:
time.sleep(1000)
全部回答
经过自己折腾和翻墙查找终于让它在linux下运行起来了,第一次调度爬虫作业是打开的,但是不解析网页,只有第二次调度它时,它才开始解析并且正常工作。 猜测和react.run()有关,apscheduler任务调度框架和scrapy结合使用时是要在twisted框架下使用的。 当要定时执行爬虫任务时,第一次不解析,第二次开始解析。
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
唐山驴肉多少钱一斤,那里有卖的
证件照电子版是什么,有什么软件可以拍证件照
体育运动中蕴含很多物理知识,网球运动员挥拍
5月31日小米发布什么手机
近些年十大搞笑小说儿。
15.25个月的薪资是什么意思?
哈士奇精力太过旺盛老是拆家怎么办
美艺休闲会所怎么去啊,有知道地址的么
80变压器可以带45,15,7.5千万的电机吗
H.O.T《希望》mp3下载
五脏六腹是哪些?
下列有关甲型H1N1流感病毒的描述中,正确的是
赞美春天的句子长一点,赞美老师长句子
大写五千四百一十五元怎么写
电路回路的最基本本质是什么?为什么会有0V和
推荐资讯
撤市设区有什么好处,撤县设区有什么好处
订书钉的订书针规格
《山海经·大荒北经》繁体古文
八一诗歌朗诵小学生,二人诗朗诵 关于友谊的
重庆姐妹火锅店在什么地方啊,我要过去处理事
口出而作,口入而岔 啥意思
香河哪个家政公司比较好
被等候好友的诗句,清理微信好友的语句
打嘴巴共多少画?
重情义的兄弟,一段话,急急急
铭新广告地址在什么地方,想过去办事
寒梅·椒麻鸡·馄饨专卖店地址有知道的么?有
正方形一边上任一点到这个正方形两条对角线的
阴历怎么看 ?