永发信息网

怎样用python爬新浪微博大V所有数据

答案:1  悬赏:20  手机版
解决时间 2021-10-17 19:33
怎样用python爬新浪微博大V所有数据
最佳答案
先上结论,通过公开的api如果想爬到某大v的所有数据,需要满足以下两个条件:  1、在你的爬虫开始运行时,该大v的所有微博发布量没有超过回溯查询的上限,新浪是2000,twitter是3200。  2、爬虫程序必须不间断运行。  新浪微博的api基本完全照搬twitter,其中接口的参数特性与底层的NoSQL密不可分,建议先看点Nosql数据库的设计理念有助于更好的理解api设计。  一般来说,如果决定爬某个大v,第一步先试获取该用户的基本信息,中间会包含一条最新的status,记下其中的id号作为基准,命名为baseId。  接口中最重要的两个参数:  since_id:返回ID比since_id大的微博(即比since_id时间晚的微博),默认为0。  max_id:返回ID小于或等于max_id的微博,默认为0。  出于各种原因,获取statuses的接口,固定为按id降序排列(scan_index_forward=false),即最新的statuses返回在前。假设该微博第一天上线,就一个用户,发了一百条,id是1到100。而你在该用户发了第50条的时候开始运行的爬虫,即baseId=50。
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
海尔ms70-bz1528怎么样
昆明成人英语培训机构哪家好?
请问从东莞巿怎样去台山下川岛呢
请问如果只在这三个女宝宝名字里面选一个,哪
问请问房贷怎么还最合算?麻烦说说。
莫泰168(上海浦东张江路店) 有电话吗?
客房卫生间清扫的十字决?
上海专业拆装家具哪家比较好
三星手机BADA系统上网速度快么?
博山路200弄对口什么中学
美标水龙头怎样样?价格贵吗?什么价位?
大连普兰店众森德泰科一考场办公地址在什么地
铝合金推拉门五金配件哪些品牌比较好?求哪位
雅姿面膜怎么样
大连市交警支队普兰店大队审验教育培训中心办
推荐资讯
请问腹部大量胀气怎么引起的?
65岁老人还能交养老保险吗
木地板能房屋吊顶吗?乐宜家实木地板怎么样?
个人消费贷款有没有限额
一个人的头发有多少根?
有谁买过吸鼻器好用的求推荐。。。。。。
穿梭车货架在仓储物流设备中怎么使用?
DNF送达芙妮晶体赚钱么,我6个号,请问1天大
哪里才能买到帕秋莉色的染发剂
戴尔笔记本电脑的飞行模式关不掉
闵行区交警支队交通违法审理地址在哪,我要去
“拯救生命是第一位的”.图为4月15日来自广
正方形一边上任一点到这个正方形两条对角线的
阴历怎么看 ?