永发信息网

python 爬虫 用什么ide 好

答案:2  悬赏:40  手机版
解决时间 2021-03-21 19:48
python 爬虫 用什么ide 好
最佳答案
写爬虫的话,可以看看神箭手云爬虫开发文档,里面的教程很详细,各种基本爬虫基础和进阶开发知识都有介绍,而且上面还有不少爬虫源码分享。
全部回答
由于项目需求收集并使用过一些爬虫相关库,做过一些对比分析。以下是我接触过的一些库: beautiful soup。名气大,整合了一些常用爬虫需求。缺点:不能加载js。 scrapy。看起来很强大的爬虫框架,可以满足简单的页面爬取(比如可以明确获知url pattern的情况)。用这个框架可以轻松爬下来如亚马逊商品信息之类的数据。但是对于稍微复杂一点的页面,如weibo的页面信息,这个框架就满足不了需求了。 mechanize。优点:可以加载js。缺点:文档严重缺失。不过通过官方的example以及人肉尝试的方法,还是勉强能用的。 selenium。这是一个调用浏览器的driver,通过这个库你可以直接调用浏览器完成某些操作,比如输入验证码。 cola。一个分布式爬虫框架。项目整体设计有点糟,模块间耦合度较高,不过值得借鉴。 以下是我的一些实践经验: 对于简单的需求,比如有固定pattern的信息,怎么搞都是可以的。 对于较为复杂的需求,比如爬取动态页面、涉及状态转换、涉及反爬虫机制、涉及高并发,这种情况下是很难找到一个契合需求的库的,很多东西只能自己写。 至于题主提到的: 还有,采用现有的python爬虫框架,相比与直接使用内置库,优势在哪?因为python本身写爬虫已经很简单了。 third party library可以做到built-in library做不到或者做起来很困难的事情,仅此而已。还有就是,爬虫简不简单,完全取决于需求,跟python是没什么关系的。
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
这几天睡眠质量很差,大多处于半梦半醒状态,
卡路里 人每天要吸收1200大卡 但是如果运动了
电影《迫在眉睫》片头曲名字!!
男生说女生可爱啥意思,我喜欢的女孩给我说压
读右图并结合材料,分析回到问题.材料:2005
杭州恒信德悦汽车服务有限公司地址在什么地方
世界上有多少人叫王俊凯
去俄罗斯留学是换卢布好还是美金好,我不想太
dphe中文是什么意思
鹿晗生日都有谁送祝福,鹿晗26生日exo有成员来
胸罩中间一条带子是干嘛用的
奥克斯电磁炉acl-2004显示板符号
This suggestion is well worthy .A. to be c
请教一个尼康 D610的 镜头问题。
羽笛装饰地址有知道的么?有点事想过去
推荐资讯
周家河头湾怎么去啊,有知道地址的么
首都经济贸易大学的代码
僵尸农场中文版下载
初三上学期学生评语,老师对学生的评语150字左
美佳乐便利店我想知道这个在什么地方
有什么好看的视频,长知识的、有趣的如《草根
刺管棒怎么吃
和女子出嫁有关的词语有哪些
有适合6年级用的学习游戏手机软件
安徽宿州灵壁第二届奇石节
本人预算5W左右,摩托新手,想买个品牌的太子
《食神》少林寺背景音乐
正方形一边上任一点到这个正方形两条对角线的
阴历怎么看 ?