怎样利用C/C++语言书写一个网页爬虫
答案:3 悬赏:50 手机版
解决时间 2021-04-07 01:55
- 提问者网友:轮囘Li巡影
- 2021-04-06 10:41
怎样利用C/C++语言书写一个网页爬虫
最佳答案
- 五星知识达人网友:上分大魔王
- 2021-04-06 11:59
-.- c++ 些网页代码??? 貌似有些远了啊.
为啥不直接用java 或者JS?
PS, 爬虫又是啥? 写一个字叫爬虫, 还是画一条爬虫?还是游戏一样的, 可以操控的"爬虫"...
为啥不直接用java 或者JS?
PS, 爬虫又是啥? 写一个字叫爬虫, 还是画一条爬虫?还是游戏一样的, 可以操控的"爬虫"...
全部回答
- 1楼网友:廢物販賣機
- 2021-04-06 12:49
网上应该有现成的代码 搜 spider……
- 2楼网友:醉吻情书
- 2021-04-06 12:40
一个C++爬虫步骤大概是这样的,本质上就是一个事件循环(event loop):
初始化epoll,并和server建立TCP连接
从URL队列中拿出url,并准备好http请求
将http请求写入到这个TCP socket中,并把这个socket加入epoll中
检查活动事件(epoll_wait)
处理事件,读取HTML,解析HTML,处理HTML,然后把相关未处理过的URL放入URL队列中
回到第2步
初始化epoll,并和server建立TCP连接
从URL队列中拿出url,并准备好http请求
将http请求写入到这个TCP socket中,并把这个socket加入epoll中
检查活动事件(epoll_wait)
处理事件,读取HTML,解析HTML,处理HTML,然后把相关未处理过的URL放入URL队列中
回到第2步
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
推荐资讯