永发信息网

如何用scrapy提取不在标签内的文字

答案:2 悬赏:70 手机版

解决时间 2021-02-21 10:40

提问者网友：相思似海深
2021-02-21 00:26

如何用scrapy提取不在标签内的文字

最佳答案

五星知识达人网友：洎扰庸人
2021-02-21 01:09

代码如下

def parse(self,response):
states = {}
list1 = []
list2 = []

for row in response.xpath("//*[@id='info']/*"):
if row.xpath("span[@class='pl']/text()"):
title = row.xpath("span[@class='pl']/text()").extract()[0].strip()
text = row.xpath("a/text()").extract()[0].strip()
states[title]=text
elif row.xpath("text()"):
list1.append(row.xpath("text()").extract()[0].strip()[:-1])

for row in response.xpath("//*[@id='info']/text()").extract():
if row.strip():
list2.append(row.strip())

for i in range(len(list1)):
states[list1[i]]=list2[i]

for n in states:
print n,states[n]

全部回答

1楼网友：动情书生
2021-02-21 02:10

xpath 如果返回的是多个元素的话,比如你这里就是多个那就要用到循环 content=""for selector in sel.xpath('//div[@class="document"]//p'): content=content+ selector.xpath("/text()").extract()

我要举报

如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息，可以点下面链接进行举报！

大家都在看

增城区物业管理协会怎么去啊，有知道地址的么

肚子有凉气怎么办

我老公和一关系很好的女同事在微信上玩暧昧，

光合作用与细胞呼吸是植物体的两个重要生理活

倩影照相复印打印地址在什么地方，想过去办事

sukin在武汉哪里有卖的

关于南京禁塑令实施后的为什么那么失败

富翔嘉苑这个地址在什么地方，我要处理点事

新婚姻法咨询如果一方婚前贷款买了期房，房

我结婚六年，刚开始是家里特别穷，到后来感情

张大爷每个季度末都要家中电表上的读数.下面

孔桥村怎么去啊，有知道地址的么

英雄联盟里说平A是什么意思

Well done的用法，什么时候用？意思？

当σy/ τ较小，通缝方向与作用力方向的夹角

推荐资讯

【向日葵花】我喜欢向日葵花作文

岭坝乡在什么地方啊，我要过去处理事情

老板借故拖欠工资如何解决？

我是做进口红酒的！负责烟酒便利店！怎么才能

梦见女同学离婚了，意味着什么？

为什么我不能吃苹果，每次都流血

景深和什么有关

阿香米线万达店在什么地方啊，我要过去处理事

绵阳希望饲料有限公司盐亭总代理地址在什么地

双绞线为什么能减少干扰呢

谁能给我解释下四维空间里,物质,和人的身体,

TCL-罗格朗国际电工(惠州有限公司)地址在哪，

正方形一边上任一点到这个正方形两条对角线的

阴历怎么看？

网站首页 | 关于我们 | 网站留言

联系永发信息网
Copyright © 2025 永发信息网版权所有