永发信息网

如何用scrapy提取不在标签内的文字

答案:2  悬赏:70  手机版
解决时间 2021-02-21 10:40
如何用scrapy提取不在标签内的文字
最佳答案
代码如下

def parse(self,response):
states = {}
list1 = []
list2 = []

for row in response.xpath("//*[@id='info']/*"):
if row.xpath("span[@class='pl']/text()"):
title = row.xpath("span[@class='pl']/text()").extract()[0].strip()
text = row.xpath("a/text()").extract()[0].strip()
states[title]=text
elif row.xpath("text()"):
list1.append(row.xpath("text()").extract()[0].strip()[:-1])

for row in response.xpath("//*[@id='info']/text()").extract():
if row.strip():
list2.append(row.strip())

for i in range(len(list1)):
states[list1[i]]=list2[i]

for n in states:
print n,states[n]
全部回答
xpath 如果返回的是多个元素的话,比如你这里就是多个 那就要用到循环 content=""for selector in sel.xpath('//div[@class="document"]//p'): content=content+ selector.xpath("/text()").extract()
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
增城区物业管理协会怎么去啊,有知道地址的么
肚子有凉气怎么办
我老公和一关系很好的女同事在微信上玩暧昧,
光合作用与细胞呼吸是植物体的两个重要生理活
倩影照相复印打印地址在什么地方,想过去办事
sukin在武汉哪里有卖的
关于南京 禁塑令实施后的为什么 那么失败
富翔嘉苑这个地址在什么地方,我要处理点事
新婚姻法咨询 如果一方婚前贷款买了期房,房
我结婚六年,刚开始是家里特别穷,到后来感情
张大爷每个季度末都要家中电表上的读数.下面
孔桥村怎么去啊,有知道地址的么
英雄联盟里说平A是什么意思
Well done的用法,什么时候用?意思?
当σy/ τ较小,通缝方向与作用力方向的夹角
推荐资讯
【向日葵花】我喜欢向日葵花作文
岭坝乡在什么地方啊,我要过去处理事情
老板借故拖欠工资如何解决?
我是做进口红酒的!负责烟酒便利店!怎么才能
梦见女同学离婚了,意味着什么?
为什么我不能吃苹果,每次都流血
景深和什么有关
阿香米线万达店在什么地方啊,我要过去处理事
绵阳希望饲料有限公司盐亭总代理地址在什么地
双绞线为什么能减少干扰呢
谁能给我解释下四维空间里,物质,和人的身体,
TCL-罗格朗国际电工(惠州有限公司)地址在哪,
正方形一边上任一点到这个正方形两条对角线的
阴历怎么看 ?