永发信息网

如何在python中使用xpath

答案:1  悬赏:10  手机版
解决时间 2021-02-06 01:26
如何在python中使用xpath
最佳答案
在进行网页抓取的时候,分析定位html节点是获取抓取信息的关键,目前我用的是lxml模块(用来分析XML文档结构的,当然也能分析html结构), 利用其lxml.html的xpath对html进行分析,获取抓取信息;以下是关于xpath的一些基本用法:
在介绍XPath的匹配规则之前,我们先来看一些有关XPath的基本概念。首先要说的是XPath数据类型。XPath可分为四种数据类型:
节点集(node-set)
节点集是通过路径匹配返回的符合条件的一组节点的集合。其它类型的数据不能转换为节点集。
布尔值(boolean)
由函数或布尔表达式返回的条件匹配值,与一般语言中的布尔值相同,有true和false两个值。布尔值可以和数值类型、字符串类型相互转换。
字符串(string)
字符串即包含一系列字符的集合,XPath中提供了一系列的字符串函数。字符串可与数值类型、布尔值类型的数据相互转换。
数值(number)
在XPath中数值为浮点数,可以是双精度64位浮点数。另外包括一些数值的特殊描述,如非数值NaN(Not-a-Number)、正无穷大 infinity、负无穷大-infinity、正负0等等。number的整数值可以通过函数取得,另外,数值也可以和布尔类型、字符串类型相互转换。
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
he usually s
木榜的意思是什么啊?知道的请说下!
事业单位自有食堂怎么做账
WIN7的WORD有OFFICE助手吗(就是那个小回形针
毛坯房,刮一遍腻子在刷一遍乳胶漆行吗?
【绽开的近义词】绽开的近义词和反义词是什么
红远旅馆这个地址在什么地方,我要处理点事
女生一般在家都会干什么事嘛 晚上呢?
凶强的意思是什么啊?知道的请说下!
有分别两组1-10的数字,每组分别抽取一个数字,
樱桃在什么季节成熟
zt666手机屏幕上有显示那个SIM卡2已关机怎么
win10双硬盘 固态装系统,机械总是百分百占用
精装修的房子怎么装修,什么时候可以入住
大众途观最低配多少钱大众途观最便宜
推荐资讯
评价的指标和方法简便、明晰,易于操作和推广
海宁动车站到海宁火车站怎么走
三星电磁炉质量怎么样
高尔夫7启动转速3秒就降下来了 正常吗 通常14
渟渊的意思是什么啊?知道的请说下!
家用净水器用什么泵比较好?
苹果6splus原装震动器多少钱
百加100c v6怎样刷机线刷
如图,以点B为顶点,射线BA为一边,在∠ABC外作
烟台市福山区哪里有修华为mate8手机屏的
请教关于留学德国工业设计〜
中国银行聊城东昌支行在什么地方啊,我要过去
正方形一边上任一点到这个正方形两条对角线的
阴历怎么看 ?