男人视频网站_蜜臀久久久久_色视频免费_久久精品人人_日韩中文字幕不卡_日本黄色短视频

爬蟲采集器Xpath常見語法使用詳細(xì)教程

  XPath語法在簡數(shù)采集器中是定位獲取頁面HTML標(biāo)簽或者標(biāo)簽中的內(nèi)容。(需要懂點HTML代碼知識,重點看第4和第5章


1.  /--選擇對應(yīng)的子標(biāo)簽

例子:/html/body/p/a

上面xpath路徑意思是獲取html標(biāo)簽下的子標(biāo)簽body,body下的子標(biāo)簽p,p下的子標(biāo)簽a,獲取結(jié)果是對應(yīng)下圖的第10行a標(biāo)簽;



2.  // --選擇對應(yīng)的子孫標(biāo)簽,即不考慮嵌套位置

例子:/html/body/p//a

上面xpath路徑意思是獲取html標(biāo)簽下的子標(biāo)簽body,body下的子標(biāo)簽p,p下的所有標(biāo)簽a,獲取結(jié)果是對應(yīng)下圖的第10行和12行的a標(biāo)簽;


3.  [數(shù)字]--選取第幾個標(biāo)簽

例子:/html/body/p/a[2]

上面xpath路徑意思是獲取html標(biāo)簽下的子標(biāo)簽body,body下的子標(biāo)簽p,p下的第二個標(biāo)簽a,獲取結(jié)果是對應(yīng)下圖的第11行的a標(biāo)簽;


4. //*[@屬性="值"]--選取屬性對應(yīng)的標(biāo)簽(重點)

@后面常填寫id或者class屬性,若能在頁面找到對應(yīng)的id屬性更好,因為id屬性在頁面是唯一的值,即一個id值只能出現(xiàn)一次;

例子://*[@id="main"]

上面xpath路徑意思是獲取頁面中id屬性值為main的標(biāo)簽,不管嵌套關(guān)系了,直接定位到對應(yīng)屬性值的標(biāo)簽,十分快捷方便,獲取結(jié)果是對應(yīng)下圖的第14行的a標(biāo)簽;


如果不用屬性來定位,就得寫成  /html/body/div/p/a ;


5. 在簡數(shù)采集器為例:

I、打開詳情提起器,點擊【打開網(wǎng)頁】


II、打開查看html代碼界面


III、查找有沒對應(yīng)正文的特殊屬性,找到class="m-t-md wzzPd in2"


IV、填寫到xpath路徑中

   

   大部分爬蟲都是使用xpath作為規(guī)則提取,屬于通用規(guī)則,市面大部分采集器都支持xpath。

主站蜘蛛池模板: 国产91丝袜美女在线播放 | 免费成人深夜夜视频 | 天天干女人 | 精品国产户外野外 | 日本aⅴ在线 | 精品久久久久久亚洲精品 | 日韩中文字幕在线观看视频 | 一级黄色大片 | 日韩视频一区二区在线观看 | 97超碰免费观看 | 自拍偷拍视频网站 | 色婷婷av一区二区三区软件 | 欧美a一级 | 国产毛片网 | 超碰人人艹| 91插插插影库永久免费 | 三级av在线 | 日韩激情视频在线 | 怡红院在线播放 | 日韩中文字幕精品 | 亚洲成人a v| 日韩va在线 | 国产99对白在线播放 | 欧美三级小视频 | 日韩中文字幕国产 | 日日夜夜操视频 | 91精品国产一区 | 欧美刺激脚交jootjob | 九九久久99 | 精品国产视频 | 三上悠亚在线播放 | 精品网站999www | 亚洲第三十七页 | 国产真实乱偷精品视频 | 手机在线精品视频 | 日韩精品福利视频 | 国内精品国产成人国产三级 | 日本道中文字幕 | 亚洲精品av在线 | 国产一区99 | 久久久久高清 |