男人视频网站_蜜臀久久久久_色视频免费_久久精品人人_日韩中文字幕不卡_日本黄色短视频

采集器:常用正則表達式語法

正則表達式是一種表達文本模式(即字符串結構)的方法,有點像字符串的模板,常常用作按照“給定模式”匹配文本的工具,簡單概括就是模糊匹配特定內容。

比如,正則表達式給出一個正整數的模式,然后用它來確定一個字符串是否為正整數,正則:[1-9]\d*

數據采集器一般都支持使用正則語法來提取數據。簡數采集器也支持各種正則語法,并內置了很多常見正則提取的表達式,用戶只需要點需要的按鈕,即可填入正則表達式。常見有:日期、IP、鏈接URL、email、身份證號等等。


常用的元字符

有特殊含義,不代表字面的意思;

1、點字符(.)

匹配除回車(\r)、換行(\n) 、行分隔符和段分隔符以外的所有字符。


2、位置字符

^ 表示字符串的開始位置

$ 表示字符串的結束位置


3、選擇符(|)

豎線符號(|)在正則表達式中表示“或關系”(OR),即a|b表示匹配a或b。


4、轉義符
正則模式中,需要用斜杠轉義的,一共有12個字符:^、 .、 [、 $、 (、 )、 |、 *、 +、 ?、 {和\\。


5、預定義模式

    \d 匹配0-9之間的任一數字,相當于[0-9];

    \D 匹配所有0-9以外的字符,相當于[^0-9];

    \w 匹配任意的字母、數字和下劃線,相當于[A-Za-z0-9_];

    \W 除所有字母、數字和下劃線以外的字符,相當于[^A-Za-z0-9_];

    \s 匹配空格(包括制表符、空格符、斷行符等),相等于[\t\r\n\v\f];

    \S 匹配非空格的字符,相當于[^\t\r\n\v\f];


6、量詞符

    ? 問號表示某個模式出現0次或1次;

    * 星號表示某個模式出現0次或多次;  

    + 加號表示某個模式出現1次或多次;


簡數采集支持使用的正則表達式



主站蜘蛛池模板: 国产一区二区免费 | 超碰在线中文字幕 | 天干夜天干天天天爽视频 | 国产午夜麻豆影院在线观看 | 最新在线黄色网址 | 国产精品情侣呻吟对白视频 | 国产精品乱码久久久 | 99国产精品99久久久久久 | 中文字幕资源在线 | 亚洲精品xxxx | www.午夜 | 亚洲区一区二 | 在线看v | 成年视频在线播放 | 色天天干 | 久久久久久久999 | 日韩一区二区三区在线观看 | 殴美一区二区 | 精品成人国产 | 亚洲视频免费在线观看 | 一本色道久久综合亚洲精品按摩 | 欧美精品一区二区三区视频 | 亚洲第一网址 | 久久机热这里只有精品 | 日韩a在线 | 超碰天堂 | 夜夜精品视频 | 成人毛片100免费观看 | 在线免费日韩 | 91久久久久 | 亚洲综合一区二区三区 | 狂野欧美性猛交 | 深爱五月网 | 日本亚洲欧美在线 | 手机看片日韩欧美 | 一个综合色 | 久久视频免费看 | 免费成人视屏 | av在线天天 | 日本免费色 | 久久久久女教师免费一区 |