簡(jiǎn)數(shù)采集器正則表達(dá)式功能:用戶可使用正則表達(dá)式提取或者替換匹配內(nèi)容;
簡(jiǎn)數(shù)采集器將一些常用的正則表達(dá)式列出,方便用戶使用:日期,中文日期,正整數(shù),負(fù)整數(shù),正浮點(diǎn)數(shù),負(fù)浮點(diǎn)數(shù),網(wǎng)址URL,Email,IP和身份證號(hào)。
雙擊采集的字段或者字段右邊的綠色設(shè)置按鈕進(jìn)入數(shù)據(jù)處理==》轉(zhuǎn)到 “日期等正則提取” 欄目;


1. 字段原值:采集內(nèi)容顯示區(qū),可與最下方的 “字段處理后值” 作對(duì)比;
2. 常用表達(dá)式:點(diǎn)擊該處的按鈕,會(huì)出現(xiàn)相應(yīng)的正則表達(dá)式;
3. 將匹配的內(nèi)容:可填寫要替換的字符串或正則表達(dá)式;(該處會(huì)匹配原值中符合條件的所有內(nèi)容)
4. 替換為:如果不填,匹配的內(nèi)容會(huì)替換原值;
如果填寫了,匹配的內(nèi)容會(huì)被填寫的值替換,原值其他內(nèi)容保持不變;(例子見下方結(jié)果)
5. 正則捕獲組:使用捕獲語法提取匹配內(nèi)容,該處只能提取不能替換;(該處正則只會(huì)匹配原值中符合的第一個(gè)內(nèi)容)
6. 多組值分隔符:如果正則捕獲組有多個(gè),填寫的值會(huì)作為多個(gè)捕獲組間的分隔符;(例子見下方中文日期)
PS:如果不填,則無分隔符;
7. 字段處理后值:該處為正則匹配內(nèi)容處理后的結(jié)果值,根據(jù)配置可分三種情況:
——顯示提取匹配的內(nèi)容;
——顯示原值替換匹配內(nèi)容后的結(jié)果值;
——無匹配到任何內(nèi)容,為空;
1. 日期

2. 中文日期

3. 網(wǎng)址URL

4. Email

5. 正則替換
