侠客V3抓取模块常用的两段正则

(?<=<div id="mcontent" class="page_wz">)[\s\S]*?(?=<div align="center">)

(?<=<meta name="sitename" content=").*?(?=")


(?<=<title>).*?(?=</title>)

<!--提取标准日期时间 2011-04-06 11:12:28 -->
\d{4}-\d{1,2}-\d{1,2} \d{1,2}:\d{1,2}:\d{1,2}

(?<=&yxdm=)[\s\S]*?(?=状态:200)

发表评论