【帝国CMS教学】帝国cms分页采集正则及过滤技巧
发布时间:2023-04-02 21:42:22
文章来源:快乐收录网
访问次数:
老实说我并不主张互联网采集,不过做为站长,网页采集实在是一大利器。拿帝国CMS来说,采集功能很强大。虽然帝国CMS采集方法简单易学,但还是有朋友为采集规则而绞尽脑汁。以下是我凭吊的一些帝国CMS的采集正则。
从文章的源代码中获得的
第一种:
palign='center'bfontcolor='white'http:///fontnbsp;ahref='/Eat/RMenu/200806/38611_2.html'https:///anbsp;ahref='/Eat/RMenu/200806/38611_3.html':/anbsp;ahref='/Eat/RMenu/200806/38611_4.html':/anbsp;ahref='/Eat/RMenu/200806/38611_2.html'下一页/a/b/p
编写的规则:
选全部列出式区域正则:
palign='center'bfontcolor='orange'[!--smallpageallzz--]'下一页
链接正则:
ahref='[!--pageallzz--]'
第二种
采集代码
palign='center'bfontcolor='orange'http:///fontnbsp;ahref='/fm/3/zw_31205_2.html'https:///anbsp;ahref='/gw/3/gw_31205_2.html'下一页/a/b/pcenter《
编写的规则:
选用上下导航式:
分页区域正则:fontcolor='silver'[!--smallpagezz--]下一页
分页链接正则:ahref='[!--pagezz--]'
新闻正文正则:
src="http://pagead2.googlesyndication.cc/pagead/show_ads.js"
/courier/td
/tr
/table[!--newstext--]/td
/tr
tr
tdwidth=5/td
过滤广告正则:
/pcenter[!--后羿--]/center,/psalign='center'[!--刺客--]/b
例如:
第三种
palign="center"imgsrc="/bgy/Images_1/sy8.txt"border="0"align="absbottom"FONTstyle="COLOR:#ff0000"【1】/fontaclass=pagehref="094221656-2.html"walmart=_self【2】/aaclass=pagehref="094221656-3.html"沃尔玛=_self【3】/aaclass=pagehref="094221656-4.html"kroger=_self【4】/aaclass=pagehref="094221656-5.html"wayfair=_self【5】/aahref="094221656-2.html"imgsrc="/gwy/Images1/xy???"border="0"align="absbottom"/a/p
编写的规则:
"全部列出"式正则设置:
分页区域正则(无)
分页链接正则:aclass=pagehref="[!--pageallzz--]"tesco=_self
第四种:
表格class=pageContainercssclass=pagerspanclass="nextprev"nxp;nxp;前一页/spanspanclass="current"1/spanahref="0731_3493_686224_1.shtml"title="转到第2页"2/aahref="0731_3493_686224_2.shtml"title="转到第3页"3/aahref="0731_3493_686224_1.shtml"class="nextprev"title="后一页"后一页gt;gt;/a/表格/span/窗体
/span
选全部列出式区域正则:
cssclass=pageContainerspanclass=pagerspanclass="nextprev"[!--smallpageallzz--]"class="nextprev"title="后一页"
链接正则:
a href="[!--pageallzz--]"
《【帝国CMS教学】帝国cms分页采集正则及过滤技巧》更新于时间:2023-04-02 21:42:22;由本站小编进行发布,目前浏览的小伙伴达到,感谢你们的支持,后期快乐收录网小编会继续为大家更新更多相关的文章,希望广大网友多多关注快乐收录网工作心得栏目,如果觉得本站不错,那就给我们一个分享的支持吧!
【帝国CMS教学】帝国cms分页采集正则及过滤技巧特别声明
本站快乐收录网提供的【帝国CMS教学】帝国cms分页采集正则及过滤技巧都来源于网络,不保证文章的准确性和真实性,同时,对于该文章所造成的影响,不由快乐收录网实际控制,在2023-04-02 21:42:22收录时,该网页上的内容,都属于合规合法,如有侵权违规,可以直接联系网站管理员进行整改或删除,快乐收录网不承担任何责任。
快乐收录网:致力于优质、实用的网络站点资源收集与分享!本文地址:https://nav.klxjz.cn/CMS/empirecms/2023-04-02/92392.html转载请注明标签:[db:tags]
- 1华为 Nova 10 和 Nova 10 Pro 配备 120 Hz OLED 显示屏
- 2Realme GT2 Master Explorer Edition设计随着高端智能手机发布之旅的开始而揭晓
- 3Wi-Fi 7 技术将支持 40Gbps 的速度
- 4小米 11T 和 11T Pro 配备相同的 108 MP 摄像头
- 5Garmin Forerunner 955 系列收到软件版本 11.12
- 6到 2026 年翻新智能手机市场的价值预计将增长近 460 亿美元
- 7小米发布 Band 7 Pro 固件更新 进行各种改进和优化
- 8苹果最新的MacBook Air产品将影响 Wintel 笔记本电脑的销售
- 9戴尔 Precision 7770 和 7670 现在可与英特尔第 12 代博锐 CPU 和 Nvidia RTX A5500 显卡一起购买
- 10System76 使用 Intel Alder Lake-U 处理器升级其基于 Linux 的 Lemur Pro 笔记本电脑
- 11苹果计划在今年发布标准 Watch Series 更新的替代品
- 12OnePlus的10T发布了新旗舰智能手机发布前的最高AnTuTu分数
- 13摩托罗拉 Edge 30:搭载 Android 12 的超薄中端智能手机
- 14小米 12智能手机相机是如何拍摄的
- 15NintendoSwitchOnline下周将获得被低估的神奇宝贝经典
- 16MUJI x Honda MS01 电动自行车透露最高时速 25 公里和无钥匙解锁功能
- 17Infinix 最新 Note 12 系列智能手机升级至 5G 起价低于 200 美元
- 18Amazfit 正在举行 2022 年年中的促销活动
- 19AMD 的 RDNA 3 Chiplet 专利详述了尖端着色器优化架构