当前位置:首页 >  技术文章 >  如何高效地使用DedeCMS的采集过滤规则来优化内容收集

如何高效地使用DedeCMS的采集过滤规则来优化内容收集

文章作者:佚名 发布时间:2024-10-21 09:56:58 来源:互联网

DedeCMS常用的采集过滤规则包括:去除HTML标签、过滤JavaScript代码、删除特殊字符等。

DEDECMS常用的采集过滤规则

如何高效地使用DedeCMS的采集过滤规则来优化内容收集

在DEDECMS(织梦内容管理系统)中,采集功能是非常强大的工具,但为了确保采集的内容符合网站需求并减少垃圾信息,通常需要使用过滤规则,以下是一些常用的DEDECMS采集过滤规则:

过滤规则代码
span标签 {dede:trim}{/dede:trim} {dede:trim}{/dede:trim}
div标签 {dede:trim}{/dede:trim} {dede:trim}

{/dede:trim}

li标签 {dede:trim} {/dede:trim} {dede:trim}

{/dede:trim}

ul标签 {dede:trim}
  • {/dede:trim} {dede:trim}

{/dede:trim}

font标签 {dede:trim}{/dede:trim} {dede:trim}{/dede:trim}
table标签 {dede:trim}

{/dede:trim}

tbody标签 {dede:trim}{/dede:trim} {dede:trim}

{/dede:trim}

tr标签 {dede:trim}

{/dede:trim}

td标签 {dede:trim}{/dede:trim} {dede:trim}

{/dede:trim}

a标签 {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} iframe标签 {dede:trim}{/dede:trim} style标签 {dede:trim} script标签 {dede:trim}{/dede:trim} option标签 {dede:trim}{/dede:trim} select标签 {dede:trim}{/dede:trim} object标签 {dede:trim}{/dede:trim} embed标签 {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} param标签 {dede:trim}{/dede:trim}

相关问答FAQs

Q1: 如何保留链接中的文本部分?

A1: 如果你希望保留链接中的文本部分,可以使用以下正则表达式来匹配和保留:

 {dede:trim}([^>]*)>{/dede:trim} {dede:trim}</a>{/dede:trim}

这种写法会将链接的文本部分提取出来,而去除链接的其他属性。

Q2: 如何过滤掉JavaScript广告调用?

A2: 你可以使用以下过滤规则来去除JavaScript广告调用:

 {dede:trim}<script(.*)>(.*)</script>{/dede:trim}

这个规则会匹配并移除所有的<script>标签及其内容,从而避免广告代码被采集到你的页面中。

关于我们 |联系我们 |法律声明 |最近更新 |软件发布 |网站地图

虎逗游戏网 冀ICP备20020021号 ©2015 www.hudou.net 冀公网安备 13040302001491号

本站资源均收集整理于互联网,其著作权归原作者所有,如果有侵犯您权利的资源,请来信告知,我们将及时撤销相应资源。

温馨提示:抵制不良游戏 拒绝盗版游戏 注意自我保护 谨防受骗上当 适度游戏益脑 沉迷游戏伤身 合理安排时间 享受健康生活