如何高效地使用DedeCMS的采集过滤规则来优化内容收集?

DedeCMS常用的采集过滤规则包括:去除HTML标签、过滤JavaScript代码、删除特殊字符等。

DEDECMS常用的采集过滤规则

如何高效地使用DedeCMS的采集过滤规则来优化内容收集?

在DEDECMS(织梦内容管理系统)中,采集功能是非常强大的工具,但为了确保采集的内容符合网站需求并减少垃圾信息,通常需要使用过滤规则,以下是一些常用的DEDECMS采集过滤规则:

过滤规则代码
span标签 {dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
div标签 {dede:trim}{/dede:trim}
{dede:trim}

{/dede:trim}

li标签 {dede:trim}

  • {/dede:trim}
    {dede:trim}
  • {/dede:trim}

    ul标签 {dede:trim}

      {/dede:trim}
      {dede:trim}

    {/dede:trim}

    font标签 {dede:trim}{/dede:trim}
    {dede:trim}{/dede:trim}
    table标签 {dede:trim}{/dede:trim}
    {dede:trim}

    {/dede:trim} tbody标签 {dede:trim}{/dede:trim}
    {dede:trim}

    {/dede:trim} tr标签 {dede:trim}{/dede:trim}
    {dede:trim}

    {/dede:trim} td标签 {dede:trim}{/dede:trim}
    {dede:trim}

    {/dede:trim} a标签 {dede:trim}{/dede:trim}
    {dede:trim}{/dede:trim} iframe标签 {dede:trim}{/dede:trim} style标签 {dede:trim}

    {/dede:trim} script标签 {dede:trim}{/dede:trim} option标签 {dede:trim}{/dede:trim} select标签 {dede:trim}{/dede:trim} object标签 {dede:trim}{/dede:trim} embed标签 {dede:trim}{/dede:trim}
    {dede:trim}{/dede:trim} param标签 {dede:trim}{/dede:trim}

    相关问答FAQs

    Q1: 如何保留链接中的文本部分?

    如何高效地使用DedeCMS的采集过滤规则来优化内容收集?

    A1: 如果你希望保留链接中的文本部分,可以使用以下正则表达式来匹配和保留:

    {dede:trim}([^>]*)>{/dede:trim}
    {dede:trim}</a>{/dede:trim}

    这种写法会将链接的文本部分提取出来,而去除链接的其他属性。

    Q2: 如何过滤掉JavaScript广告调用?

    如何高效地使用DedeCMS的采集过滤规则来优化内容收集?

    A2: 你可以使用以下过滤规则来去除JavaScript广告调用:

    {dede:trim}<script(.*)>(.*)</script>{/dede:trim}

    这个规则会匹配并移除所有的<script>标签及其内容,从而避免广告代码被采集到你的页面中。

    原创文章,作者:未希,如若转载,请注明出处:https://www.kdun.com/ask/1222135.html

    (0)
    未希的头像未希新媒体运营
    上一篇 2024-10-18 15:15
    下一篇 2024-10-18 15:17

    相关推荐

    发表回复

    您的电子邮箱地址不会被公开。 必填项已用 * 标注

    免费注册
    电话联系

    400-880-8834

    产品咨询
    产品咨询
    分享本页
    返回顶部
    云产品限时秒杀。精选云产品高防服务器,20M大带宽限量抢购  >>点击进入