关于织梦(DedeCMS)采集过滤的万能代码,以下是一个基本的示例,这个代码并不是“万能”的,因为每个网站的采集需求可能都不同,但以下代码可以作为基础,根据具体需求进行调整。
<?php //织梦dedecms采集过滤万能代码 function dede_filter($content) { // 过滤HTML标签 $content = strip_tags($content); // 过滤XSS攻击 $content = htmlspecialchars($content, ENT_QUOTES, 'UTF8'); // 过滤特殊字符 $content = str_replace(array(" ", " ", " ", "&", "<", ">", """, " "), array("", "", "", "&", "<", ">", """, " "), $content); // 过滤脚本和标签 $content = preg_replace("/<script.*?>.*?</script>/si", "", $content); $content = preg_replace("/<style.*?>.*?</style>/si", "", $content); // 过滤URL $content = preg_replace("/<a.*?href="(.*?)".*?>/si", "", $content); // 过滤图片 $content = preg_replace("/<img.*?src="(.*?)".*?>/si", "", $content); // 过滤iframe $content = preg_replace("/<iframe.*?src="(.*?)".*?>/si", "", $content); // 过滤Flash $content = preg_replace("/<object.*?data="(.*?)".*?>/si", "", $content); // 过滤其他标签 $content = preg_replace("/<[^>]*>/si", "", $content); return $content; } ?>
这个函数dede_filter
接收一个内容字符串作为参数,然后按照以下步骤进行过滤:
1、使用strip_tags
函数移除HTML标签。
2、使用htmlspecialchars
函数防止XSS攻击。
3、替换特殊字符为相应的HTML实体。
4、使用正则表达式移除脚本和样式标签。
5、移除URL、图片、iframe和Flash标签。
这只是一个基本的过滤示例,根据实际需求,你可能需要添加或修改过滤规则,如果你需要保留某些标签,或者需要处理其他类型的内容,请根据需要进行调整。
原创文章,作者:未希,如若转载,请注明出处:https://www.kdun.com/ask/1117120.html