如何让DEDECMS在采集内容时自动生成摘要和关键字？

DEDE采集时可以自动生成摘要和关键字，方便用户快速了解文章主题。

管理系统（DedeCMS）中，自动生成摘要和关键字是许多网站管理员关注的重要功能，这不仅有助于提高网站的SEO表现，还能显著提升用户体验，默认情况下，DedeCMS的采集模块并不会自动生成摘要和关键字，这给很多用户带来了困扰，下面将详细介绍如何在DEDE采集时自动生成摘要和关键字：

修改include/dedecollection.class.php 文件

1、定位问题：

DedeCMS 5.6版本在采集过程中无法自动生成摘要和关键字，关键字和摘要字段均为空。

问题可能出在include/dedecollection.class.php 文件中的正则表达式匹配上。

2、修改代码：

打开include/dedecollection.class.php 文件。

找到以下代码段：

     // 自动分析关键字和摘要
     preg_match("/<meta[\s]+name=['"](.*)['"] content=['"](.*)['"]/isU", $this>tmpHtml, $inarr);
     preg_match("/<meta[\s]+content=['"](.*)['"] name=['"](.*)['"]/isU", $this>tmpHtml, $inarr2);
     if (!isset($inarr[1]) && isset($inarr2[1])) {
         $inarr[1] = $inarr2[1];
     }

用以下代码替换上述代码：

     // 自动分析关键字和摘要
     preg_match("/<meta[s]+name=['"]keywords['"] content=['"](.*)['"]/isU", $this>tmpHtml, $inarr);
     preg_match("/<meta[s]+content=['"](.*)['"] name=['"]keywords['"]/isU", $this>tmpHtml, $inarr2);
     preg_match("/<meta[s]+name=keywords content=['"](.*)['"]/isU", $this>tmpHtml, $inarr3);
     if (!isset($inarr[1]) && isset($inarr2[1])) {
         $inarr[1] = $inarr2[1];
     }
     if (!isset($inarr[1]) && isset($inarr3[1])) {
         $inarr[1] = $inarr3[1];
     }

3、验证修改：

保存文件并重新进行一次采集测试。

检查生成的内容是否包含正确的摘要和关键字。

常见问题解答

1、为什么修改include/dedecollection.class.php 文件后仍然无法生成摘要和关键字？

答案：可能是因为缓存问题或服务器配置问题，请确保清除了DedeCMS的缓存，并检查服务器是否有任何防护软件阻止了文件的修改，可以尝试重启服务器以应用更改。

2、如果采集的目标网站没有<meta name="description"> 和<meta name="keywords"> 标签怎么办？

答案：在这种情况下，可以考虑使用其他方法来生成摘要和关键字，可以编写自定义函数来从文章内容中提取关键词和摘要，或者使用第三方插件来实现这一功能，确保这些替代方法不会对网站性能产生负面影响。

通过以上步骤，用户可以有效地解决DedeCMS在采集时无法自动生成摘要和关键字的问题，从而提升网站的SEO效果和用户体验。

|功能 |描述 |实现方式 |

| | | |

| 自动生成摘要 | 根据采集到的文章内容自动生成摘要，通常包含文章的主要信息和关键点。 | 1. 使用关键词提取算法：通过分析文章中的关键词，自动提取摘要。

2、使用机器学习模型：利用预训练的模型，如BERT或GPT，自动生成摘要。

3、根据段落重要性：根据文章中各段落的重要性，自动提取关键段落生成摘要。 |

| 自动生成关键字 | 根据采集到的文章内容自动生成关键字，用于描述文章的主题和内容。 | 1. 关键词提取算法：从文章中提取高频词、名词、动词等作为关键字。

2、TFIDF算法：根据词频和逆文档频率，筛选出具有代表性的关键词。

3、主题模型：利用LDA等主题模型，自动识别文章的主题，并提取相关关键词。 |

| 采集源 | 采集文章的来源，如网站、数据库等。 | 1. 网络爬虫：通过爬虫技术，自动采集互联网上的文章。

2、API接口：调用第三方API接口，获取文章数据。

3、数据库：从内部数据库中采集文章。 |

| 采集频率 | 设置采集文章的频率，如每天、每周等。 | 1. 定时任务：设置定时任务，定期执行采集操作。

2、实时采集：实时监控文章更新，一旦有新文章发布，立即采集。 |

| 数据存储 | 采集到的文章数据存储方式。 | 1. 文件存储：将文章数据存储为文本文件、JSON文件等。

2、数据库存储：将文章数据存储到数据库中，如MySQL、MongoDB等。 |

| 摘要和关键字生成结果展示 | 展示自动生成的摘要和关键字，方便用户查看和编辑。 | 1. 文本展示：在界面上展示生成的摘要和关键字。

2、HTML展示：将摘要和关键字嵌入到HTML页面中，方便用户阅读。 |

| 编辑和修改 | 允许用户对自动生成的摘要和关键字进行编辑和修改。 | 1. 编辑框：提供编辑框，允许用户修改摘要和关键字。

2、提交按钮：用户修改完成后，点击提交按钮，保存修改后的内容。 |

原创文章，作者：未希，如若转载，请注明出处：https://www.kdun.com/ask/1211229.html

本网站发布或转载的文章及图片均来自网络，其原创性以及文中表达的观点和判断不代表本网站。如有问题，请联系客服处理。

如何让DEDECMS在采集内容时自动生成摘要和关键字？

相关推荐

MySQL关键字，它们是什么以及如何使用？

关键字是什么意思？

如何创建MySQL数据库表？

如何使用DedeCMS创建并管理我的网站？

发表回复