织梦DedeCMS站点的robots.txt文件是控制搜索引擎蜘蛛抓取网站内容的重要工具,通过合理配置robots.txt,可以优化网站的SEO效果和提高安全性,以下是详细的写法及优化建议:
基本设置
1、Useragent:
定义对所有搜索引擎爬虫生效的规则。
2、Disallow:/dede
禁止访问管理后台目录,为了安全起见,建议将“dede”目录重命名,并在robots.txt中使用通配符如Disallow: /d*ms
来防止泄露。
3、Disallow:/include
禁止访问程序核心文件目录。
4、Disallow:/member
禁止访问会员管理目录,但有些文件可能需要开放。
5、Disallow:/plus
禁止访问插件及辅助功能目录,但某些文件如search.php
可以开放。
6、Disallow:/templets
禁止访问默认模板存放目录。
7、Disallow:/data
禁止访问系统缓存或其他可写入数据存放目录。
8、Disallow:/uploads
禁止访问上传下载文件保存目录,如果不想搜索引擎引用图片的话。
9、Disallow:/images
禁止访问系统默认模板图片存放目录。
10、Disallow:/index.php
如果网站首页已经静态化,最好禁止访问默认首页。
11、Disallow:/404.html
禁止访问自定义404页面。
12、Allow:/plus/search.php
允许访问禁止目录中的具体文件。
高级设置
1、后台管理目录设置:
为避免后台目录被轻易猜到,可以使用通配符进行设置,例如将后台目录改为“dedecms”,在robots.txt中设置为Disallow: /d*ms
。
2、栏目页设置:
如果网站未做伪静态优化,栏目分页后会有两个链接指向栏目首页,如*/web/
和*/web/list_1_1.html
,为优化SEO,建议将栏目分页优化为*/web/
的形式,并在robots.txt中设置为Disallow: /*1.html$
。
注意事项
1、目录权限设置:按官方说明设置好目录权限,确保只有必要的目录对搜索引擎开放。
2、后台目录命名:后台目录改后的名称开头字母和结尾字母不要和其他目录一样,以避免混淆。
3、测试有效性:使用百度站长工具测试robots.txt文件设置是否有效。
FAQs
1、问题一:为什么需要重命名DedeCMS的管理后台目录?
回答:重命名管理后台目录是为了提高网站的安全性,防止黑客通过猜测目录名称来尝试攻击,通过在robots.txt中使用通配符设置,可以避免泄露后台目录名称,进一步增强安全性。
2、问题二:如何优化栏目页的SEO设置?
回答:如果网站未做伪静态优化,栏目分页后会有多个链接指向同一页面,为优化SEO,应将这些链接统一格式,并在robots.txt中设置相应的规则来避免重复内容的抓取,具体做法是将栏目分页优化为*/web/
的形式,并在robots.txt中设置为Disallow: /*1.html$
。
原创文章,作者:未希,如若转载,请注明出处:https://www.kdun.com/ask/1227059.html
本网站发布或转载的文章及图片均来自网络,其原创性以及文中表达的观点和判断不代表本网站。如有问题,请联系客服处理。
发表回复