要去掉HTML标签,可以使用正则表达式或者Java的Jsoup库,这里给出一个使用Jsoup库的方法:
(图片来源网络,侵删)
1、需要添加Jsoup库到项目中,如果你使用的是Maven项目,可以在pom.xml文件中添加以下依赖:
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.14.3</version> </dependency>
2、使用Jsoup的clean
方法去除HTML标签:
import org.jsoup.Jsoup; import org.jsoup.nodes.Document; public class RemoveHtmlTags { public static void main(String[] args) { String html = "<html><head><title>标题</title></head><body><p>这是一个段落。</p><p>这是另一个段落。</p></body></html>"; String text = removeHtmlTags(html); System.out.println(text); } public static String removeHtmlTags(String html) { Document document = Jsoup.parse(html); return document.text(); } }
这段代码会输出:
标题 这是一个段落。 这是另一个段落。
这样就去除了HTML标签,只保留了文本内容。
原创文章,作者:未希,如若转载,请注明出处:https://www.kdun.com/ask/434004.html
本网站发布或转载的文章及图片均来自网络,其原创性以及文中表达的观点和判断不代表本网站。如有问题,请联系客服处理。
发表回复