以下代码会将内容中的全部HTML代码删除:
参数input为所要进行操作的字符串,参数length为字符串的长度,本人调用此类FilterHTML中的方法splitAndFilterString时,一定要事先对字符串进行空判断,否则将会报异常!
public class FilterHTML {
public static String splitAndFilterString(String input, int length) {
if (input == null || input.trim().equals("")) {
return "";
}
// 去掉所有html元素,
String str = input.replaceAll("\\&[a-zA-Z]{1,10};", "").replaceAll(
"<[^>]*>", "");
str = str.replaceAll("[(/>)<]", "");
int len = str.length();
if (len <= length) {
return str;
} else {
str = str.substring(0, length);
str += "......";
}
return str;
}
}
分享到:
相关推荐
一段去除Html页中标签的代码,用法很简单,很实用
ASP去除HTML标记的脚本代码,使用正则函数
用正则表达式,去除字符串中的HTML代码并保留文字,图片,视频。
C# 去除所有HTML代码 C# 去除所有HTML代码 C# 去除所有HTML代码
这是一个源代码用于测试 去除html标记 可以测试字符串 也可以测试文件 对于学习读写文件还是不错的 去除html标记 我只用了一种情况其他的可以在网上搜一下 然后用我的测试
asp中去掉所有HTML标记得到纯文本代码,并截取字符串。适用于做企业网站时,首页显示公司简介的一部分内容用...
java代码-正则去除HTML代码中的A标签
java代码-正则去除HTML代码中的SCRIPT标签
SQl去掉HTML标签函数 彻底防止SQL注入
java代码-正则去除HTML代码中的IMG标签
去除HTML标记 包括HTML的源码 集合了很多代码移除
在翻译过程中,我去掉了已经被W3C废弃或不提倡的标签、属性,比如(font),同时对版面结构进行了调整,希望整体效果看起来还可以。 由于水平有限,翻译出来的结果自然难免错漏,对这个,还望大家不要见笑。另外,...
星级评分JS-简洁美观干净已经去除多余代码
html全屏控制控件-简洁干净已经去除多余代码
这段代码可以用于去除文本里的字符串标签,不包括标签里面的内容 import re\nhtml='<a href=//www.jb51.net>\u8f6f\u4ef6\u5f00\u53d1\u7f51</a>,Python\u5b66\u4e60\uff01' dr = re.compile(r'<[^>...
可以去除文章中的HTML代码,可以去除文章中的HTML代码
主要介绍了Nodejs抓取html页面内容的关键代码,另外还给大家附上了nodejs抓取网页内容,非常不错,对node.js抓取页面内容感兴趣的朋友一起学习吧
包括常用过滤html标签、截取字符...过滤html标签函数:如果只是把类似的标记统统去掉,并不需要考虑别的。 截取字符串函数:截取字符串并限制字符串长度,多于给定的长度 获得本页地址:常用用于分页功能,链接地址参数
经本人亲自试验,解决项目中html去除BOM问题.