博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
常用正则表达式
阅读量:6970 次
发布时间:2019-06-27

本文共 1716 字,大约阅读时间需要 5 分钟。

hot3.png

 

一、替换所有的  等 标签

 

/**     * @author liushuaic     * @date 2016-06-27 17:35     * @desc 替换&xxx;标签     * */    public static String  replaseAndCharachter(String str){    	return str.replaceAll("&{1}[A-Za-z]+[;]{1}", "");    }

 

二、获取html 中所有的图片

*     * 获取img标签中的src值     * @param content     * @return     */    public static List
getImgSrc(String content){ List
list = new ArrayList
(); //目前img标签标示有3种表达式 //
//开始匹配content中的
标签 Pattern p_img = Pattern.compile("<(img|IMG)(.*?)(/>|>|>)"); Matcher m_img = p_img.matcher(content); boolean result_img = m_img.find(); if (result_img) { while (result_img) { //获取到匹配的
标签中的内容 String str_img = m_img.group(2); //开始匹配
标签中的src Pattern p_src = Pattern.compile("(src|SRC)=(\"|\')(.*?)(\"|\')"); Matcher m_src = p_src.matcher(str_img); if (m_src.find()) { String str_src = m_src.group(3); list.add(str_src); } //结束匹配
标签中的src //匹配content中是否存在下一个
标签,有则继续以上步骤匹配
标签中的src result_img = m_img.find(); } } return list; }

 

 

三、替换所有html标签

/**     * @author liushuaic     * @date 2016-06-24 10:35     * @desc 替换所有html 标签为空     * **/    public static String replaceAllHtmlTagContent(String htmlContent){        String regxpForHtml="<([^>]*)>";    	return	htmlContent.replaceAll(regxpForHtml, "");     }

 

转载于:https://my.oschina.net/lavedream/blog/701507

你可能感兴趣的文章
python 集合、函数
查看>>
《从零开始学Swift》学习笔记(Day43)——构造函数继承
查看>>
mysql dba系统学习(4)mysql的多实例multi启动停止
查看>>
TabHost 置于底部 顶部的方法
查看>>
【HTML5】一起学习canvas【一】
查看>>
2017年Linux运维人员必会开源运维工具体系
查看>>
Spring Struts2 Hessian集成的一个问题
查看>>
BFC的形成条件和特性分析
查看>>
关于内存泄漏的调试方法
查看>>
中文乱码
查看>>
如何学好C++语言
查看>>
2.4 运算符与表达式
查看>>
保存时提示没有root permission
查看>>
反转链表
查看>>
安卓中的事件分发机制之View控件
查看>>
application内置对象
查看>>
iphone5手机端内容超出iphone6没问题且超出内容为http://.....网址
查看>>
Oracle 11g OEM登录后提示“出现内部错误”
查看>>
十一种通用滤波算法(转)~~~非常有用!
查看>>
JMeter中的读取json数据---JSON Extractor插件
查看>>