/**
* 得到网页中图片的地址
*/
public static Set<String> getImgStr(String htmlStr) {
Set<String> pics = new HashSet<>();
String img = "";
Pattern p_image;
Matcher m_image;
String regEx_img = "<img.*src\\s*=\\s*(.*?)[^>]*?>";
p_image = Pattern.compile
(regEx_img, Pattern.CASE_INSENSITIVE);
m_image = p_image.matcher(htmlStr);
while (m_image.find()) {
// 得到<img />数据
img = m_image.group();
// 匹配<img>中的src数据
Matcher m = Pattern.compile("src\\s*=\\s*\"?(.*?)(\"|>|\\s+)").matcher(img);
while (m.find()) {
String tempImgPath=m.group(1);
pics.add(tempImgPath);
        }
}
return pics;
}
/**
*修改入库的图片地址为正式地址
*/
public static String repairContent(String content){
String patternStr="<img\\s*([^>]*)\\s*src=\\\"(.*?)\\\"\\s*([^>]*)>";
Pattern pattern = Pattern.compile(patternStr,Pattern.CASE_INSENSITIVE);
Matcher matcher = pattern.matcher(content);
String result = content;
while(matcher.find()) {
String src = matcher.group(2);
String replaceSrc = "download";
result = result.replaceAll("fileupload-temp",replaceSrc);
}
return result;
}
 

最新文章

  1. [leetcode] 题型整理之字符串处理
  2. 关于js中闭包的理解
  3. 统计:P值 &amp; α值
  4. LRU Cache的实现
  5. NLog使用总结
  6. bzoj2004
  7. 关于ActionBar的向下兼容
  8. NSLineBreakMode
  9. 用纯CSS实现的箭头
  10. Java并发框架——AQS阻塞队列管理(一)——自旋锁
  11. 用beego开发服务端应用
  12. 看书记笔记 书名21天学C#
  13. Visual Studio学习记录
  14. matlab将矩阵数据归一化到[0,255]
  15. 函数和常用模块【day06】:subprocess模块(十)
  16. Nginx + Tomcat搭建集群
  17. 3. Python3 基本数据类型
  18. J​A​V​A​中​S​t​r​i​n​g​对​象​的​比​较
  19. docker常用命令(二)
  20. BZOJ3444 最后的晚餐(并查集)

热门文章

  1. svn冲突问题详解 SVN版本冲突解决详解
  2. 第6章 jQuery与Ajax的应用
  3. 水平居中的那些事之解决jqpagination分页插件无法居中的问题
  4. .net core 2.0 jwt身份认证系统
  5. UI界面相关
  6. Mysql 5.6主从搭建
  7. [Django笔记] admin 深入学习
  8. mysql查询不区分大小写
  9. web安全-点击劫持
  10. Jmeter-逻辑控制器之Switch控制器(Switch Controller)