본문 바로가기
  • SDXL 1.0 + 한복 LoRA
  • SDXL 1.0 + 한복 LoRA
Development/Tips

[옛 글] [정규표현식] HTML 태그 제거

by 마즈다 2013. 7. 19.
반응형

최초 작성일 : 2012/05/11 10:09 



str = str.replaceAll(" ", "") //공백태그 제거
.replaceAll("<meta[^>]*(/)?>", "") //meta 태그 제거
.replaceAll("<style[^>]*>(.*?)</style>", "")  //css제거
.replaceAll("<script[^>]*>(.*?)</script>", "") //스크립트 제거
.replaceAll("<!--[^>]*-->", "")                  //주석처리 제거
.replaceAll("<(/)?(b|B)(r|R) ?/?>", "\n")
.replaceAll("</(p|P)>", "\n")
.replaceAll("<(/)?([a-zA-Z]*)(\\s[a-zA-Z]*=[^>]*)?(\\s)*(/)?>", "")  //html태그 제거
.replaceAll("<o:p>", "")
.replaceAll("</o:p>", "\n")
.replaceAll("(<\\?(xml|XML))[^>]*/>", "");

[출처] HTML 태그 제거|작성자 모과나무

 

반응형