최초 작성일 : 2012/05/11 10:09 



str = str.replaceAll(" ", "") //공백태그 제거
.replaceAll("<meta[^>]*(/)?>", "") //meta 태그 제거
.replaceAll("<style[^>]*>(.*?)</style>", "")  //css제거
.replaceAll("<script[^>]*>(.*?)</script>", "") //스크립트 제거
.replaceAll("<!--[^>]*-->", "")                  //주석처리 제거
.replaceAll("<(/)?(b|B)(r|R) ?/?>", "\n")
.replaceAll("</(p|P)>", "\n")
.replaceAll("<(/)?([a-zA-Z]*)(\\s[a-zA-Z]*=[^>]*)?(\\s)*(/)?>", "")  //html태그 제거
.replaceAll("<o:p>", "")
.replaceAll("</o:p>", "\n")
.replaceAll("(<\\?(xml|XML))[^>]*/>", "");

[출처] HTML 태그 제거|작성자 모과나무

 

블로그 이미지

마즈다

이제 반백이 되었지만 아직도 꿈을 좇고 있습니다. 그래서 그 꿈에 다가가기 위한 단편들을 하나 둘 씩 모아가고 있지요. 이 곳에 그 단편들이 모일 겁니다...^^

댓글을 달아 주세요