CI 묻고 답하기

제목 CI에 curl이나 scrap 을 지원해주는 라이브러리가 있나요?
글쓴이 허니버터아몬드1 작성시각 2015/06/10 13:19:15
댓글 : 3 추천 : 0 스크랩 : 0 조회수 : 18470   RSS
snoopy로 쓰고있긴한데.....
<tag>                    내용                 <tag>
이런식으로 태그안 내용에 공백이 있으면 내용을 뽑아오질 못하네요 ㅠ
a태그 같은 경우도 정규식써서 뽑기 힘들고해서요

ci용 scrap 라이브러리가 혹시 있나요?
 다음글 워드프레스와 접목하여 멀티사이트로 사용시 문제점 (1)
 이전글 img 속성 onclick을 ci로 구현하는 방법 질문 (2)

댓글

변종원(웅파) / 2015/06/10 14:15:37 / 추천 0
허니버터아몬드1 / 2015/06/10 15:32:09 / 추천 0
변종원(웅파)// 답변 감사합니다!! 그래도 불러오질 못하네요 ㅠ 제가 정규식을 잘못쓴것 같습니다
게시판이 잘못된것 같지만....죄송하지만 정규식 관련해서 질문 몇개만 드리겠습니다.

현재 일반 정규식을 
$rex1="/\<td class=\"last\"\>(.*?)\<\/td\>/"

이런식으로 정해진 클래스 명 안의 데이터를 전부 불러오는 형식으로 쓰고있는데요

1. 데이터를 불러올 때 class가 사라진 후엔 어떻게 정규식으로 호출을 할까요?
ex) 보통은 <td class="last"> 이런 형식인데 curl로 긁어온 후엔 <td class>로 되어있을 경우

2. td안에 공백이 많을 경우 데이터를 불러오지 못하고있습니다
ex) 요소검사에선 <td class>        123       </td> 이런 형태로 되어있지만 데이터를 복사해보면 공백이 없습니다

3. <a>태그 안의 내용을 불러오고 싶습니다

ex) <a href="[removed]checkDetail('숫자');" title="타이틀">불러올데이터</a>
 
/\<a href=\"javascript\:checkDetail(\'(.*?)\')\" title=\"타이틀\"\>(.*)?\<\/a\>/

제가 임의대로 짜봤는데 불러오질 못했습니다 ㅠ
변종원(웅파) / 2015/06/10 16:49:06 / 추천 0
불러온 데이터를 그대로 작업하면 원하는 결과를 가져오기 힘듭니다.
공백의 경우 삭제하고 처리하는 것이 좋습니다.

1번의 경우도 2개 다 작업을 해야합니다. 1개 조건으로 결과값이 없을 경우 두번째 조건으로 데이터 가져오기.

검색해보시면 데이터 파싱을 쉽게 해주는 라이브러리가 많습니다.  (dom 기반도 있고 jquery select 형태를 가진 것도 있습니다)
정규표현식은 제대로 공부하지 않으면 실무에서 사용하기 번거롭습니다.
정규표현식을 제대로 공부하시던지 파싱 라이브러리를 이용하세요.