개발 Q&A

제목 cURL로 긁어오기 중 Meta tag 인코딩 이슈
글쓴이 쿨가이8 작성시각 2013/07/04 15:21:11
댓글 : 4 추천 : 0 스크랩 : 0 조회수 : 19688   RSS
안녕하세요.
현재 작업하는 소스에 URL Fetching 적용을 위해 이것저것 테스트 해보고 있는데,
(사이트는 UTF-8입니다.)
유독 N모사의 블로그만 깨져서 오더군요.
(일반 기사나 다른 사이트들은 다 잘 됩니다 ㅠㅠ)

charset은 MS949로 되어있던데,
cURL로 긁어와서 어떻게 인코딩을 해도 정확하게 안나오더라구요.
이걸로 몇일 삽질하는지 모르겠습니다 ㅠㅠ

가령 
<title>TAN 의 속닥속닥 ♬ : 네이버 블로그</title> 에 해당하는 Title이 cURL로 긁어오면 아래와 같은데
[title] => TAN ÀÇ ¼Ó´Ú¼Ó´Ú ¢Ý : ³×À̹ö ºí·Î±×

당최 이걸 위에처럼 바꾸지를 못하네요;;;;

조언 좀 부탁 드립니다.


 다음글 세션 DB사용중 useragent 문제 (1)
 이전글 긁어올것이 있는데요.. (10)

댓글

변종원(웅파) / 2013/07/04 16:48:42 / 추천 0
속이는걸지도 모릅니다. ㅎㅎ

utf-8로 가져와보세요.

아니면 가져와서 iconv나 nb_convert_encoding 함수 이용해서 바꿔보시구요.
쿨가이8 / 2013/07/05 00:00:19 / 추천 0
웅파님 답변 감사 드립니다.
기본적으로 cURL로 데이터를 가져와서 인코딩하는데요.
어떤 조합으로 인코딩해도 안되더라구요;;;;;
(uth-8, euc-kr, cp949 등등)
다른건 다 문제 없는데 유독 저것만 안되요 ㅠㅠ

cURL로 가져올 때 저 인코딩에 맞추어서 가져와야 하나요?
가져올 때는 별도로 인코딩 세팅을 안하고 있습니다.

아 정말 어찌해야 할지 ㅠㅠ
/ 2013/07/05 09:54:00 / 추천 0
 mb_detect_encoding 으로 가져온 인코딩 한번 확인해보시는 것도..

무슨 인코딩이길래 깨지는지 한번 보시는 것도 괜찮을듯하네요

$원문=mb_convert_encoding ( $원문,"UTF-8",mb_convert_encoding($원문)) 

이런식으로도 될거구요
tan / 2013/08/03 05:42:59 / 추천 0
 저기요. 저 위에 TAN의 속닥속닥이라고 하는 블로그는 제 블로근데요.
 제 블로그에서 어떤 글을 함부로 가지고 가시려고 하시는지는 모르겠지만 굉장히 기분 나쁘네요. 
 그쪽 때문에 일부러 이 사이트에 가입해서 글을 남기는건데요. 향후 제 글과 관련해서 저작권
 침해가 우려되는 부분에 있어서는 그냥 보고만 있지 않을겁니다. 출판을 목적으로 쓰고 있는 글
 들도 있기 때문에 함부로 긁어가려고 하는 시도 자체가 굉장히 기분 나쁩니다. 긁어가기 전에 
 타인의 저작권에 대해서 다시 한 번 생각해보시죠.