본문 바로가기

반응형

cp949

euc-kr, cp949, ms949 포맷을 utf-8 로 charset 을 변환하는 방법 간단한 명령어로 문자셋을 변경할 수 있는 명령어가 존재합니다. iconv 라는 것으로 딱봐도 변환 기능을 제공합니다. 사용방법은 다음과 같습니다. $ iconv -c -f euc-kr -t utf-8 test_euckr.txt > test_utf8.txt 간단히 설명을 달아보면 -c 는 변환하겠다는 의미이고, -f 는 변환전 문자셋을 지정하는 듯 합니다. from 같은 의미인 듯 합니다. -t 는 변경할 문자셋으로 to 정도로 해석하면 되겠지요. 그리고 마지막으로 변경할 파일을 뒤에 써주면 되고, 그 이후는 출력방향을 파일로 지정하여 담아내겠다는 것이죠. 뒤부분( > test_utf8.txt ) 부분을 제거하면 화면으로 출력되는 것을 볼 수 있습니다. 끝. 더보기
[우분투] 우분투(리눅스)에서 zip 파일 압축 해제시 한글 깨짐 문제 해결 방법 윈도우에서 개발환경을 구성했던 것을 우분투로 이전하면서 이전에 윈도우 기반에서 압축했던 파일들을 다시 압축을 풀 경우가 생겼는데 한글로 된 파일명을 갖는 압축파일을 압축 해제하면서 인코딩을 정상적으로 인식하지 못하여 압축파일이 정상적으로 풀리지 않는 것을 보았습니다. 이를 해결하기 위해서 압축했던 파일의 문자인코딩형식을 알면 다행인데, 일단 윈도우 기반에서 압축했던 파일은 cp949 (euc-kr, MS949 등으로 알려진) 인코딩 캐릭터셋이라고 알려주면 됩니다. 콘솔에서 압축을 푸는 방법으로는 unzip 명령어를 이용하는 방법이 있습니다. $ unzip -O cp949 위와 같이 -O 옵션을 사용하면 됩니다. 대문자 영문자 O를 사용합니다. 일단 콘솔로 위와 같은 명령어를 이용하면 정상적으로 압축을 해.. 더보기
[우분투] 압축 해제시 한글이 깨지는 경우 윈도우에서 압축한 파일 중에 한글이 들어간 경우 압축 프로그램이 한글을 인식하지 못하고 이상한 문자로 보이는 경우가 있다. 이때는 캐릭터셋을 알려주면 된다. 콘솔을 이용하고, $ unzip -O cp949 '압축을 해제할 파일명>' 요런식으로 직접 압축을 풀어주면 된다. 끝. 더보기

반응형