본문 바로가기

IT

gedit 에서 윈도우에서 만든 텍스트 파일을 열때 글자가 깨지는 경우

반응형

윈도우에서 텍스트 파일을 생성하면 기본적으로  euc-kr, UHC, cp949 등으로 나타내는 문자집합을 사용한다. 우분투나 기타 리눅스에서는 UTF-8이라는 문자집합을 기본으로 사용하므로 인해서 바이트로 저장되는 문자열을 서로다른 방식으로 해석하다보니 정상적으로 표현이 안되는 것이다.


gedit의 경우 내가 주력으로 사용하는 에디터인데, auto detect 항목에 윈도우에서 사용하는 문자집합을 넣어주면 아주 잘 작동한다.


나의 경우 dconf-editor 라는 툴을 사용하여 수정하였다.


위치는 org -> gnome -> gedit -> preference -> encodings 까지 찾아 들어가면

auto-detected 라는 항목이 있을 것이다.


아마 기본값은


['UTF-8', 'CURRENT', 'ISO-8859-15', 'UTF-16']


위와 같이 4가지 문자집합을 자동인식하는 것으로 되어 있는데, 여기에 자동 인코딩할 문자집합을 써 주면 된다.


['UTF-8', 'UHC', 'EUC-KR', 'CURRENT', 'ISO-8859-15', 'UTF-16']


요런식으로...


이제 윈도우에서 작업된 텍스트 파일을 받아도 콘솔이나 기타 프로그램을 써가면서 고민스럽게 열어볼 필요가 없다.


혹여나 자동인식이 정상작동하지 않는다면 console에서 직접 명령어를 지정해서 인코딩을 지정할 수 있다.


$ gedit --encoding euc-kr 열고자하는파일명


끝.

반응형