본문 바로가기

반응형

문자집합

gedit 에서 윈도우에서 만든 텍스트 파일을 열때 글자가 깨지는 경우 윈도우에서 텍스트 파일을 생성하면 기본적으로 euc-kr, UHC, cp949 등으로 나타내는 문자집합을 사용한다. 우분투나 기타 리눅스에서는 UTF-8이라는 문자집합을 기본으로 사용하므로 인해서 바이트로 저장되는 문자열을 서로다른 방식으로 해석하다보니 정상적으로 표현이 안되는 것이다. gedit의 경우 내가 주력으로 사용하는 에디터인데, auto detect 항목에 윈도우에서 사용하는 문자집합을 넣어주면 아주 잘 작동한다. 나의 경우 dconf-editor 라는 툴을 사용하여 수정하였다. 위치는 org -> gnome -> gedit -> preference -> encodings 까지 찾아 들어가면auto-detected 라는 항목이 있을 것이다. 아마 기본값은 ['UTF-8', 'CURRENT', .. 더보기
MySQL에서 한글 저장을 위한 UTF-8 CharSet 으로 DB 구성하기 한글을 저장하는 방법으로는 UTF-8 과 EUC-KR 문자집합을 사용할 수 있으나, 기왕이면 다국어를 완전히 지원하는 UTF-8을 사용하는 편이 나을 것으로 생각된다. 기본적으로 MySQL의 DB, Table에 대한 Collation 은 아쉽게도 아직도 Latin1 이 기본값이다. 그럼 이미 만들어 놓은 DB 스키마와 테이블, 칼럼등에 대해서 UTF-8을 적용하는 방법을 적어본다. 1. DB에 UTF-8 CharSet, Collation 적용하기 ALTER DATABASE 데이타베이스명 CHARACTER SET utf8 COLLATE utf8_general_ci; 2. 테이블에 UTF-8 CharSet, Collation 적용하기 ALTER TABLE 테이블명 CHARACTER SET utf8 COLLA.. 더보기

반응형