널 텍스트 파일이 각각 2바이트와 3바이트의 용량을 차지하네요... 블록

아래 그림을 보시면 알겠지만 이게 어떻게 된건지 아시는 분 계신가요? 빨간색 사각형 파일이 제가 평소 이용하고 정리하는 텍스트 파일인데 내용을 전부 지웠는데 각각 2바이트(1KB 할당크기)와 3바이트(1KB 할당크기)의 용량을 차지하고 있네요. 그림에서 보시다시피 제가 헥사에디터로 들여다 보기 전까진 여기에 이상한 문제가 들어있다는 사실을 몰랐는데 한개는 2바이트의 이상한 문자가 들어가 있고 다른 하나 파일엔 3바이트의 이상한 문자가 기록돼 있는 것이 보입니다.

헥사 에디터에서 초록색 배열칸이 ANSI 문자 형태로 본 것이고 분홍색 배열칸이 유니코드 문자로 보기를 나타낸 것입니다. 이 현상이 무엇인지 아시는 분 계십니까? 메모장의 버그인것 같은데 탐색기 안의 다른 파일을 보시면 아시겠지만 텍스트 파일 안에 아무것도 들어가 있지 않은 상태에선 용량이 0이 표시돼야 합니다. 참 괴상한 현상이네요. ㅡ_ㅡ;

제가 이 두 텍스트 파일을 오랫동안 이용하면서 써넣고 비우기를 반복하는 과정에서 생긴 쓰레기 문자인 건 맞는데 왜 이런 현상이 생기는지 모르겠네요. 메모장 버그가 맞겠죠?

중요한 문제는 아니지만 이게 다른 텍스트 파일에 내용을 붙여넣기 할 때 자꾸 "유니코드로 저장하겠느냐" 물어보는 원인을 제공하고 있는지 모른다는 생각이 언뜻 들었습니다.


덧글

  • 1234 2014/01/18 20:31 # 삭제 답글

    프로그래머로 말씀드리자면 ...버그 아니고요. BOM 이라고 유니코드 식별자입니다.
  • 희망의빛™ 2014/01/18 22:37 #

    이게 텍스트 파일 사용 도중 새로 생성이 되는 식별자인가 보군요. 첨에는 안보이잖아요. 전 또 버그 때문에 찌꺼기가 남은 줄 알았습니다. 답변 감사드립니다.
  • 긁적 2014/01/19 00:15 # 답글

    후우 -_-)y=o0 이래서 좋은 프로그래머가 되려면 로우레벨 또는 표준(표현이 좀 그렇네요 ^^;)에 대한 지식이 많이 필요한데 이걸 익히는 건 정말 힘든 것 같더라구요 ㅠ.ㅠ....
    기술표준에 대한 문서를 다 읽어야되나..;; 읽는다고 기억할 수가 없을텐데.
    지금도 만약 파일에 내용이 없다는 걸 확인하기 위해 파일사이즈가 0인지 체크하려고 했으면 '이해할 수 없는 버그'가 생겨났겠죠 ㅋㅋ 사실은 내가 모르는 거지만..;;
    여튼 희망의빛™님이랑 1234님 덕분에 좋은 거 배워갑니다. 감사합니다.
댓글 입력 영역
* 비로그인 덧글의 IP 전체보기를 설정한 이글루입니다.


웹로그 검색