그렇게 UTF-8 로 통일하라고 할 것 같으면 meta 태그는 왜 만들었어요? 블록

지금까지 각국 나라가 글자 코드를 <meta http-equiv="Content-Type" content="text/html; charset=euc-kr"> 등과 같이 meta 태그를 이용해 캐릭터셋만 바꿔서 줄곧 이용해 왔는데 이제와서 utf-8 로 통일하라고 할 것 같으면 뭐하러 meta 태그는 만들어서 각국 나라 글자를 표현해 왔는지... 그냥 UTF-8 쓰고 메타태그 없애세요. 더욱 괘씸한 건 지금까지 전세계 수많은 글자 코드가 고유한 글자코드로 DB에 저장돼 기존 소스에서 이렇게 메타태그로 지정해 사용돼 왔는데 이제와서 UTF-8을 쓰라고 한다면 그 많은 DB와 소스 컨버전 작업은 어떻게 감당할 건가요?

참으로 어이가 없습니다. 왜 기존 글자 코드를 잘 사용하면 되는 걸 가지고 이렇게 UTF-8이란 통합 코드를 만들어 호환성을 무력화시키려고 하는 것인지 전 도무지 이해가 안갑니다. 한글 코드 용량도 아시다시피 훨씬 커요 장점이란 단 한개도 없고 단지 운영체제가 UTF-8을 지원하기 때문에 개발자들은 그냥 기존의 euc-kr 을 UTF-8로 전부 바꿔야 한다는 겁니다. 이유도 없고 따지면 악성 이글루저 마냥 바보라고 비아냥대는 소리만 칙칙 해댑니다.

전 이런 맹목적인 코드 호환성 떨어트리기에 동참하지 않으렵니다. UTF-8 이전 글자 코드도 운영체제가 코드표를 가지고 있으면 결국 UTF-8 코드표 가지고 있는 거랑 근본적인 원리는 다를 바 없습니다. 왜 이렇게 전 세계적으로 개발된 소스 호환성을 무력화시키면서까지 글자코드 체계를 개편해야 하는 건지 누가 동이 닿게 설명해 주세요. 전 도저히 이해할 수가 없어서요. ㅡ_ㅡ

정말 문제가 많습니다. 지금 서로 다른 운영체제 2개에서 서로 다른 한글코드 적용 때문에 더욱 문제가 복잡해졌습니다. 깨진 파일명도 무척 눈에 거슬리구요.

덧글

  • 디베스테이터 2015/11/03 22:02 # 답글

    거슬리면 그냥 네놈이 개발이라고 주장하는 헛짓거리를 그만두면 됨.

    UTF-8이 언제부터 사용된 건데 "이제와서" 라고? 20년이 넘었어, 20년. 93년에 공식으로 나왔고 구글에서 "UTF-8이 HTTP 파일에 사용하는 가장 일반적인 코드가 되었습니다" 라고 얘기를 꺼낸것도 2008년도야.

    트랜드를 따라가는 것도 아니고, 그렇다고 뭔가 표준화를 하려거나 하는 것도 아니고 네놈이 모르고 안되니까 거슬린다 어쩐다 헛소리 할거면 그놈의 개발이라는 헛짓거리나 때려치는 게 어떠냐, 응?
  • 희망의빛™ 2015/11/04 06:14 # 답글

    디베스테이터// 제가 몰라서 안합니까? 엄두가 안나서 못하는 거고 싫은 거죠. 결국 기존의 무수하게 개발된 글자코드 소스를 재활용하지 못하고 호환성을 무력화시키니까 그게 잘못됐다고 말하는 겁니다.
  • 디베스테이터 2015/11/03 22:09 #

    엄부가 안나서 못하면 때려 쳐. 사용량이 급증한 05년도부터 지금까지 10년이 넘었는데도, 개인이 잡는 상태에서도 이걸 중간에 선회 안하고 그냥 간 건 네 책임이지 신형 포맷 책임이 아니야.

    그리고 넌 몰라. 그동안 수많은 이들이 코딩에 대해서 그렇게 구구절절, 보통 학원에 가면 못해도 10만원의 강의료를 받고서 해줄 내용들을 공짜로 처듣고 나서도 흡수하지도 못하고 남들에게 뻘소리나 하는 네놈이 "몰라서 안하는 게 아니다" 라고 얘기할 자격이 없어.
  • OrangeBelt 2015/11/04 01:18 #

    정답이네요.
    엄두가 안나면 안하시면 됩니다.
    그냥 생각을 접고 다들 쓰는 표준을 따르세요.
    세상의 사람들이 말하길, 다들 그렇게 하는데 그렇게 안하고 자기는 다르게 하겠다는 사람을 두고

    뒤비쫀다, 라고 그러죠.
  • 래칫 2015/11/03 22:15 # 답글

    이분 계산기 없애고 주판쓰시자고 하실분
    기술직 종사한다고 자칭하면서 기술발전을 따라가려는 생각조차 안하는거 보면 참..
  • 루루카 2015/11/03 22:27 # 답글

    바벨탑이 왜 무너졌다고 생각하세요?
  • 희망의빛™ 2015/11/03 22:30 # 답글

    래칫// 한글코드 바뀐다고 계산이 빨라진답니까? 용량은 오히려 크게 증가했는데요. 뭔가 비유가 크게 잘못됐네요. 근데 단점은 너무나 크고 중대하죠.
  • 디베스테이터 2015/11/03 22:34 #

    용량은 컴퓨터 처리속도가 그만큼 증가했으니 의미 없고, 호환성과 바이트 확인 면에서 보면 계산이 훨씬 빨라졌지. 이것만 봐도 니가 위에서 "몰라서 안합니까?" 라고 한 얘기가 거짓이라는 게 드러나.
  • highseek 2015/11/05 00:46 #

    용량이 증가한 게 왜 단점인지?
    코드표가 늘어난 만큼 좀더 다양한 글자를 잘 표현할 수 있다는 게 장점이죠.
    실제로 euc-kr이 2바이트라서 표현 못하는 글자들 많아요.
    되게 유명한 문장 있지.. "찦차를 타고 온 펲시맨과 쑛다리 똠방각하" 요거 euc-kr로 하면 찦, 이나 펲, 쑛, 똠 같은 글자 표현 못해서 깨짐. 됭 도 깨지고 하여튼 이것저것 한 몇천자인가 깨지는걸로 알고있는데.
  • 루루카 2015/11/03 22:51 # 답글

    말씀은 바로 하시는게 어떨까요?
    "전 이런 맹목적인 코드 호환성 떨어트리기에 동참하지 않으렵니다." 이 부분을 보통 적반하장이라 부른답니다.
    남들은 다 이게 표준이야. 이걸로 통합하자 하는데, 혼자서 호환성이 결여된 지역 코드 붙들고 고집 부리는 모양이
    호환성 떨어뜨리기가 아니면 뭘까요?
  • 아침북녘 2015/11/03 23:38 # 답글

    벌써 UTF-8관련 글로만 IT밸리에 몇 번째 글을 싸지르고 있는건지 모르겠네요.
    저기주인장 아저씨. 왜 새로운 프로그래머들이 머리를 싸매어 가면서 공부하면서 새시대에 발맞춰 가는지 이해를 못하는거 같은데요.
    지금 아저씨 하는 말에 예를 들어보죠.

    다들 시작은 똑같은 초가집에 살고 있었어요. 그런데 존나 다 쓰러져가요.
    다른 사람들은 그런 초가집을 버리고 더 튼튼한 벽돌 저택 혹은 아파트를 짓고 더 편한곳에서 살고 있어요.
    그런데 아저씨 혼자 다 쓰려져가는 초가집 벽에 진흙이랑 똥 쳐발라가면서 언제 쓰러질지 모르는 곳을 유지보수 하고 있어요.
    다른 사람들도 그런 모습을 보고 처음에는 참 악착같이 산다고 생각들 하겠죠.
    그렇게 시간은 30년이 지났어요. 그런데 아저씨는 혼자서만 아직도 그 짓하고 있어요.
    그런 아저씨를 보고 과연 사람들이 뭐라고 할까요?
    저 새끼는 거지새끼거나 병신이라고 생각할겁니다.
    왜요? 이미 30년이 지난 뒤엔 초가집은 유물의 한 부분일 뿐이고 이미 초고층 빌딩들이 즐비한 곳에 사는게 일상화 되었기 때문이죠.

    프로그램도 마찬가지예요. 새로운 체제에 맞춰 업데이트도 하면서 유지보수도 하는게 맞는거죠.
    하지만 더 이상 지원도 안하는 프로그램은 버리는게 당연한 겁니다.
    그런데 지금도 이미 보안 지원도 안하고 언제 털릴지 모르는 XP 쓰는데다
    원개발자도 개발 포기한 제로보드 잡고 혼자 수정보드판 업로드하면서
    혼자 아무도 안쓰는 비표준 코드잡고 있으니 누가 아저씨보고 프로그래머라고 생각할까요?
    거기다 자기 입으로 프로그래머라고 하고 앉아있으니 '진짜' 프로그래머 분들은 아저씨 보고 암걸리는 거예요.
    이렇게 해라 저렇게 해라 친절하게 알려줘도『나는 이렇게 배웠으니 이렇게 하는게 정답이다. 새로운걸 공부하는건 수치다』하면서
    안들려 안보여 시전하고 있으니 발전이 없는거죠.
    '진짜'프로그래머 분들과 같은 선상에서 서려고 하지마세요.
    아저씨는 그냥 시대에 뒤쳐져서 책도 안읽고 코드 공부도 안하는 그냥 '바보' 인 겁니다.
    뭐, 이렇게 말해도 못알아 들을테지만요.
  • asdasd 2015/11/03 23:45 # 삭제 답글

    전세계 수많은 사이트가 각자 고유한 글자코드를 쓰고 있다고 하셨는데
    지금 전세계 사이트 중에서 UTF-8 안 쓰고 있는 사이트 10개만 대봅시다.

    님 사이트 말고
  • asdasd 2015/11/03 23:47 # 삭제 답글

    그리고 유니코드랑 UTF-8이 없으면 다국어지원을 어떻게 할 수 있을지 방법을 생각해 옵니다.
  • 채널 2nd™ 2015/11/04 00:10 # 답글

    허허 이 양반이 대체 어디까지 가실라고... 그 동안 전산한다는 공돌이들이 그 놈의 '코드' 때문에 얼마나 골머리을 썩혔는데... <-- code page 949인가 뭔가도 있었고, 투 바이트 코드도 있었고 ... EUC-KR이라든가, EUC-JP라든가 .......

    국제화, 세계화의 물결(?) 속에서는 -- 닥치고 -- UTF-8이 대세입니다.

    솔까말, 한국어는 ㅎㅎ UTF-8 코드 페이지 중의 한쪽 귀퉁이를 차지하고 있을 뿐이고 ... 기존 코드의 변환은 -- 아마도? -- 자동화된 툴이 나와 있을 겁니다. ((찾아도 없으면 한번 맹글어 보시는 것도 추천해 드립니다.)) ;;;
  • 흠... 2015/11/04 00:36 # 삭제 답글

    님 말대로 UTF-8이 백해무익하다면 당연히 UTF-8을 쓸 필요가 없겠죠.
    하지만 세상이 UTF-8로 통일된건 그만한 이유가 있어서 그런 게 아닐까요?
    아마 그 이유는 님만 모르시는가 봅니다.
  • 나인테일 2015/11/04 00:40 # 답글

    유니코드를 처리할 환경이 마련이 안 되어서 과도기적으로 국가별 코드를 썼고 그거 때문에 서비스들마다 전환에 몸살도 겪었습니다만 할 때 되면 해야죠. 그냥 이 기회에 DB도 XE용으로 몽땅 전환해버리고 XE로 옮겨가심이 서로의 정신건강을 위해 좋을 듯.
  • 오오 2015/11/04 04:52 # 답글

    지금 호환성은 희망의빛님이 떨어뜨리고 계십니다. 이유는 수개월에 걸쳐 많은 분들이 너무나도 자세히 설명해 드렸지만 이해를 안, 아니 못하시는군요.
    euc-kr가 무슨 전세계적(?)으로 호환이 됩니까? 과거 한때 윈도우에서나 널리 쓰'였'던 것이죠.
    개인적으로 작업중 텍스트 파일이 UTF-8이 아니라서 생기는 문제를 접하면 짜증부터 납니다. 한참전부터요.

    그리고 meta 태그의 charset을 없애면 euc-kr은 진짜로 설 곳이 없어질 것입니다.
    또 meta 태그가 charset을 위한 것만도 아닌데 없애라구요?
  • 무한 2015/11/04 03:38 # 답글

    이 글에서 맞는 이야기라고는 하나도 없고, 다른 분들이 알아들을 만하게 아무리 설명해 줘도 절대 안 듣고... 뭘 어쩌라는 건지요?

    그 "중대한 결점"이라는 거, 5년, 10년, 그 이상을 일선에서 일하고 있는 프로그래머, 개발자, 소프트웨어 디벨로퍼, 아키텍쳐 등등 에게는 해당 사항 없습니다. 대신 "수많은 이점"들이 있을 뿐이지요.
  • 지나가다 2015/11/04 05:35 # 삭제 답글

    아니 meta tag에 왜 euc-kr이 있어요? 당연히 어느날 갑자기 UTF8 쓰는게 불가능이니까 그렇지. 아니 무슨 64bit 운영체제 쓰는 것도 윈도우 버전 새로 하나 나오면 뚝딱 되나 보죠?

    그리고 문자코드는 통일성이 중요해염. 나는 아 라고 썼는데 저쪽에서 아 라고 못알아먹는게 문제의 핵심임. 따라서 문자를 표기하는 코드는 통일해서 쓰는게 갑이져. 그러자고 UTF8 수십년전에 만든 거고 지금까지 이전 작업 중임.

    아니 뭐 l10n과 i18n 개념이 안잡혀 있는거는 뭐 그럴수도 있는데 UTF8의 필요성에 대해서 이렇게 감이 없음 안되죠.
  • 희망의빛™ 2015/11/04 06:57 # 답글

    디베스테이터// 바이트 확인이 무얼 의미하는지 모르겠지만 제가 알기론 UTF-8 문자의 글자수 계산해서 자르는 게 더 복잡하다고 알고 있는데요 어떤건 1바이트, 어떤건 2바이트, 3바이트, 4바이트 까지도 다르게 계산해 줘야 하니 이보다 더 불편한 문자열 자르기가 어디 있답니까? 부연설명을 하자면 아스키문자는 1바이트, 확장아스키는 2바이트, 한글 및 다국어는 3바이트, 미래에 사용될 문자는 4바이트 이런 식이죠. euc-kr 같은 경우 아스키문자는 1바이트 한글은 2바이트로 일률적인데 반해 이렇듯 UTF-8은 바이트수가 제각각이라 글자수를 세거나 자르는 등의 프로그래밍 하기가 참 곤란합니다. 제가 참고한 링크를 알려드릴께요. http://blog.lael.be/post/77

    http://bit.ly/1MfBKD8 여기는 UTF-8 환경에서 mb_substr() 이나 mb_strcut() 함수를 사용하는 방법이 나와 있네요.

    http://mytory.net/archives/1036/ 여기도 함 참고해 보세요.
  • 디베스테이터 2015/11/04 08:34 #

    장난하냐는 거냐? 해당 링크들 어디를 가도 "복잡하고 곤란합니다" 라는 내용이 없고, 오히려 "기존 표현은 특정 언어에서만 해당해서 잘리므로 공통을 씁니다" 는 걸 언급하는데, 그럼 딱 네놈 논리의 정반대거든.

    게다가 문자수 계산해서 자르는 게 더 복잡하다고? 야, 웃긴다. UTF-8이 공통 포맷을 가지고 있어서 크기는 기존 코드보다 좀 더 크지만 공통된 코드 형태를 사용해서 확인하기 쉽다는 게 장점으로 설명되는 부분인데, 계산해서 자르는 게 복잡하다고? 너 대체 뭘 보고 썼냐? 아니, 묻는 게 무의미하겠구나. 어차피 아무거나 대충 보고 제멋대로 바꿔서 말했을테니.

    너는 자기가 정당하다고 생각해서 계속 댓글을 달 모양인데, 열심히 달아. 다는 댓글 하나 하나마다 "저는 컴퓨터 개쪽도 모르지만 열심히 아는 척 하겠습니다" 라고 소개를 해주고 있으니 개그가 따로 없네.
  • 흠... 2015/11/04 09:13 # 삭제

    문자열 길이 계산은 mb_ 함수가 다 해주는건데 왜 우리가 그런 걱정을 왜 해야하나요?
  • LostRed 2015/11/04 08:40 # 답글

    워드프레스같은걸로 개인블로그 만들어서 활동하시는게 어떠실까요.
    굳이 여기서 욕이나 먹으면서 헛소리하실 필요는 없을거 같은뎅
  • 레이오트 2015/11/04 09:06 # 답글

    우와 UTF-8을 거부하는 인간이 나올줄이야! 뭐 국내 서비스로 한정해서 살 생각이면 euc-kr 고수해도 상관없긴 함. 그리고 솔직히 아직 그런 곳이 넘치고 있고. 다만 해외와 모바일 시장을 생각하면 utf로 전환은 어쩔 수 없음. (과거 한,중,일,대만을 대상으로 한 프로젝트에서 각국의 페이지로 자료 전송하는게 정말 엿같았음. UTF-8로 통일되었으면 그냥 자료보내면 끝날 문제인데 그렇게 하면 인식을 못해서 해당 국가 인코딩으로 자료 전환해서 넘겨야 하는 아주 엿같은 문제가 생김.)
  • asdf 2015/11/04 10:07 # 삭제 답글

    국내서비스는 고사하고 홈페이지 쓰는인간이 지하고 몇몇밖에 없을건데 UTF건 뭐시기건 상관이 있을라구요.
  • 은이 2015/11/04 11:01 # 답글

    예전에 완성형이랑 조합형 한글 표현이 있었어요.
    조합형은 한글 표현이 매우 뛰어나 표현 가능한 한글은 대부분 표현 가능하였지만 메모리가 조금 더 들어갔죠. (3바이트)
    그 당시 메모리는 1k바이트에 죽고 사는 시절이라 용량이 적은 완성형으로 갔죠. (2바이트)
    하지만 완성형은 자유로운 한글은 개뿔, 완성된 글자만 쓸 수 있는 반쪽짜리라는 표현도 아까울 정도로 표현력이 부족한 놈이었죠.

    그 이후에 윈도가 나오고 하며 확장 완성형이란 게 나왔지만 역시 한계는 명확. 조합형은 저 즈음해서 지원을 안해서 묻혀갔어요.
    그 와중에 이런저런 방식으로 혼란기가 있었지만,
    '우리 전 세계 적으로 잘 살아보세!' 하고 국제 표준인 UTF-8로 갈아탓죠.
    그렇게 모두 UTF-8을 쓰며 잘 살아가는 듯 보였지만...

    ... 어디의 누군가는 마치 태x양 전쟁에서 '전쟁이 끝났어! 우린 UTF-8로 가야해!' 라는 방송을 무시하고
    'euc-kr 만세!' 를 외치며 저항하는 패잔병 같이 외치고 계시니 슬플 따름이죠ㅠㅠ...
  • 흠... 2015/11/04 12:12 # 삭제 답글

    그리고 님 관점에서 쓸모가 없으니까 쓸모 없는 기술이라 주장하시는 것 같은데
    님이 진짜 제대로 된 프로그래머가 아니라 개발을 거의 취미 수준으로밖에 안(못?) 하니까 그렇게 생각하시는 겁니다.
    이런 기술적 결정을 내리기까지 프로그래머들이 무슨 고민을 했고 어떻게 논의를 해서 정착시켜 나갔는지를 알면 그런 말씀 못하십니다.
  • 지나가다 2015/11/04 13:25 # 삭제 답글

    그냥 병신이네
  • shaind 2015/11/04 16:17 # 답글

    망상과 사실


    1. 망상 :
    "전세계 수많은 글자 코드가 고유한 글자코드로 DB에 저장돼 기존 소스에서 이렇게 메타태그로 지정해 사용돼 왔는데 이제와서 UTF-8을 쓰라고 한다면 그 많은 DB와 소스 컨버전 작업은 어떻게 감당할 건가요?"

    2. 사실 :
    전 세계 인터넷 문서에서 UTF-8의 비율 : 2010년에 50%를 넘겼고 2015년에는 인터넷의 80% 이상이 UTF-8임. 전 세계적으로 이미 'DB와 소스 컨버전'은 거의 끝났고 너혼자 안 하고 뻣댄 거임.


    3. 망상 :
    "왜 기존 글자 코드를 잘 사용하면 되는 걸 가지고 이렇게 UTF-8이란 통합 코드를 만들어 호환성을 무력화시키려고 하는 것인지"

    4. 사실 :
    EUC-KR같은 기존의 국가별 글자 코드는 해당국 글자 코드가 지원되는 컴퓨터에서만 작동됨. 호환성 낮음.
    utf-8은 유니코드가 지원되는 모든 컴퓨터에서 처리가능. 폰트만 있으면 읽을 수 있음. 호환성 높음.

    EUC-KR같은 기존 국가별 글자 코드는 해당 코드에 들어있는 문자만 사용가능.
    예컨대 EUC-KR로는 한글 문서에 일본에서만 쓰는 한자, 악센트 붙은 영문자나 아랍글자 등을 섞어 쓸 수 없음.
    그러니까 한글 문서 안에 学 이나 الله أكبر 나 résumé 같은 글자를 쓸 수 없다는 뜻임. 호환성 낮음.
    UTF-8에서는 유니코드표에 있는 모든 문자를 섞어서 쓸 수 있음. 호환성 높음.


    5. 망상 : " UTF-8 문자의 글자수 계산해서 자르는 게 더 복잡하다"

    6. 사실 : 원래 문자열은 그렇게 자르는 것임.
    문자가 몇 바이트라고 처음부터 가정해서 문자열 자르는 짓은 마치 프로그램 코드에서 sizeof(int)라고 쓰는 대신 숫자 2라고 쓰는 것과 똑같음.
    sizeof(int)대신 2라고 쓰고 나서 에러나면 왜 옛날에 잘 쓰던 코드가 안되냐며 32비트 시스템은 소스코드 호환성 떨어트리기 위한 음모라고 바락바락 악쓰는 것과 같음.
    물론 여기 주인장은 예전에 왜 32비트 os를 64비트처럼 구성할 수 없냐고 악쓰던 전적이 있으니 이해는 됨.

    한가지 더 웃기는 것 : UTF-8이 가변길이 인코딩이라고 극딜하는데 실은 EUC-KR도 가변 길이 인코딩임. 아스키코드 : 8비트 / 한글 등 : 16비트
  • 흠... 2015/11/04 15:02 # 삭제

    http://w3techs.com/technologies/overview/character_encoding/all

    좀 더 정확히 얘기하면 현재 전세계 85%의 사이트가 utf-8입니다. euc-kr은 0.4%네요.
  • 나인테일 2015/11/04 15:24 #

    EUC KR 같은거 쓰면 모바일 웹킷에서 에러율이 장난이 아니게 올라가죠.

    요새 플랫폼의 슈퍼갑이 모바일이고 웹 대장이 웹킷인데 모바일 웹킷에서 안 받아준다니 그건 그냥 웹이 아니네요;;;
  • shaind 2015/11/04 16:13 #

    나인테일 // 그건 아니죠. 그건 어디까지나 모바일 웹킷의 에러죠.
  • 누군가의친구 2015/11/04 21:32 #

    하나 더 추가:

    망상: "엄두가 안나서 못하는 거고 싫은 거죠."

    사실: 보통 개발자라면 새로운 표준이나 시스템을 익히려 노력하고 평소에도 노력. 엄두가 안나면 개발자를 포기하거나 개발자 코스프레를 안하면 됩니다.

    애초 책 읽는건 지루하고 구글 검색이 좋다고 하거나 구청에서 구청내 도서관을 여는 것을 예산낭비라고 하면서 무료 와이파이 확충이 효율적이라는데서 이사람의 사고는 지식습득과 거리가 멀다는것을 알수 있습니다.
  • ㅇㅇ 2015/11/05 08:05 # 삭제

    내가 아직까지 이해가 안되는건 (얘 이해하는건 버리고), 얘가 아직도 나무위키에 등재가 되지 않았다는거야.
    졸 꿀잼일것같은데
  • shaind 2015/11/05 08:13 #

    나무위키는 인터넷 찌질이 등재 금지 일텐데요. 그렇다고 무슨 저명성 있는 대형사건이 터진 것도 아니고.
  • Mor.glory 2015/11/04 15:54 # 삭제 답글

    스스로의 게으름을 탓해야지 누구를 탓하리오.
  • 무명병사 2015/11/04 17:25 # 답글

    ...개발자라는 분이 표준이 된지 한참 된 코드에 적응못해서 징징거리시는 걸 보니 당황스럽기 그지없군요.
  • 조현병도풍년 2015/11/04 17:58 # 삭제 답글

    그럼 그 잘난 ㅈ문가 아저씨는 전화만 되는 유선 전화기 쓰시지 왜 문자도 되고, 인터넷도 되고, 음악도 들을 수 있고, 인터넷 뱅킹 및 결제도 되는 복잡한 기능을 가진 스마트폰을 사용하시는 건지? 그렇게 옛날 유물이 좋으면 지금 사는 곳도 다 버리고 숲속에서 가세요. 숲속에도 의식주 해결할 수 있는 요소는 다 갖춰줘있는데요? 시끄러운 도시를 떠나 자연과 함께 살아가시죠 제발. 저희는 이 복잡하고 새로운 문명속에서 이런 똥글 보고싶지 않거든요?
  • ff 2015/11/04 18:12 # 삭제 답글

    언어마다 캐릭터셋을 바꿔야한다는 시점에서 안바꾸고 써도되는것보다 호환성이 떨어진다는걸 왜 몰라...
  • 희망의빛™ 2015/11/05 06:46 # 답글

    실제적으로 euc-kr 사이트 아직 많습니다. 다른 나라 글자코드 까지 합하면 4%는 좀 문제가 있는 통계 같아 보이는데요... 아마도 특정 집단 내에서 조사한 통계인듯... 더 자세한 통계를 알아보세요. 적어도 UTF-8 절반, 나머지 글자코드 절반은 돼 보이는데요.

    알려주신 http://w3techs.com/technologies/overview/character_encoding/all 사이트는 통계 조사 방법이나 어디서 조사했는지 등등이 나와있지 않는 것 같더군요. 구글 검색 엔진이 수집한 국가별 UTF-8 이나 여타 글자코드의 통계가 있다면 좋을텐데요. 그건 찾아보니 나와있질 않더군요. ㅡ_ㅡ
  • 디베스테이터 2015/11/05 08:04 #

    백날 자기 맘에 안들어서 문제있는 통계라는 소리 지겹다
  • shaind 2015/11/05 09:15 #

    이분 영어 못 읽으신답니다 댓글 내려주세요

    링크 원문 :
    "See technologies overview for explanations on the methodologies used in the surveys. Our reports are updated daily."

    그래서 technologies에 들어가면

    http://w3techs.com/technologies


    We investigate technologies of websites, not of individual web pages. If we find a technology on any of the pages, it is considered to be used by the website.
    We include only the top 10 million websites (top 1 million before June 2013) in the statistics in order to limit the impact of domain spammers. We use website popularity rankings provided by Alexa (an Amazon.com company) using a 3 months average ranking. Alexa rankings are sometimes considered inaccurate for measuring website traffic, but we find that they serve our purpose of providing a representative sample of established sites very well.
    We do not consider subdomains to be separate websites. For instance, sub1.example.com and sub2.example.com are considered to belong to the same site as example.com. That means for example, that all the subdomains of blogger.com, wordpress.com and similar sites are counted only as one website.
    We do not include redirected domains. For example, Sun.com redirects to Oracle.com, and is therefore not counted.
    Because our definition of "website" differs a bit from Alexa's definition, the "top 10 million" websites are actually less than 10 million. However, this has no statistical significance.
    Our reports are updated daily.
    Please be aware of the limitations indicated in our disclaimer.

    라고 웹사이트 통계 수집방법을 아주 친절하게 제시하고 있음.

  • 절망의빛 2015/11/05 09:45 # 삭제

    그럼 희망의빛 당신이 주장하는 "적어도 UTF-8 절반, 나머지 글자코드 절반은 돼 보이는데요." 라는 근거는 무슨 통계에서 나오는 겁니까? 그냥 자기 망상 아님?

    하긴 뭐 대충 자기 주변만 보고, 세상 판단하는 사람을 대상으로 뭔 통계를 논하리오.
  • 희망의빛™ 2015/11/05 12:49 # 답글

    제로보드4를 제외한 제가 관리하는 일부 게시판이나 사이트의 UTF-8 화를 조만간 시도해 봐야겠네요. 이미 컨버전한 가상디렉토리 사이트도 1개 있지만 전 사이트로 확대하려면 많은 컨버전을 해봐야 할 겁니다. 이게 말씀드렸다시피 워낙 관리하는 사이트가 많아서 다 바꾸려면 시간이 꽤 오래 걸리고 노가다 작업이 될 것 같습니다. 그걸 지적한 거였는데 여러분들은 너무 UTF-8 이행의 당위성만 강조하신 듯 합니다. 당연히 UTF-8로 전환하면 전세계적인 통합 글자코드를 사용하게 되니 골치아픈 한글 인코딩 문제를 신경쓰지 않아도 되고 전 세계를 상대로 서비스를 제공할 수 있으니 좋을 겁니다. 전세계 모든 글자를 다 다룰 수도 있구요. 그게 장점이 되겠지만 참으로 다 전환하기가 엄두가 나지 않네요. 가상디렉토리 하나하나씩 전환해 보는 것도 좋은 방법이 될 겁니다.

    이곳에 덧글 달아주신 모든 분들께 감사드립니다. 제로보드4는 금방 전환하기가 쉽지 않을 것이고 나머지 군소 사이트들 같은 경우는 금방 가능할 것도 같은데 함 시도해봐야 알겠지요.

    시간이 나는대로 시도하고 나서 완성되는 대로 가상디렉토리 사이트 하나하나씩 결과를 소개해 드리도록 하겠습니다. 언제가 될지 참 저도 장담을 못하겠네요. 쩝~~~~
  • highseek 2015/11/05 23:34 #

    그건 그냥 님이 못하는거지 다른사람들은 별로 어려울 것도 없고 오래 걸릴 것도 없으니 지적하실 이유가 없습니다. 관리하는 사이트가 수십 수백개라 하더라도 스크립트좀 짜서 돌리면 금방 끝나요. 오래 걸릴것도 없고 딱히 노가다일 이유도 없음.
  • ㅇㅇ 2015/11/05 08:03 # 삭제 답글

    내가 아직까지 이해가 안되는건 (얘 이해하는건 버리고), 얘가 아직도 나무위키에 등재가 되지 않았다는거야.
    졸 꿀잼일것같은데
  • 희망의빛™ 2015/11/05 11:03 # 답글

    절망의빛// 거기 보니까 survey 란 용어가 나오던데 그거 설문조사 아니던가요? 미국 일개 웹사이트에서 실시한 설문조사 가지곤 알 수 없습니다. 게다가 영어권 사이트에선 그 통계가 맞을지 모르겠지만 한국에선 적어도 제 즐겨찾기에 등록된 사이트들의 통계를 대략 산출할 필요도 있을 수 있죠. 구글 통계가 가장 정확한데 그것도 한국이냐 세계 전부냐에 따라 달라지겠죠.
  • asdasd 2015/11/05 11:05 # 삭제

    survey는 설문조사가 아니라 그냥 조사입니다..... 설문조사도 survey라고 하는거지 survey가 설문조사만 의미하는게 아닙니다... 아..........
  • 디베스테이터 2015/11/05 11:22 #

    그럴줄 알았다. 저번에 레퍼런스 헛소리부터 지금까지, 영어를 못쓰니 이해가 될리가 없지.
  • 절망의빛 2015/11/05 13:25 # 삭제

    위에 다른 분 의견은 편중된 조사 인 것 같아서 의심스럽다더니만, 자기가 즐겨찾기한 곳만으로 통계를 산출할 필요도 있을 수 있다니.. 자기 즐겨찾기에 등록된 사이트 통계라면, 그거야 말로 편중된 조사네요.

    통계의 정확성은 샘플의 수에 크게 의존하는데.. 님 즐겨찾기에 등록된 사이트가 백만개 이상 되나요?


    내 주변만 가지고도 충분하다라는 쓰레기글 쓰려면 아예 답글 달지 마시길.. 그건 "통계"가 아니라 그냥 자기 주변 "분포"일 뿐입니다.


    그리고 기술관련 전문 자료나, 논문에서 survey라 하면, 그 분야에 대한 조사 결과를 의미합니다.
  • 희망의빛™ 2015/11/05 12:58 # 답글

    shaind, asdasd, 디베스테이터// 구글 번역기를 참고해서 제가 함 번역해 봤네요. ㅎㅎ. 그리 어렵지 않은 내용이네요. 한번 읽어보시고 판단하시죠. ㅋㅋ
    ==========================================================================================

    우리는 개개의 웹페이지가 아닌 웹 사이트 기술들을 조사했습니다. 우리는 페이지상의 임의의 기술을 찾을 경우, 웹 사이트에 의해 사용되는 것으로 간주했습니다.
    우리는 도메인 스패머의 영향을 제한하기 위해 통계 상위 1000 만 웹 사이트(2013년 6월 전에는 상위 백만 사이트만)만 포함시켰습니다. 우리는 3개월 평균 순위를 사용하는 알렉사 (Amazon.com 회사)에서 제공하는 웹 사이트의 인기 순위를 사용합니다. 알렉사 순위는 때때로 웹 사이트 트래픽을 부정확하게 측정하지만, 우리는 그들이 매우 잘 구축된 사이트의 대표 샘플을 제공하는 등 우리의 목적에 부합한다는 것을 알게 됐습니다.
    우리는 별도의 웹 사이트로 하위 도메인의 경우는 고려하지 않습니다. 예를 들어, sub1.example.com 및 sub2.example.com은 example.com와 같은 사이트에 속하는 것으로 간주됩니다. 즉 blogger.com, wordpress.com 및 유사 사이트의 모든 하위 도메인이 하나의 웹 사이트로 계산됩니다.
    우리는 리디렉션 된 도메인을 포함하지 않습니다. 예를 들어, Sun.com은 Oracle.com 으로 리디렉션되는데, 따라서 이것은 계산되지 않습니다.
    "웹 사이트" 의 우리의 정의는 알렉사의 정의와 약간의 차이가 있기 때문에, "천만 상위" 웹 사이트는 실제로 천만보다 약간 적습니다. 그러나, 이건 통계적으로 의미가 없습니다.
    우리의 보고서는 매일 업데이트됩니다.
    우리의 면책 조항에 명시된 제한점에 유의하십시오.
  • 디베스테이터 2015/11/05 13:03 #

    잘 된 조사인데 뭐가 불만? 그리고 번역기 안돌려도 잘 읽는 사람이 태반인데 헛짓만 했군.
  • 절망의빛 2015/11/05 13:27 # 삭제

    사이트가 조사 잘 했네요. 이정도 통계면 거의 정확하지 뭘..

    일개 사이트라니..

    중소기업 EA랑, 지잡대 MIT 생각나네
  • shaind 2015/11/05 16:54 #

    정말로 웹 크롤러로 세상의 모든 페이지를 일일이 조사할 게 아닌 이상 이거보다 잘 하기 어려울 것 같은데 말이죠.

    그것도 그렇고, 듣보 중의 듣보 사이트들이나 딥웹을 네이버, 다음같은 초대형 사이트랑 1대1로 비교해서 수를 세는 것보다는 톱 1000만개 웹사이트(1000만개만 해도 엄청 많지만요)를 사용하는 게 훨씬 합리적이라고 봅니다.
  • 김회육 2015/11/05 17:25 # 삭제 답글

    오 하느님 섊 이 중생을 구제해주소서.
  • 어흌ㅋㅋㅋㅋㅋㅋㅋ 2015/11/05 18:17 # 삭제 답글

    컨셉이죠..? 진지하게;; 제발 이거 컨셉이죠...? 지금 블로그 주제가 웹개발에서 하면 안되는것들 이죠? 토할거 같다 아... 으....
  • 에리카 2015/11/08 00:39 # 삭제 답글

    2015년에도 zb4 운운하는 데서 이미 크게 아웃 아님????
  • 희망의빛이 또 2015/11/08 00:40 # 삭제 답글

    희망의빛 이윤찬이 또!
  • 마누 2015/11/08 03:04 # 삭제 답글

    문자셋이 불편한 건 그렇다 쳐도, 메타 태그가 문자셋 설정에만 사용하는 건 아닐텐데?
    홈페이지를 만든 제작자 이름이나 홈페이지에 대한 설명 등 기타 잡다한 정보를 넣는 게 메타 태그다. 공부 좀 해!
  • .. 2015/11/21 10:04 # 삭제 답글

    UTF8 로 안가고 예전 캐릭터셋 전부 유지하는 게 호환성을 유지하는 거라는 소리는 또 처음 듣네요ㅋㅋ
    본문글 내용 보면 제대로 된 개발자는 아닌거 같은데ㅋㅋ 개발자분이신가ㅋㅋㅋㅋ
  • Qaz 2019/05/19 15:06 # 삭제 답글

    좆찬 좆찬 좆찬
댓글 입력 영역
* 비로그인 덧글의 IP 전체보기를 설정한 이글루입니다.


웹로그 검색