%B0%AD%C1%C2%C0%DA%B7%E1-7189-jesuswn.zip

안녕하세요 새항아리입니다.

 

제목 : GBA 한글화 쌩초보 강좌 - 5

부제목 : 고유번호표에 대하여.

 

이번 강좌에서 원래는 고유번호표로 대사를 뽑는 연습을 하려고 했지만 조금 분리해서 고유번호표에 대한 이야기를 하고 다음강좌에 대사를 뽑는 것을 해보도록 하겠습니다..

 

우선 고유번호표가 무엇인지에 대한 개념부터 잡고 넘어가도록 하겠습니다.

저번 강좌에서 대략 말씀드린것 같은데 고유번호란 것은

 

롬이 이해하는 폰트의 코드라고 보면 되겠습니다.

즉 개발자가 아이시테루라는 문장을 사용자에게 보여주고 싶다고 봅시다.

 

그러면 개발자는 아이시테루라고 적힌 그림을 띄울수도 있구요..(그림폰트)

아니면 폰트내에서 아,이,시,테,루를 출력하라고 명령할수도 있습니다.

 

지금 단계에서는 보는 것은 아이시테루를 출력하라고 명령하는 부분입니다.

출력하라고 명령은 내려졌는데 무엇을 출력해? 하는 곳에 들어가는 것이

아이시테루겠죠?

 

하지만 롬은 아이시테루라는 것을 모릅니다.. 그래서 아는 몇번째 글자고..

이는 몇번째.. 이렇게 정해진 번호를 불러오면 되는 겁니다.

 

이 번호가 고유번호이고 이것을 작성하는것이 대사를 뽑는 가장 중요한 방식입니다.

 

왜냐하면 우리는 코드로만은 이해하기 힘들지만..

즉 55,77,88,12,5F 출력하라는 것을 이게 뭐야 하고 받아드리겠지만..

아이시테루라고 적혀 있다면.. 아 사랑해요라는 뜻이구나 하고 받아들이기 편하기 때문입니다.

 

그러니까 고유번호는 롬과 나 사이의 통역관이라고 볼수 있습니다.

코드를 문장으로.. 문장을 코드로 변환시킬수 있는 중간 매게물인거죠..

 

조금 이해가 되셨나요?

 

그럼 이제 실제로 적용해보면서 이야기를 해보도록 하겠습니다.

 

스크류 브레이커를 봅시다..


 

사용자 삽입 이미지

 

순서대로 적어내려가야 합니다.. 이렇게 한글로 하는게 편하다면 이렇게 하셔도 됩니다.

 

사용자 삽입 이미지

 

그러나 번역을 스스로 하지 않는 다면.. 이렇게 주면 번역가분이 난감하시겠죠?

왜냐하면 이게 정확히 무슨 말인지 한글로 되어 있어서 더 이해하기 힘들게 만들수 있다는 거죠.

 

예를 들어 '이'라고 적혀 있는 단어가 있다고 칩시다. 하지만 한자로 이는 두개(二)라는 뜻도 있고 다스린다(理)라는 의미도 있습니다. 하지만 '이'라고만 적혀있다면 이게 두개라는 뜻인지 다스린다는 뜻인지 아니면 히라가나인지 가타카나 인지 모르게 된다이겁니다..

 

그건그렇고 일본어를 어떻게 입력하는지 모르시는 분들께 아주 간단하게 입력하는 방법으로는

네이버 일어사전을 사용하시면 됩니다. 클릭하고 드래그 복사 붙여넣기의 반복이면 일본어를 그냥 가져다 쓰실수 있습니다.


 

사용자 삽입 이미지


이건 너무 비효율적이다 하시는 분들은

일본어 입력기 같은 프로그램을 쓰시던지 IME를 설치하시던지 아니면 한글 (워드프로그램)에서 일본어 입력기를 쓰셔도 됩니다..

 

 

사용자 삽입 이미지


어쨋건 차근차근 입력해주십시오..

 

여기에서 중요한 말씀 드립니다. 지금은 01을 아라고 적었습니다.

그런데 아가 00일수도 있다고 저번강좌에서 말씀드렸죠?

 

그러면 이게 00이 시작인지 01이 시작인지 어떻게 알아내느냐?

그것은 저번 강좌에서 대사를 찾고 한글자로 민적이 있죠?

그 글자가 12 번째 글자였고 '츠'였습니다.

 

그걸로 거꾸로 올라가면서 세어보면 됩니다.

12, 11, 10, 0F(09아니예요.. 16진수입니다. 꼭 명심하세요.), 0E, 0D, 0C, 0B, 0A, 09,

08, 07, 06, 05, 04, 03, 02, 01 ---> 아 !! 세어보니 확실히 01이 '아' 맞죠?

 

확실히 하시려면 이렇게 해야합니다..

어쨋건 줄줄이 입력합니다..

 

사용자 삽입 이미지


아이구.. 하실분이 있으실지 몰라 스크류 브레이커의 고유번호표는 파일로 올립니다..

사실 스크류 브레이커의 고유번호는 240여개밖에 안됩니다.

이건 사실상 겨우입니다.. 마녀들의 잠이라는 비주얼 노블 게임의 경우 어려운 한자만해도

2000개가 넘어요.. 그리고 웬만한 게임들도 700개정도는 됩니다.

이건 히라가나, 가타카나 밖에 없으니 양호...

 

사용자 삽입 이미지


어쨋건 저장하실때 확장자는 TBL로 하시고 이름은 아무거나 상관없습니다..

 

저장하셨으면 대사장을 실행하시고 롬을 불러오신후..

메뉴 중에 대사 -> Thingy 표 열기 를 누릅니다..

 

사용자 삽입 이미지


고유번호표를 불러오면

 

사용자 삽입 이미지


244개 토큰이 읽어졌다고 하네요..

 

토큰의 영어 단어 뜻중에 교환이라는 뜻에 알맞겠군요..

이런이런 코드가 나오면 이런단어로 교환해줘라..

그래야 사람이 이해할수 있는 문장이 되니까 라고 볼수 있겠죠?

 

사용자 삽입 이미지


Thingy 보기 활성화를 누르면 옆에 일어가 표시됩니다.

이것이 바로 토큰(교환) 된거 겠죠?

 

사용자 삽입 이미지


해당 대사를 봅시다.

대사 위치는 전전 강좌에서 찾았던걸 기억하실겁니다..

 

사용자 삽입 이미지


이부분을 덤프해봅시다..

원래라면 대사 부분을 전체 뜨면 되지만 지금은 그 이야기가 아니라

저번시간에 했던 제어코드가 중요한 이유를 직접 보여드리기 위해서 입니다.

 

사용자 삽입 이미지


메뉴에서 대사 -> 대사덤프를 눌러보면 위와같은 창이 뜨죠? 다음으로 바이트를 덤프에서 창으로 바꿉니다.

 

사용자 삽입 이미지

 

이처럼 덤프되었습니다. 하지만 중간중간 쓰레기가 있습니다.

이것을 만약 아래와같은 고유번호표로 읽어드린다면?

사용자 삽입 이미지


우선 고유번호표를 조금 수정해봅시다..

저번 강좌에서 찾았던 FC 제어코드와 FE 제어코드를 넣습니다.

FC 제어코드는 뒤에 2개의 내부인자 제어코드를 가지니까

대사와 헷갈리지 않도록 2개 무시 -> 라고 적습니다.

 

사용자 삽입 이미지


다시 tbl파일을 읽으려고 하면 이미 읽어진게 있는데 새로 읽을거냐는 메세지..

 

사용자 삽입 이미지


이번에는 246개의 토큰을 읽어드렸군요..

그리고 다시 덤프해보면..

 

사용자 삽입 이미지


아까보다는 조금 읽기 편해지지 않았습니까?

 

사실 이건 개인적 취향이라 이렇게 보는게 더 싫으신분도 계실수 있습니다.

그리고 프로그래머라면 대사 추출 프로그램에 도움이 되도록

대사부분중 쓰레기를 빼는 프로그램을 만드는 것은 막 어렵운 것도 아니지만..

 

프로그래머가 아니고 초보인 분들은 이 방법을 쓰시는 것도 나쁘지 않다고 봅니다.

 

제어코드의 고유번호화 하는 거죠.. 고유번호는 무조건 대사로 뽑히니까 스스로 제어코드의

의미에 맞춰서(여기서는 "2개 무시->") 고유번호를 만들어 놓으면

대사를 출력할때 조금더 편하게 볼수 있지 않겠습니까?

 

이번에는 하로보츠의 고유번호를 찾아보겠습니다.

(사실 저도 만들지는 않았어요.. 시간이 없어서 ^^; 역시 스스로 학습 ㅠㅠ)

 

사용자 삽입 이미지


하로보츠의 폰트를 보면서 고유번호를 입력해야하는데.. 이번에는 거꾸로 세어보니 처음글자가

01이 아니군요.. 00입니다.

 

이렇게 롬마다 다를수 있으니 조심하라고 말씀드린겁니다..

 

사용자 삽입 이미지


뭐 고유번호 입력하는것은 다 거기서 거기니까 넘어가도록 하겠습니다..

 

다만 하로보츠의 경우 히라가나 같은 것들은 1바이트 의 고유번호를 가지고 있고

한자는 2바이트로 되어 있다는 것은 저번 강좌에 살펴봤습니다.

 

사용자 삽입 이미지


한자중 大라는 글자가 F1 06 이라는 코드였지요?

그러면 우선 한자를 보기 좋게 윗선에 맞춰봅시다.

 

기본적으로 YYCHR의 경우는 화살표와  + -키면 깔끔하게 정돈할수 있습니다..

 

사용자 삽입 이미지


F1 06이 大였으니 거꾸로 05, 04, 03, 02, 01, 00 으로 올라가보니 한자의 시작 글자인

言이라는 글자가 되는군요..

 

따라서 F1은 한자의 시작부분의 뭉텅이를 말하고 그 뭉텅이의 1번째 글자는 言

그래서 코드로는 F1 00 = 言이 되겠네요..

 

사용자 삽입 이미지

 

그리고 위에서 말씀드린 뭉텅이라는 것은 YYCHR로 치자면 256개의 글자수를 말합니다.

저번 강좌에서 1바이트 와 2바이트 구분할때 말씀드린

 

1바이트로는 256개의 글자의 구분만 가능하다라는 것.. 즉 그것을 부모로 가지고 있다면

2바이트로는 256 곱하기 256가 되서 65536개의 구분이 가능하다는 것이고

2바이트 중 앞 1바이트나 뒤 1바이트가 부모 바이트라면..

그것 하나로 256개를 나타낼수 있다는 말입니다.

 

쉽게 예로 들자면 위와같을때에는

F1 00 - F1 FF 까지 256개.. 그리고 F2 00 - F2 FF까지 256개.. 이렇게 나아간다는 것이죠.

그러니까 앞의 1바이트가 부모바이트가 되서 십진수로 따지면 10의 자리 수처럼 된다 이말입니다.

 

그리고 F1 XX에서 F5 XX까지 사용이 가능하다면.. 5개의 256개가 가능하니 1280개를 분류할수 있다는 거죠..

 

어쨋건 위와 같이 한자를 찾아가면 됩니다만..

한자를 모두 알 수도 없는 노릇이고..
어떻게 하면 좀더 쉽게 한자를 찾을수 있을까 에대한 좋은 방법을 소개해 드리겠습니다.

한식구 강좌에서도 벌써 알려주신 방법입니다..

 

사용자 삽입 이미지

 

이 단어를 잘 모르는 저로서는 난감합니다 이럴때..

제목표시줄에 있던 입력도구모음을 복원해놓습니다.

보통은 'A'나 '가' 혹은 태극문양으로 표시되어 있죠..

사용자 삽입 이미지
복원하면 저렇게 뜹니다. 저기에서 물감통같이 생긴것을 누르면

아래처럼 확장입력기가 뜹니다.


 

사용자 삽입 이미지


필기 인식인데요. 이걸로 한자를 찾으면 편합니다. 마우스로 한자를 그리면(?)

 

사용자 삽입 이미지
 
비슷한 한자가 검색되고 누르면 문서에 써집니다. 간단하죠?
 
하지만 이것이 통용되지 않는것이 있으니 바로 약어입니다.
일본은 간체자 문화권으로 번체자를 쓰는 우리나라와는 조금 다른 한자입니다.
(간체자 번체자 모르셔도 일본은 약아서 약어 쓰고 우리는 본래 본체를 쓴다고 보시면... 유머(?) ^^)
 
그분들을 위해서 파일로 약어 정리표도 올립니다. 확장입력기로 찾아보고 안찾아지면 사용하세요..
 
그럼 고유번호표에 대한 강좌는 여기까지로 마치도록 하고..
다음 강좌에서는 대사를 뽑아보자 를 써내려가도록 하겠습니다.
 
 

댓글을 달아 주세요

  1. Favicon of https://shouting.tistory.com 새항아리 2007.03.28 15:44 신고  address  modify / delete  reply

    누가 쪽지 주셔서 확인해보니 위에 강좌자료에 약자 부분 이지러질 결자는 원래 약자가 없습니다. 실수로 추가되었나보니 신경쓰지 말아주세요

  2. 말랑말랑 2007.04.19 01:40  address  modify / delete  reply

    슬쩍 지나가다가 일본어 약자의 입력을 위한 확장입력기의 사용법에 대해 한마디 드립니다.

    ime의 일본어 입력을 등록해 놓았다면, 일본어 입력 상태로 바꾼 상태에서 확장입력기를 누르고 (물감통모양)
    왼쪽의 글씨쓰는 것 같은 아이콘에서 마우스 오른쪽 버튼을 누릅니다.
    그러면 '설정'이 있는데요, 눌러보면 '사용 가능한 애플릿'이 있습니다.
    이 중에 Hand Writing (JA)를 추가하면, 일본어 약자가 써지는 확장입력기가 생깁니다..^^
    사용방법은 똑같구요. 두개를 병행하여 사용할 수도 있고, 한자를 일본어로 읽는 법 등도 나오므로 여러모로 쓸모가 있답니다.
    (일본어 공부에도 도움이 되죠..^^)
    설명이 어려웠는지 모르겠지만 한글화를 하려는 많은 분들께 조금이나마 도움이 되었음 좋겠네요.

  3. 미치겠네요 2007.07.09 01:23  address  modify / delete  reply

    웅 ~~~ 기호같은건 어떻게 적용시키나요???

  4. 바베큐 2007.09.30 18:40  address  modify / delete  reply

    이번것도 역시 어렵군요 ... 뭐가뭐지 원 .. 에휴 ..

  5. Favicon of http://blog.naver.com/jhw0604 에플트리 2008.02.10 06:11  address  modify / delete  reply

    슬슬 노가다의 시작이 보이는군요 ㅎㅎ

  6. 최규영 2008.10.16 02:00  address  modify / delete  reply

    일어판인데영어로나옴.이땐어떻게함?
    대사장으로했는데도영어로나옴

    • Favicon of https://shouting.tistory.com 새항아리 2008.10.16 11:35 신고  address  modify / delete

      저도모르겠음.
      이라고 달아야할것 같이 댓글을 써놓으셨네요.
      여기나온 강좌를 이해하고 적용하시는정도는 스스로 하셔야 한글화를 하실수 있습니다.

  7. 박한민 2009.03.29 14:23  address  modify / delete  reply

    롬에서 고유번호 00,01이 모두 공백인 경우가 있나요?? 모두의 쇼기의 경우처럼 다른롬을 써치알에서 찾아보고 해봤는뎅,,,
    둘다 공백이네요,,,
    공백은 걍 한글로 '공백'이라 써도 무관한지요...
    그리고 폰트로 표현할 수 없는 표현은 어떻게 써야하나요(폰트 둘이 합쳐져서 하나의 그림 형상을 하고있네요 ㅡ,ㅡ;;)

    • Favicon of https://shouting.tistory.com 새항아리 2009.03.31 15:54 신고  address  modify / delete

      어떤 롬이라도 전부 그런다면 문제가 있을 수 있네요.
      우선 강좌에 적혀있는 그대로를 따라하기 방식으로 한번 해보시고 그래도 안된다면 방식에 문제가 있을듯 보입니다.

      그리고 시작 주소가 꼭 00이나 01이 아닐수도 있습니다.

  8. Favicon of http://blog.naver.com/hyb277 매트 2009.08.10 01:35  address  modify / delete  reply

    고유번호를 작성하고 있는데요, Search R에 테이블이란게 있어서 클릭해보니까 영자 소문자와 대문자가 고유번호와 함께 나열되어있더라구요. 그래서 열심히 적고 있었는데 나중에 보니까 소문자와 대문자가 중복으로 나오네요. 이런 경우도 있나요?
    예를 들어서 1D와 6A가 모두 か입니다; 나머자 소문자 대문자도 고유번호가 두개씩 있구요.
    참고로 0~9는 테이블이 안나오네요;? 1~0으로 입력해서 그런가? ;; 지금 질문해서 답변 받을 수 있을 진 모르겠지만 덧글 남겨봅니다; 참고로 전 몇일전부터 프로그램들을 처음만져보기 시작한 초짜예요(.. 서치알 사용도 오늘이 처음이고(..

    • Favicon of https://shouting.tistory.com 새항아리 2010.01.06 22:13 신고  address  modify / delete

      고유번호가 두개인 경우도 간혹 있긴하지만 대부분의 경우라면 두개의 폰트가 있고 두개의 고유번호를 가지는 경우가 많습니다. 조금 더 확인해보시는게 좋겠네요.

  9. ㅇㅋ 2013.08.01 00:36  address  modify / delete  reply

    간체는 중국어를 말하는거구여..일본어의 약자는 간체랑 전혀 관계가 없어여..간체가 간단히 줄여 만든 약자라는 뜻의 일반명사가 아니라 중국어를 말하는거..