안녕하세요. 새항아리입니다.

 

제목 : GBA 한글화 쌩초보 강좌 - 6

부제목 : 대사를 뽑아보자

 

이번 강좌에서는 대사를 뽑는 것에 대해 설명하도록 하겠습니다..

 

그 전에 저번 강좌에서 빠트린 내용을 조금 말씀 드리도록 하겠습니다.

우선 고유번호표를 작성할때 문제가 생길수 있는 부분을 설명 안드렸네요..

 

사용자 삽입 이미지


이것은 싸울 전자의 약자입니다..

저번 강좌시간에 올려드린 파일을 보시면

戰 (싸울 전) →戦 

이렇게 되어 있을 겁니다.

 

싸울 전자는 뭐 비슷하니까 별로 상관없지만..

그림 화자 같은 경우는

畵 (그림 화) → 

글자 자체가 달라서 약어를 주로 쓰시는 분들은 번체자를 잘 모르실수 있습니다.

 

특히 번역일을 많이 하시는 분들이나 일본에서 오래사신 분들은 번체자보다 간체자를 더 잘 알고

계십니다. 따라서 번역을 직접 하실때에는 상관없이 그냥 번체자로 고유번호표를 작성해도 되지만

 

다른분께 맡겨야 한다면 간체자를 써야합니다..

 

사용자 삽입 이미지

 

하지만 간체자로 저장을 하려고 하면 이런 메세지가 뜹니다.

이것은 무슨 말이냐면.. 폰트라는 것을 기계가 인식할때는 코드로만 인식한다는 이야기는 저번에도 말씀드렸던것 같네요..

 

그런데 문제는 이 코드라는게 글자가 한정되어 있다보니 이 국가에서 잘 안쓰는 글씨는 뺐습니다.

국가마다 코드가 다르죠.. 아니 코드는 같지만 그게 말하는 글자가 다르달까요?

 

즉 어느 국가에서는 2301이 亞 자 일수도 있고 '험' 자 일수도 있는 겁니다.(그냥 예입니다. 그 코드가 저런 글자를 나타내는지는 몰라요.. ^^;)

 

그래서 잘 안쓰는 글자를 빼놨습니다. 즉 ANSI라는 코드내에 한글에 대한 기준을 잡아놨다 이말입니다. 한국의 ANSI코드와 일본의 ANSI코드는 다를수밖에 없는거죠..

그래서 잘 안쓰는 약어같은 한자를 한국의 ANSI로 저장하려 하면. 위와같은 말이 뜹니다.

 

이럴때를 대비해서 나온게 유니코드라는 겁니다. 유니코드는 1~3바이트가 한문자입니다.

(ANSI는 1~2바이트)

그래서 유니코드는 모든 국가의 언어를 제대로 보여줄수 있습니다.

 

즉 여기에서는 유니코드로 저장하면 (아래그림)

 

사용자 삽입 이미지


에러 없이 저장이 됩니다.

 

하지만 저는 이 방법을 추천하지 않습니다, 왜냐.. 대사장이 유니코드를 지원하지 않기 때문입니다.

이것은 무슨 의미냐 하면.. 대사장은 한글자는 1~2바이트로 인식한다는 말씀이고 따라서 유니코드로 작성된 문서는 ? 와 같은 글자로 대사를 추출하기 때문이죠..

 

읽으시는 분은 강좌를 쓰는 넘이 초반에는 간체자를 써야 번역가가 읽기 좋다고 해놓고 지금은 딴소리 한다고 하실수 있는데요..

 

제가 말씀드리는 방법은 우선 고유번호표는 번체자로 작성하십시오.. 그리고 간체자인데 번체자로 작성한 것을 따로 빼내서 저장해놓으세요..

 

예) 區 (구역 구) →/  當 (마땅할 당) → 

 

이렇게 말이죠.. 그리고 대사를 덤프하고 번역가 분에게 넘기기 전에..

메모장같은 것에서 간체자인데 번체자로 고유번호표를 작성한 것을 찾아바꾸기 하시면 됩니다.

 

그러면 대사장에서 대사를 덤프할때 오류가 생기지도 않고 번역가 분은 간체자로 받아보실수 있는 일석 이조이죠..

 

사실 어플로케일 같은 프로그램을 써서 하는 방법도 있지만 초보분들에게는 이게 편할 겁니다.

 

그리고 고유번호표를 작성할때 도움이 될수 있는 팁하나 설명해드리겠습니다.

고유번호표를 작성할때 고유번호를 쓰는게 조금 짜증날때가 있습니다.

00부터 FF까지 많을때는 2000개가 넘게 써야하는데요..

 

이것을 만들어주는 프로그램도 있습니다.(한식구 자료실을 참고하세요)

하지만 저는 한글에서 F4를 누르는 방법을 자주 사용합니다.

 

사용자 삽입 이미지


 

한글은 독특하게도 수직으로 글자를 드래그 할수 있는 기능이 있습니다.

그 키가 F4키인데요. 이것을 누른후 방향키를 움직이면

위와같이 선택이됩니다.

 

사용자 삽입 이미지


이걸 앞에 붙여넣기 하면

줄을 내리면서 붙여넣기가 됩니다. 그리고 앞번호 (00 - 0F까지 했으니 이번에는 1이겠죠?)

는 매크로 기능을 사용해서 붙여넣기 반복을 하시면 편리합니다.

 

매크로에 대한 이야기는 조금 후에 나옵니다.

 

이제야 대사 추출에 대한 이야기를 하려고 하는데 하얗게 불태운것 같은 느낌..

사용자 삽입 이미지

 

어쨋건 대사를 뽑는 이야기를 본격적으로 해보지요..

 

사용자 삽입 이미지


대사 시작부분에 이렇게 책갈피를 끼워넣는 정도의 센스가 있어야 다음번부터 안귀찮습니다.

다만 책갈피 정보가 고유번호표에 들어가다보니 고유번호표를 읽어오지 않은 경우에는 쓸수가 없네요.. 

 

사용자 삽입 이미지

 

우선 대사의 시작부분을 알았으니 끝부분을 찾아봅시다. 내리다보면 딱 느낌이 오는 부분이 있죠?

이것을 끝부분이라고 생각합시다.

(원래는 이렇게 찾으시면 별로 안좋습니다만.. 좀있다가 설명드리겠습니다.)
 

사용자 삽입 이미지


대사를 덤프해봅시다. 드래그 해서 덤프하실수도 있고 끝나는 부분의 주소를 확인하시고 덤프할 양 밑에 오프셋까지 부분에 써 넣어주셔도 됩니다.

이번에는 양이 좀 많으니 파일로 저장해봅시다. 

 

사용자 삽입 이미지


대사를 덤프할때 가장 중요(?)하다면 중요한 팁인데요. 저장할 파일명을 주소를 써넣으시는게 좋습니다.. 왜인지는 조금 후에(이렇게 미루는게 많아도 강좌 마지막 부분에 설명드립니다..) 

 

사용자 삽입 이미지


덤프가 완료되었다네요.. 파일을 한번 열어봅시다. 

 

사용자 삽입 이미지


 파일이 있습니다. 하지만 2개 무시라고 적힌 부분이 적지 않게 섞여 있습니다.

번역가에게 이렇게 주면 별로 좋아라 하지 않을겁니다. 우선 대사가 제대로 뽑혔는지

다음 대사를 확인하시고 이야기 하겠습니다.

 

드래그 한 부분이 다음대사가

 

사용자 삽입 이미지


맞군요.. 이제는 이 파일을 한글에서 읽어봅시다.

그리고는 찾기에서 {2개무시->}를 찾아봅시다. 

 

사용자 삽입 이미지


여기에서 중요한 점은 한글의 매크로 기능이 충분히 훌륭하다는 점이고.

그래서 제어코드를 어느정도는 커버할수 있다는 점입니다.

 

하나를 찾고 닫기를 누른후 매크로를 설정해봅시다.

메뉴중 도구에서 매크로.. 키 매크로 정의를 누릅니다. 

 

사용자 삽입 이미지


비어있는 곳을 찾아서 시작을 누르고.. 이제 본격적으로 해봅시다.

 

한글에서 다음찾기는 단축기가 Ctrl + L 입니다.  이것을 한번 누르면

{2개무시->}를 찾을겁니다. 이때 찾아진 것을 del키 눌러서 지우고

다시 del키를 6번({,X,},{,X,} <- 2개 무시니까요..) 누르면 한번이 끝납니다.

다시 메뉴 도구 매크로 중지 누르고..

 

단축키를 누르면.. 여기서는 위에 보니까 Alt+4이군요.

Alt+4한번에 제어코드 하나가 없어집니다.

 

계속 누르고 있으면 전부 삭제.. 하면 아래와 같이 정리됩니다.

 

사용자 삽입 이미지


 

저는 {} 표시가 마음에 안들어서(이것은 대사장에서 추출할때 설정할 수 있습니다..)

다 찾아바꾸기에서 { -> 無(없애라는 이야기) 로 바꾸고 ENTER 2번 쓰인것도 한번으로 바꿨더니

사용자 삽입 이미지
 
이처럼 정리되는군요. 웬지 깔끔해진것 같지 않습니까?
대사만 쭉 뽑혔네요..
 
하지만 아까부터 말씀드린 부분..

 

왜 대사를 대충 뽑으면 안좋은가 하는 부분입니다.

 

대사라는 것을 롬은 한번에 통으로 저장할수도 있지만

챕터1, 챕터2 이렇게 아니면 전투대사, 게임대사, 혹은 RPG라면 마을별로 대사를 분리시켜 놓을 때도 있을수 있습니다. 이 스크류 브레이커도 보니까 위로 조금만 올려보니

사용자 삽입 이미지


이부분도 대사겠네요. 왜냐하면 대사가 아닌 코드가 저렇게 우연히 만나서 8바이트나 일치하고 게다가 "손님에"(오캭사마에) 로 표시될 확률은 극히 적으니까요..

 

즉 대사를 놓쳤다는 겁니다.. 이것때문에 대사를 함부로 그냥 여기서 여기까지겠지라고 막 쓰시면 안되는 이유입니다.

 

대사를 제대로 뽑으려면 프로그래밍을 해서 포인터부분을 찾아 하나하나 찾아가면서 대사가 맞는지 대사에서 쓰이는 제어코드가 있는지 아니면 시작코드라던지 하는 부분을 체크해야합니다.

 

하지만 초보분이나 프로그래밍을 하실줄 모르시는 분들은 오히려 어렵습니다. 이때는 우선 YYchr로 폰트를 찾을때처럼 죽 한번 훌터보시면서 아무리 대사가 나누어져 있더라도 부분부분은 모여있으니까 그것들의 주소를 적어나가시는것이 좋습니다.

 

그리고 대사가 촘촘히 분리되어 있더라 하더라도 어느정도는 분포가 한군데 쯤 모여 있을 확률이 높기 때문에 그부분을 먼저 대사 처리하시면 됩니다.

그리고 테스트 할때 빼먹은 부분의 대사주소를 다시 찾고 그것을 수정하는 식이 좋을듯 싶네요..

 

 

다음 강좌는 많은 분들이 어려워 하시는 포인터입니다.

저도 대학다닐때 (공대였으니까요) 포인터에 대해 신입생 애들한테(동아리) 강좌해주는 방식으로.. 한번 접근해보도록 하겠습니다..

 

 

덧말, 오늘 처음으로 EJ_Maker라는 프로그램의 존재를 알았습니다.

확실히 대사장보다는 편리한 프로그램 같습니다.. 만약 이 프로그램을 구하게 되면

이 프로그램으로 대사장 프로그램을 대체해야할 정도로 막강한 프로그램 같습니다.

 

어쨋건 프로그램이 구해지면 대사장에서 EJ_Maker로 갈아타는 저의 강좌모습을 보실수 있을듯 합니다.. ^^;

댓글을 달아 주세요

  1. 바베큐 2007.09.30 18:50  address  modify / delete  reply

    이건 완전히 이해가 안가는;; 아 .. 휴 ;;

  2. Favicon of http://blog.naver.com/jhw0604 에플트리 2008.02.10 06:14  address  modify / delete  reply

    슬슬 번역하시는분에게 당근과 체찍들 들고갈일이 ㅎ

  3. 우와용 2008.09.18 20:22  address  modify / delete  reply

    오늘은 여기까지 ㅋ 설명 너무 잘해주시는데다가 센스까지 ㅋㅋ 저도 오늘 하얕게 불태우고 갑니다