ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • s60dict용 네이버 일어사전을 만들어보자
    잡동사니 2010. 7. 14. 08:54

    익뮤에서 s60dict를 사용하다 돌아다니는 일본어사전에 실망하고 다른 방법을 찾아 보았습니다.

    네이버 일한, 한일, 외래어 사전을 만들 수 있으며 제작시 여러 블로그를 참고했습니다.

    우선, 좋은 정보 주신 두 블로그 주인장 분들께 감사를 표합니다. :)



    우선 아래의 블로그를 보고 따라합시다.

    http://8izips.blogspot.com/2010/05/istardict.html

    단, 위의 블로그 포스팅에서 clipping tool을 이용해 사전 데이터를 긁어 txt파일로 만드는 부분까지만 진행해야 합니다.

    우린 아이폰이 아니니까요 ^^;

    지루한 데이터 모으는 작업이 끝났으면 아래 파일을 다운받아 주세요.


    우리가 긁은 데이터에는 아래와 같이 html정보들이 포함되어 있는데, 아쉽게도 s60dict는 이를 지원하지 않습니다.

    사용자 삽입 이미지


    그래서 모두 지워줘야 좋은 화면을 볼 수 있습니다.

    워드같은 프로그램으로 찾아 바꾸기는 해 보았는데 파일 용량이 커 열기도 힘들고, 바꾸기도 오래 걸리더군요.

    그래서 간단한 변환 프로그램을 만들었습니다.

    ( 주의  - 아주 간단하게 만든 프로그램이라 에러가 생길 수 있습니다.
    아래에서 설명하는 절차에 맞게 프로그램을 사용해주시기 바라며, 혹 에러 발생시 제보 바랍니다.
    어떤 태그를 삭제하고 어떤 태그를 무엇으로 변환하는가는 글 맨 아래에 써놓았습니다.)

    사용법은 아주 간단합니다.

    우선 프로그램을 실행하면 이런 창이 뜹니다.
    (단, 닷넷 프레임워크가 깔려 있어야 합니다)

    사용자 삽입 이미지

    가운데 보이시는 파일 불러오기 & 수정 버튼을 누르고 우리가 모은 데이터 텍스트 파일을 열어주면 끝입니다.

    자동으로 변환되어서 그 파일에 저장됩니다.

    단, 변환 전의 텍스트 파일이 반드시 UTF-8형태로 저장되어있어야 합니다.

    만약 그렇지 않다면 꼬이거나 에러가 나게 되니 주의해주시기 바랍니다.

    변환을 성공적으로 마치셨다면 아래와 같이 바뀌었을 것입니다.

    사용자 삽입 이미지


    최소, 변환된 한일, 일한, 외래어의 변환된 3개 파일이 있어야 합니다.

    만약 분할해 다운받으셨다면 더 많은 파일이 있을 테구요.

    모든 파일에 대해 변환을 해 주시고, 나눠진 텍스트 파일을 하나의 텍스트파일로 뭉쳐줍시다.

    물론 이 뭉친 텍스트 파일도 UTF-8로 저장되어 있어야 합니다.

    (* 제가 만든 파일은 전체를 뭉친 텍스트 파일이 47,462,861 바이트이니 참고하시기 바랍니다. )



    이제 아래의 블로그를 참고합시다.

    http://eu81273.tistory.com/181


    이 블로그에서는

    "아이팟 터치, 아이폰용 사전 파일을 직접 제작해 보자!"

    라는 주제로 포스팅 연재를 했었습니다.

    위 링크는 그 중 첫번재 포스팅이며, 네번째 포스팅인

    "사전 파일 컴파일/디컴파일 하는 방법"

    까지 읽어주셔야 합니다.

    그러면 우리가 만들어야 할 파일 형식인

    dict, idx, ifo 파일이 어떻게 이루어져있는지에 대해 대충 감이 오실겁니다.



    이제 우리가 만들었던 데이터 파일을 사전으로 컴파일해줍니다.

    성공적으로 완료되었다면

    텍스트파일이름.dict
    텍스트파일이름.idx
    텍스트파일이름.ifo

    이라는 파일 3개가 만들어졌을겁니다.

    이제 dict파일 뒤에 .dz를 입력해 확장명을 dz로 바꿔줍시다.
    (최종적으로 파일이름.dict.dz 가 되어야 합니다.)

    파일을 모두 만들었으니 이제 적용하는 일만 남았습니다.

    이렇게 만들어진 파일 3개를

    외장메모리\s60dict

    폴더 안에 넣어줍시다.

    그리고 usb연결 해제 후 s60dict를 켜면 사전 선택 부분에 우리가 만든 사전이 추가되어있는걸 확인하실 수 있습니다.

    아래는 제 익뮤에서 실제로 돌아가는 스크린샷입니다.

    사용자 삽입 이미지
    사용자 삽입 이미지


    단어 수도 많고 내용도 좋고 아주 잘 돌아갑니다.

    그런데 s60dict의 특성 상 동음이의어가 6개까지밖에 표시가 안되는게 단점입니다.

    이를 어떻게 해결할지 생각해 보고 있으나 마땅히 이거다! 하고 떠오르는게 없네요.

    좋은 의견 있으면 남겨주시면 감사하겠습니다.






    ps. html 수정 패턴
    1. <STYLE>SUP{COLOR:#FF6699;}</STYLE>, <EM>, </EM>, <strong>, </strong>의 경우 삭제함
    2. <sup>는 ( 로, </sup> 는 )로 수정함
    3. <br>은 \n 으로 수정함
    이 외에는 태그가 보이지 않아 따로 건드린건 없습니다.
Designed by Tistory.