PDF 문서 번역 시리즈 1/7: PDF 개요

들어가는 글

번역가는 기본적으로 텍스트, 즉 문서와 씨름하는 사람입니다. 기술 발전 덕분에 거의 모든 것이 디지털화된 요즈음, 번역가가 다루던 종이 문서 역시 문서 파일이라는 형식으로 탈바꿈하였습니다. 물론 문서 파일에도 종류가 여럿 있지만, 이전의 데스크톱 문서 작업 환경이 Word, HWP 등 컴퓨터에서 읽고 쓰는 문서 위주였다면 모바일 시대가 된 지금은 PDF 문서를 사용하는 빈도가 크게 늘어났습니다. 전자 문서의 실질적 표준이 된 PDF 문서를 능숙하게 다룰 줄 아는 것은 현시대를 살아가는 번역가가 반드시 익혀야 할 소양이라고 해도 지나친 말이 아닐 것입니다. 그러나 PDF 파일이 이렇게 중요한데도 대부분의 번역가들은 PDF 문서를 단순히 Reader로 읽거나 CAT tool로 번역하는 정도에 그치는 경우가 많습니다. 편집 프로그램을 사용하여 직접 수정할 줄 아는 번역가는 의외로 드뭅니다. 그나마 그렇게라도 할 수 있는 PDF 파일은 괜찮습니다만, PDF 파일에 그런 문서만 있는 것도 아니지요. 가끔 고객이 고약한(?) PDF 문서를 보내와서 고생한 경험, 한 번쯤 있으실 것입니다. CAT tool에서 제대로 인식도 되지 않고, 수정도 어려운 PDF 문서들은 대체 어떻게 번역해야 하는 걸까요? 그런 경우에는 그냥 종이에 인쇄된 것이려니 하고 무지막지하게 눈으로 보며 번역해야 하는 것일까요?

 

photo-1457524461416-8796b6d23efb_resize

 

본 시리즈에서는 번역가가 PDF 문서를 번역할 때 알아두어야 할 배경 지식을 숙지하고, PDF 번역 흐름을 파악하여 자신의 작업에서 필요한 내용을 찾아 습득한 다음, 배운 내용을 실제 PDF 문서 번역에 적용할 수 있도록 하는 데 초점을 두었습니다. 그렇다고 본 시리즈에서 PDF의 모든 것을 A부터 Z까지 망라하지는 않습니다. 번역가는 번역에 필요한 기술만 쏙쏙 골라서 익혀 활용하면 되니까요. 여러분이 처음 접하는 PDF 문서와 맞닥뜨렸을 때 번역 그 자체에만 집중하실 수 있도록 길잡이가 되어드리는 것이 이 시리즈의 목표입니다.

 

 

이 시리즈를 통해 성취할 수 있는 것들

– PDF 문서를 제대로 편집하고 변환하는 방법을 알게 됩니다.

– 스캔한 문서를 OCR할 수 있습니다.

– 주석 기능을 통해 다른 번역가/편집자와 협업할 수 있습니다.

– PDF 문서를 종이에 출력하지 않고도 서명하여 인보이스나 계약서를 작성할 수 있습니다.

– 반복 작업을 최소화하여 번역 생산성을 높힐 수 있습니다.

– 고객이 어떠한 PDF 문서를 보내오더라도 당황하지 않고 번역할 수 있습니다.

 

 

이 시리즈를 통해 혜택을 받을 수 있는 분들

– PDF 문서 번역의 기초를 다지고 싶으신 분들

– 고객이 CAT tool로 바로 번역할 수 없는 PDF 문서를 보내서 당황해 본 경험이 있으신 분들

– Reader를 사용하여 PDF 문서를 열람할 수 있지만 편집이나 수정 등 그 이외의 기능은 잘 모르는 분들

– CAT tool을 사용하여 PDF 문서를 번역해 본 경험은 있지만 Acrobat을 사용하여 문서를 번역해 본 적이 없으신 분들

– Acrobat의 최근 획기적인 기술 발달 내용을 모르고 옛날 경험만 가지고 계신 분들

– 그 밖에 Acrobat 사용법, OCR 작업, PDF 파일 관련 작업 요령을 배우고 싶으신 분들

 

 

시리즈 목차

본 시리즈는 다음과 같이 8개의 글로 발행할 예정입니다. 각 글에는 실습 파일과 함께 녹화된 영상을 보고 참고할 수 있도록 “영상 보고 따라하기”라는 링크가 있습니다. 스크린샷만으로 잘 이해가 되지 않는 내용이나 정확한 실행 순서를 영상으로 확인하고 싶으실 때 유용할 것입니다. (용량이 큰 GIF 파일이어서 가끔 컴퓨터나 인터넷 속도에 따라 영상이 멈칫할 수 있는데, 잠시 기다리시면 정상적으로 재생됩니다.)

 

  • 1: PDF 개요
  • 2: PDF 문서 변환
  • 3: PDF 문서 편집의 기본
  • 4: PDF 문서 주석 활용
  • 5: PDF 문서 단어 수 확인
  • 6: PDF 문서에 서명하고 양식 채우기
  • 7: 프로그램 다운로드 및 구입 정보
  • 8: PDF 문서를 번역할 때 도움이 되는 웹사이트

 

자, 그럼 본격적으로 시작해 볼까요?

 

 

번역가와 PDF

내 컴퓨터가 아닌 다른 컴퓨터에서 Microsoft Word나 PowerPoint 등을 사용할 때 필요한 글꼴이 없거나 문서 서식이 틀어져서 난감했던 경험, 한 번쯤 있으시지요? 한국인 철수가 Word로 한국어 문서를 작성하여 그 문서를 미국인 크리스에게 보낸다면 이런 문제가 발생할 가능성이 높습니다. 아마도 크리스의 컴퓨터에는 궁서체, 맑은고딕체, 굴림체, 바탕체 같은 한국어 서체가 설치되어 있지 않을 테니까요. 이런 환경에서는 철수가 원래 의도한 대로 글꼴이 표시되지 않는 것은 물론이거니와 최악의 경우에는 글자가 깨져서 알아볼 수 없는 외계어 문서가 되어버릴 수도 있습니다. 특히 한국 기업이나 기관에서는 표를 많이 사용하기 때문에 전체 서식에 이런 문제가 생길 확률이 높습니다. 이 문서가 인쇄를 위해 정교하게 디자인한 문서라면 문제가 더욱 커지죠. 한 군데에서라도 레이아웃이 일단 틀어지면  문서 전체가 걷잡을 수 없이 망가지기 때문에 내용도 보기 전에 이미 불합격이 되고 말지요. 맨눈으로 보기에는 똑같아 보이는 글꼴이더라도 글자 간격이 미세하게 달라서 결국은 문서 전체를 흩뜨려버리거든요. 이처럼 문서 호환이라는 문제는 생각보다 해결하기 어려운 골치아픈 문제입니다. 그런데 이 문제는 컴퓨터로 문서를 번역하는 오늘날의 모든 번역가에게도 적용되는 문제입니다. 번역가는 번역할 텍스트 이외의 요소를 그대로 두는 것이 일반적인데, 위와 같이 문서 서식에 문제가 생기면 최종 번역 결과물의 품질에 큰 영향을 미칩니다. 그래서 번역 외적인 요인으로 끙끙 앓지 않으려면 반드시 문서 호환에 신경을 써야 합니다. 그것이 PDF가 탄생한 이유이고 또 번역에도 PDF 문서가 그토록 자주 등장하는 이유이며 우리가 PDF를 배워야 하는 이유입니다.

 

womanworkingcomputer

 

 

PDF의 개념과 탄생

PDF(Portable Document Format)는 소프트웨어, 하드웨어, 운영 체제에 관계 없이 문서를 안전하게 주고받는 데 사용하는 파일 형식입니다. PDF가 처음 고안된 건 90년대 초입니다. 이미지 편집 프로그램 Photoshop 제작사로 잘 알려진 Adobe사 설립자인 John Warnock이 종이 문서를 디지털로 변환하는 방법을 궁리하던 것이 PDF의 시초라고 합니다. 오늘날은 국제 표준화 기구에서 PDF를 개방형 표준으로 지정했고, 지금은 전 세계에서 가장 많이 쓰이는 전자 문서의 표준으로 발전하였습니다. PDF 파일의 주된 특징 중 하나는 작성자가 “처음 만든 그대로” 문서를 교환할 수 있다는 점과 일반적인 텍스트 이외에 그림, 글꼴까지 문서 속에 포괄할 수 있다는 점입니다. 거기다 암호화와 압축 기능도 뛰어나 문서 보안이 중요한 상황에 특히 유용합니다. PDF는 자체 보안 기능으로도 문서를 쉽게 암호화할 수 있거든요. 지금도 PDF 형식은 발전을 거듭하여 이제는 플래시와 같은 멀티미디어 요소까지 통합할 수 있게 되었습니다. 심지어 문서 안에 파일을 첨부할 수도 있습니다.

 

Picture1

 

 

PDF 문서의 종류

번역가가 실제 접하는 건 모두 확장자가 PDF로 끝나는 파일이지만, PDF도 용도에 따라 여러 종류로 분류할 수 있습니다. (간단하게 짚고 넘어가자면 교환을 목적으로 하는 PDF/X(예: 인쇄, 출판 분야), 장기 보관을 위한 PDF/A(예: 전자 도서관), 공학 문서를 다루는 PDF/E가 있고 이외에도 PDF/VT, PDF/UA, PDF/H, PDF/UA 등 가짓수가 많습니다. 복잡하지요?)

 

Picture2

 

그러나 저런 걸 너무 자세히 다 알려고 하실 필요 없습니다. 번역가가 PDF 문서를 구분할 때는 딱 두 가지만 구분하면 됩니다:

 

  • 텍스트를 마우스로 드래그할 수 있는 PDF (예: DOC 파일을 PDF로 변환한 파일)
  • 택스트를 마우스로 드래그할 수 없는 PDF (예: JPG 파일을 PDF로 변환한 파일).

 

DOC나 HWP처럼 진짜 문서 파일을 변환한 것이라면 변환 전 문서처럼 PDF도 텍스트에 관한 정보가 구조화되어 있어야 합니다. 그러나 가령 jpg 파일로 스캔한 문서는 실제 문서를 사진으로 찍어 그 이미지를 이어붙인 것에 불과합니다. 눈으로 보기에는 비슷해 보여도 처음부터 PDF로 제작한 문서와 종이를 스캔한 PDF 문서는 내부 구조가 아예 다른 것입니다.

 

지금 이 시점에서 여러분께서는 위와 같은 두 가지 PDF를 머리 속에서 확실히 구분해 두셔야 합니다. 그 이유는, 텍스트를 마우스로 드래그할 수 없는 PDF의 경우에 겉보기에는 문서지만 그 안에 텍스트 정보가 없기 때문에 텍스트를 다루는 번역가에게는 매우 중요한 문제이기 때문입니다. OCR이라는 번거로운 작업을 거쳐야 하고, 그래서 결국 번역에 소요되는 시간이 늘어나니까요. 이런 점을 고려하지 않으면 실제 번역을 시작하기도 전에 준비 작업을 하느라고 진이 다 빠져버릴 수도 있습니다.

 

 

PDF 문서를 번역할 때 필요한 소프트웨어

Acrobat을 사용하십시오. PDF 문서를 다룰 수 있는 프로그램은 Acrobat 이외에도 많이 있습니다. Foxit, Sumatra 등 다른 프로그램으로도 PDF를 읽을 수 있는 것처럼 편집도 마찬가지입니다. 기본적으로는 Office로도 PDF를 편집할 수 있고요. 이외에도 타사 소프트웨어가 수두룩합니다. 그런데도 왜 굳이 Acrobat을 사용하느냐 하면, 번역가의 정신 건강을 위해서입니다. 번역가는 다른 사람에게 파일을 전달할 때 반드시 호환성을 유념해야 합니다. 그런데 영어권이 아닌 언어 사용자를 고려하지 않고 개발한 대부분의 영어권 프로그램은 한국어를 사용했을 때 문제가 생기는 일이 잦습니다. 그런 얘기를 하자면 밤을 새워도 모자라지요. 아무튼 일반 사용자는 별 불편하지 않아도 번역가 입장에서는 화가 나는 상황이 많을 수 있습니다. 별다른 이유가 없다면, 그리고 여러분께서 자타가 공인하는 PDF 전문가가 아니라면, 그냥 Acrobat을 사용하십시오.

 

 

Acrobat

Acrobat, 많이 들어보셨지요? Acrobat은 Adobe사에서 판매하는 PDF 제작 솔루션입니다. 아래아한글로 HWP 문서를 작성하듯, Acrobat을 사용하여 PDF 문서를 만들 수 있습니다. Adobe에서는 PDF 문서를 읽을 수 있는 Adobe Acrobat Reader는 무료로 제공하지만, PDF를 제작하는 데 사용하는 Acrobat은 유료로 판매하고 있습니다. Acrobat의 특징을 몇 가지 꼽아보면 다음과 같습니다.

 

  • 거의 모든 문서를 PDF 형식으로 변환 가능
  • PDF 문서 전문 인쇄 가능(PDF/X:글꼴과 이미지 포함)
  • PDF 형식(PDF/A)의 표준 소프트웨어로 호환성이 가장 좋음
  • 점차 멀티미디어적 요소가 추가되고 있음(음악, 동영상 등)
  • 강력한 보안 기능
  • 문서 관리 용이

 

Picture3

 

이 코스에서는 Adobe Acrobat DC 버전을 기준으로 합니다. 현재 Adobe Acrobat의 최신 버전은 2015년 4월 출시된 Acrobat DC로 Windows 10/8.1/8/7을 지원합니다. 물론 이전 버전의 Acrobat을 사용하셔도 되긴 합니다. 대부분의 주요 기능은 별 차이가 없습니다.

 

다만 PDF 문서의 특성상 보안 업데이트는 꼭 신경써 주셔야 합니다. 지금은 많이 나아졌지만, 예전부터 PDF 파일은 바이러스나 악성 코드를 유포하는 통로로 널리 이용되어 왔습니다. 따라서 PDF 문서를 통한 악성코드 감염을 예방하려면 PDF 소프트웨어를 항상 최신 상태로 유지하고 출처가 불분명한 메일에 첨부된 PDF 파일을 함부로 열지 마십시오.

 

구 버전인 Adobe Reader X는 2015년 11월 18일, Acrobat X Standard/Pro는 2015년 11월 15일, Acrobat X Suite는 2015년 11월 23일에 5년간의 지원이 종료되었습니다(Acrobat XI는 아직 지원 중이므로 사용하셔도 됩니다). 지원 종료일이 지난 소프트웨어는 보안 업데이트가 제공되지 않기 때문에 그대로 사용하시면 위험할 수 있습니다. 요즘 유행하는 랜섬웨어 이야기, 한 번쯤 들어보셨지요? 제가 랜섬웨어에 감염된 컴퓨터를 봤는데요, 어휴… 끔찍했습니다. 컴퓨터의 문서 파일이 모조리 음악 파일로 바뀌는 기적(?)이 일어나더군요. 아무튼 문서를 많이 다루는 번역가 여러분께서는 특히 조심에 조심을 거듭하셔야 합니다. 이 기회에 편집 – 기본 설정 – 업데이터에서 아래 화면처럼 설정되어 있는지 업데이트 자동 설치 옵션을 확인해 보십시오. ▼

 

Picture4

 

여담이지만 가장 강력하고 완성도가 뛰어났던 버전은 옛날에 출시된 Acrobat 9인 것 같습니다. 이후에 나온 버전들은 기존에 있던 기능을 그냥 여기저기 펼쳐놓은 데 그쳤다는 인상을 주더군요. X 버전이 최악이었고요. DC는 기능 면에서 많이 나아졌습니다만, 그래도 뭔가 입맛대로 세세하게 편집하기에는 부족한 면이 없지 않습니다.

 

PDF 개요는 이것으로 마치겠습니다. 그럼 다음 글에서 또 인사드리겠습니다.

2 Comments

  1. James Kim 2016-09-15 Reply

    번역하는 사람들 뿐만 아니라 문서를 다루는 모든 이들에게 필수적인 정보, 감사드립니다.

    앞으로도 유용한 정보 계속 부탁드리겠습니다. 행복한 한가위 보내시길 !^^

    • Author
      Hobin Kim 2016-09-15 Reply

      감사합니다, 저야말로 잘 부탁드립니다. 즐거운 연휴 보내십시오. ^^

댓글을 남겨주세요

This site uses Akismet to reduce spam. Learn how your comment data is processed.

error: Content is protected !!