Posted on 4 Comments

레슨 1: PDF 개요

번역가와 PDF

내 컴퓨터가 아닌 다른 컴퓨터에서 Microsoft Word나 PowerPoint 등을 사용할 때 필요한 글꼴이 없거나 문서 서식이 틀어져서 난감했던 경험, 한 번쯤 있으시지요? 한국인 철수가 Word로 한국어 문서를 작성하여 그 문서를 미국인 크리스에게 보낸다면 이런 문제가 발생할 가능성이 높습니다. 아마도 크리스의 컴퓨터에는 궁서체, 맑은고딕체, 굴림체, 바탕체 같은 한국어 서체가 설치되어 있지 않을 테니까요. 이런 환경에서는 철수가 원래 의도한 대로 글꼴이 표시되지 않는 것은 물론이거니와 최악의 경우에는 글자가 깨져서 알아볼 수 없는 외계어 문서가 되어버릴 수도 있습니다. 특히 한국 기업이나 기관에서는 표를 많이 사용하기 때문에 전체 서식에 이런 문제가 생길 확률이 높습니다. 이 문서가 인쇄를 위해 정교하게 디자인한 문서라면 문제가 더욱 커지죠. 한 군데에서라도 레이아웃이 일단 틀어지면 문서 전체가 걷잡을 수 없이 망가지기 때문에 내용도 보기 전에 이미 불합격이 되고 말지요. 맨눈으로 보기에는 똑같아 보이는 글꼴이더라도 글자 간격이 미세하게 달라서 결국은 문서 전체를 흩뜨려버리거든요. 이처럼 문서 호환이라는 문제는 생각보다 해결하기 어려운 골치아픈 문제입니다. 그런데 이 문제는 컴퓨터로 문서를 번역하는 오늘날의 모든 번역가에게도 적용되는 문제입니다. 번역가는 번역할 텍스트 이외의 요소를 그대로 두는 것이 일반적인데, 위와 같이 문서 서식에 문제가 생기면 최종 번역 결과물의 품질에 큰영향을 미칩니다. 그래서 번역 외적인 요인으로 끙끙 앓지 않으려면 반드시 문서 호환에 신경을 써야 합니다. 그것이 PDF가 탄생한 이유이고 또 번역에도 PDF 문서가 그토록 자주 등장하는 이유이며 우리가 PDF를 배워야 하는 이유입니다.

womanworkingcomputer

PDF의 개념과 탄생

PDF(Portable Document Format)는 소프트웨어, 하드웨어, 운영 체제에 관계 없이 문서를 안전하게 주고받는 데 사용하는 파일 형식입니다. PDF가 처음 고안된 건 90년대 초라고 합니다. 이미지 편집 프로그램 Photoshop 제작사로 잘 알려진 Adobe사 설립자인 John Warnock이 종이 문서를 디지털로 변환하는 방법을 궁리하던 것이 PDF의 시초라고 합니다. 오늘날은 국제 표준화 기구에서 PDF를 개방형 표준으로 지정했고, 지금은 전 세계에서 가장 많이 쓰이는 전자 문서의 표준으로 발전하였습니다. PDF 파일의 주된 특징 중 하나는 작성자가 “처음 만든 그대로” 문서를 교환할 수 있다는 점과 일반적인 텍스트 이외에 그림, 글꼴까지 문서 속에 포괄할 수 있다는 점입니다. 거기다 암호화와 압축 기능도 뛰어나 문서 보안이 중요한 상황에 특히 유용합니다. PDF는 자체 보안 기능으로도 문서를 쉽게 암호화할 수 있거든요. 지금도 PDF 형식은 발전을 거듭하여 이제는 플래시와 같은 멀티미디어 요소까지 통합할 수 있게 되었습니다. 심지어 문서 안에 파일을 첨부할 수도 있습니다.

Picture1

PDF 문서의 종류

번역가가 실제 접하는 건 모두 확장자가 PDF로 끝나는 파일이지만, PDF도 용도에 따라 여러 종류로 분류할 수 있습니다. (간단하게 짚고 넘어가자면 교환을 목적으로 하는 PDF/X(예: 인쇄, 출판 분야), 장기 보관을 위한 PDF/A(예: 전자 도서관), 공학 문서를 다루는 PDF/E가 있고 이외에도 PDF/VT, PDF/UA, PDF/H, PDF/UA 등 가짓수가 많습니다. 복잡하지요?)

Picture2

그러나 너무 저런 것 너무 자세히 알려고 하실 필요 없습니다. 번역가가 PDF 문서를 구분할 때는 딱 두 가지만 구분하면 됩니다:

  • 텍스트를 마우스로 드래그할 수 있는 PDF (예: DOC 파일을 PDF로 변환한 파일)
  • 택스트를 마우스로 드래그할 수 없는 PDF (예: JPG 파일을 PDF로 변환한 파일).

DOC나 HWP처럼 진짜 문서 파일을 변환한 것이라면 변환전 문서처럼 PDF도 텍스트에 관한 정보가 구조화되어 있어야 합니다. 그러나 가령 jpg 파일로 스캔한 문서는 실제 문서를 사진으로 찍어 그 이미지를 이어붙인 것에 불과합니다. 눈으로 보기에는 비슷해 보여도 처음부터 PDF로 제작한 문서와 종이를 스캔한 PDF 문서는 내부 구조가 아예 다른 것입니다.

지금 이 시점에서 여러분께서는 위와 같은 두가지 PDF를 머리 속에서 확실히 구분해 두셔야 합니다. 그 이유는, 텍스트를 마우스로 드래그할 수 없는 PDF의 경우에 겉보기에는 문서지만 그 안에 텍스트 정보가 없기 때문에 텍스트를 다루는 번역가에게는 매우 중요한 문제이기 때문입니다. OCR이라는 번거로운 작업을 거쳐야 하고, 그래서 결국 번역에 소요되는 시간이 늘어나니까요. 이런 점을 고려하지 않으면 실제 번역을 시작하기도 전에 준비 작업을 하느라고 진이 다 빠져버릴 수도 있습니다.

PDF 문서를 번역할 때 필요한 소프트웨어

Acrobat을 사용하십시오. PDF 문서를 다룰 수 있는 프로그램은 Acrobat 이외에도 많이 있습니다. (Foxit, Sumatra 등 다른 프로그램으로도 PDF를 읽을 수 있는 것처럼 편집도 마찬가지입니다. 기본적으로는 Office로도 PDF를 편집할 수 있고요. 이외에도 타사 소프트웨어가 수두룩 합니다.) 그런데도 왜 굳이 Acrobat을 사용하느냐 하면, 번역가의 정신 건강을 위해서입니다. 번역가는 다른 사람에게 파일을 전달할 때 반드시 호환성을 유념해야 합니다. 그런데 영어권이 아닌 언어 사용자를 고려하지 않고 개발한 대부분의 영어권 프로그램은 한국어를 사용했을 때 문제가 생기는 일이 잦습니다. 그런 얘기를 하자면 밤을 새워도 모자라지요. 아무튼 일반 사용자는 별 불편하지 않아도 번역가 입장에서는 화가 나는 상황이 많을 수 있습니다. 별다른 이유가 없다면, 그리고 여러분께서 자타가 공인하는 PDF 전문가가 아니라면, 그냥 Acrobat을 사용하십시오.

Acrobat

Acrobat, 많이 들어보셨지요? Acrobat은 Adobe사에서 판매하는 PDF 제작 솔루션입니다. 아래아한글로 HWP 문서를 작성하듯, Acrobat을 사용하여 PDF 문서를 만들 수 있습니다. Adobe에서는 PDF 문서를 읽을 수 있는 Adobe Acrobat Reader는 무료로 제공하지만, PDF를 제작하는 데 사용하는 Acrobat은 유료로 판매하고 있습니다. Acrobat의 특징을 몇 가지 꼽아보면 다음과 같습니다.

  • 거의 모든 문서를 PDF 형식으로 변환 가능
  • PDF 문서 전문 인쇄 가능(PDF/X:글꼴과 이미지 포함)
  • PDF 형식(PDF/A)의 표준 소프트웨어로 호환성이 가장 좋음
  • 점차 멀티미디어적 요소가 추가되고 있음(음악, 동영상 등)
  • 강력한 보안 기능
  • 문서 관리 용이

Picture3

이 코스에서는 Adobe Acrobat DC 버전을 기준으로 합니다. 글을 작성하는 시점에서 Adobe Acrobat의 최신 버전은 Acrobat DC로 Windows 10/8.1/8/7을 지원합니다. 물론 이전 버전의 Acrobat을 사용하셔도 되긴 합니다. 대부분의 주요 기능은 별 차이가 없습니다.

다만 PDF 문서의 특성상 보안 업데이트는 꼭 신경써 주셔야 합니다. 지금은 많이 나아졌지만, 예전부터 PDF 파일은 바이러스나 악성 코드를 유포하는 통로로 널리 이용되어 왔습니다. 따라서 PDF 문서를 통한 악성코드 감염을 예방하려면 PDF 소프트웨어를 항상 최신 상태로 유지하고 출처가 불분명한 메일에 첨부된 PDF 파일을 함부로 열지 마십시오.

구 버전인 Adobe Reader X는 2015년 11월 18일, Acrobat X Standard/Pro는 2015년 11월 15일, Acrobat X Suite는 2015년 11월 23일에 5년간의 지원이 종료되었습니다(Acrobat XI는 아직 지원 중이므로 사용하셔도 됩니다). 지원 종료일이 지난 소프트웨어는 보안 업데이트가 제공되지 않기 때문에 그대로 사용하시면 위험할 수 있습니다. 요즘 유행하는 랜섬웨어 이야기, 한 번쯤 들어보셨지요? 제가 랜섬웨어에 감염된 컴퓨터를 봤는데요, 어휴… 끔찍했습니다. 컴퓨터의 문서 파일이 모조리 음악 파일로 바뀌는 기적(?)이 일어나더군요. 아무튼 문서를 많이 다루는 번역가 여러분께서는 특히 조심에 조심을 거듭하셔야 합니다. 이 기회에 편집 – 기본 설정 – 업데이터에서 아래 화면처럼 설정되어 있는지 업데이트 자동 설치 옵션을 확인해 보십시오. ▼Picture4

여담이지만 가장 강력하고 완성도가 뛰어났던 버전은 옛날에 출시된 Acrobat 9인 것 같습니다. 이후에 나온 버전들은 기존에 있던 기능을 그냥 여기저기 펼쳐놓은 데 그쳤다는 인상을 주더군요. X 버전이 최악이었고요. DC는 기능 면에서 많이 나아졌습니다만, 그래도 뭔가 입맛대로 세세하게 편집하기에는 부족한 면이 없지 않습니다.

PDF 개요는 이것으로 마치겠습니다. 수고하셨습니다!

4 thoughts on “레슨 1: PDF 개요

  1. 번역하는 사람들 뿐만 아니라 문서를 다루는 모든 이들에게 필수적인 정보, 감사드립니다.

    앞으로도 유용한 정보 계속 부탁드리겠습니다. 행복한 한가위 보내시길 !^^

    1. 감사합니다, 저야말로 잘 부탁드립니다. 즐거운 연휴 보내십시오. ^^

  2. 감사합니다. 제가 갑자기 pdf 파일 번역해야 되는 의뢰를 받아 몹시 당황했었어요. 글을 읽고 많이 도움이 되었습니다.

    1. 도움이 되어서 기쁩니다. 고맙습니다! ^^

댓글을 남겨주세요(댓글은 모든 사람이 볼 수 있습니다).