레슨 3: PDF 문서 편집 기본

이 레슨에서는 PDF 문서를 편집하는 기본적인 방법을 알아봅니다.

 

PDF 번역의 핵심은 CAT tool로 번역 불가능한 문서를 일종의 전처리 작업으로 손(?)을 좀 봐준 다음 번역하는 것입니다. 이 코스에서는 Acrobat이 그 전처리 도구가 되겠지요. Acrobat DC 이전 버전에서는 고급 도구 메뉴의 TouchUp 텍스트 도구라는 것을 사용하여 PDF 문서를 편집하곤 했습니다. TouchUp 텍스트 도구는 문서 내용 일부분을 지정하여 그 문장에 사용된 글꼴, 글자 크기, 색상, 글자 간격 등 필요한 정보를 파악해서 내용을 수정할 수 있게 돕는 도구였는데요, 이 도구가 제 역할을 못할 때가 많아서 실제 번역 작업에 사용하기에는 애로 사항이 참 많았습니다. 사용 방법도 수월찮고, 무엇보다 수정이 잘 되지 않는 경우가 많았거든요. 그래서 ‘아, 되는 건 되지만 안 되는 건 안 되는구나’ 정도로 이해하는 것이 마음에 이로운 그런 도구였습니다. 지금 다루는 Acrobat DC에도 훌륭한 편집 기능이 있지만 본래 아래아한글이나 Word와는 태생이 다른 탓에 일반 워드프로세서 다루듯이 마음대로 편집하면서 번역할 수는 없습니다. 애당초 간단한 구조로 된 문서였다면 별다른 편집 필요 없이 CAT tool에 바로 집어넣어서 번역하면되지요. 지금 이렇게 PDF 문서 자체를 편집하는 방법을 공부하는 이유는 번역가로서 여러분이 접하게 될 PDF 문서는 CAT tool에 바로 집어 넣을 수 없고 편집하기도 어려운 문서들 때문입니다. 나중에 텍스트 상자를 활용하는 것도 그 때문이고요. 다행히 Acrobat 버전이 올라가면서 편집 기능 성능이 상당히 좋아졌고 사용하기도 훨씬 편리해졌습니다.

그럼 우선 파일을 하나 열어볼까요? 실습 파일은 여기 있습니다. 다운로드는 위에 오른쪽 끝에서 찾으실 수 있습니다.

 

Picture35

위 문서는 그림, 목록, 하이퍼링크가 적당히 들어 있는, 흔히 볼 수 있는 PDF 문서입니다. 올바르게 작성된 PDF 문서를 편집하는 건 아주 간단합니다. 오른쪽에 있는 “PDF 편집”을 클릭하기만 하면 됩니다. ▼

Picture36

PDF 편집 버튼을 클릭하면 이렇게 각 문서 내용에 사각형 틀이 생깁니다. 역시나 Adobe에서 만든 문서여서 그런지 아주 잘 되는군요. 일반적인 PDF 문서는 이 상태에서 바로 내용을 수정할 수 있습니다. 제목이든 문단이든 글꼴이나 서식에 신경을 쓰지 않아도 돼서 아주 편리하지요. 시험 삼아 소제목 하나를 번역해 보겠습니다. 내용을 번역한 다음 “X” 버튼을 눌러 편집하기를 끝내면 됩니다. 영상 보고 따라하기를 보고 참고하셔도 좋습니다. ▼

Picture37

이번에는 스캔한 문서를 한번 편집해 보겠습니다(실습 파일). PDF를 편집하고 변환하는 것이 Acrobat의 가장 주된 기능이지만, Acrobat으로도 OCR을 할 수 있거든요. 이 과정에서는 기술적으로 중간에 OCR 단계를 거칩니다. 여러분이 직접 하실 건 없고 잠시 기다리시면 Acrobat에서 알아서 합니다. 앞서 말씀드린 대로 한국어도 지원하긴 합니다만 인식률에서는 크게 기대를 하지 않으시는 편이 좋습니다. 그래도 영어는 정확도가 뛰어나므로 텍스트가 뚜렷하게 잘 스캔된 영문 PDF 문서를 편집할 때 매우 유용합니다.

이 문서는 보시다시피 텍스트를 마우스로 긁어 선택할 수 없는, 스캔한 문서입니다. 심지어 목 아프게 옆으로 누워 있기까지 하지요. 책을 펼쳐서 사진으로 찍은 것에 불과하므로 안에 텍스트 정보랄 것이 전혀 없습니다. 예전에는 이런 문서를 편집하려면 여기서부터 할 일이 제법 많았습니다. 문서를 적당히 잘라(cropping이라고 함) 인식하기 쉽게 수정하고, OCR을 거친 다음, 인식된 텍스트를 다시 워드 프로세서에 붙여넣는 등 복잡한 과정을 거쳐야 했습니다. 그런데 Acrobat도 버전이 올라가면서 OCR 성능이 무척 좋아졌고, 이런 과정이 아주 간소하게 바뀌었습니다. 아마 Acrobat을 오래 써오신 분이라면 이 기능이 Acrobat DC에서 가장 놀라운 기능이라고 생각하실지도 모르겠습니다. 이번에도 간단합니다. 아까처럼 PDF 편집 버튼만 눌러주시면 됩니다. 내용을 하나하나 직접 OCR했던 이전 버전과는 달리 전 과정이 자동이어서 아주 편합니다. ▼

Picture38

잠시 기다리시면 Acrobat에서 마치 마법처럼 텍스트, 글꼴을 인식해서 편집 가능한 상태로 만들어줍니다. 짜잔! 심지어 텍스트를 다른 곳에 복사하지 않고 문서 안의 모든 요소를 이 화면에서 수정하고 삭제하거나 변경할 수 있습니다. 거기다 글꼴도 원래 문서와 유사하게 그대로 사용할 수 있습니다. 일단 화면에 나타난 저 옵션부터 한 번 살펴볼까요? 설정을 눌러주십시오. ▼

Picture39

화면 중앙에 스캔한 문서 편집 설정이라는 옵션이 나타납니다. ▼

Picture40

지금은 영어 문서를 영어(US)로 잘 인식한 상태입니다만, 가끔 한국어를 영어로 인식하는 등 Acrobat에서 언어를 헷갈리는 경우도 있습니다. 이럴 때 다음으로 텍스트 인식 드롭다운 메뉴를 눌러 언어를 바르게 선택해 주시면 됩니다. ▼

Picture41

그리고 위의 사용 가능한 시스템 글꼴 사용 확인란을 선택하면 컴퓨터에 설치된 글꼴 중에서 스캔한 원래 문서의 글꼴과 가장 유사한 글꼴로 문서를 OCR해 줍니다. 문서를 완전히 디지털화해서 나중에 편집할 때 유용한 옵션입니다. ▼

Picture42

모든 페이지를 편집 가능하도록 설정 확인란을 선택하면 말 그대로 문서의 텍스트를 모두 편집할 수 있게 OCR합니다. (지금 이 문서는 한 페이지짜리라서 의미가 없긴 합니다.) 한 번 할 때 OCR을 다 하면 좋은 거 아니냐고요? 그렇긴 합니다만, 문서 전체를 몽땅 OCR하려면 시간이 제법 오래 걸립니다. 따라서 필요한 페이지만 OCR하는 것도 방법입니다. ▼

Picture43

이번 레슨에서는 몸풀기로 Acrobat에서 문서를 편집하는 기초적인 방법을 살펴보았습니다. 보기에는 아주 쉽고 별것 아닌 것 같지만, 이전 Acrobat에서 서식을 힘들게 맞추느라 진땀 꽤나 흘렸던 분들에게는 깜짝 놀랄 만한 기능입니다. 그전까지 이렇게 쉽게 PDF 문서를 편집하는 방법이 없었거든요. PDF 문법을 잘 지켜 네모 반듯하게 작성한 문서는 위와 같이 내용 편집 버튼만 누르면 만사 OK이고, 스캔한 문서도 어지간히 양식이 꼬여 있지 않는 한 이미지까지도 쉽게 편집할 수 있습니다.

그러나 슬프게도 번역가는 종종 아주 골치 아픈 문서를 종종 대하게 됩니다. 그럴 때 쓰라고 “텍스트 상자”라는 게 있습니다. 텍스트 상자에 대해서는 주석 레슨에서 자세히 살펴보겠습니다. 준비 운동은 이 정도로 해 두고, 다음 레슨에서는 텍스트 상자를 공부해 보도록 하겠습니다.

이번 레슨은 이상으로 마치겠습니다. 수고하셨습니다!

0 Comments

댓글을 남겨주세요

This site uses Akismet to reduce spam. Learn how your comment data is processed.

error: Content is protected !!