부록 2: PDF 문서를 번역할 때 도움이 되는 웹 사이트

SmallPDF

 

여기서는 PDF 파일을 다룰 때 유용한 사이트를 하나 소개해 드리려 합니다. 바로 “Smallpdf”라는 사이트인데요, 혹시 아시는 분이 계실지도 모르겠습니다. 주소는 https://smallpdf.com/ 입니다. https://smallpdf.com/kr 로 접속하시면 한국어로도 이용하실 수 있습니다. “대부분의 다른 PDF 소프트웨어가 사용하기 복잡하고 어렵기 때문에” 이런 사이트를 만들게 되었다고 하는데요, 사이트가 단순한 구조로 되어 있어서 아래 화면만 보셔도 어떤 기능을 사용할 수 있는지 다 파악하실 수 있습니다. 각종 Office 문서의 변환, 압축, 병합, 분할, 회전, 암호 설정 등 보통은 유료 소프트웨어에서 쓸 수 있는 기능들인데요, 사용 방법도 간단합니다. 너무 간단해서 딱히 설명 드릴 것이 없긴 합니다만, 여기서는 병합 기능을 한 번 사용해 보겠습니다.

Picture116

저는 한국어로 사이트 이용 언어를 바꾸었습니다. “PDF 합치기”를 클릭합니다. ▼

Picture117

화면이 바뀝니다. 이제 아래 보라색 네모 상자에 합칠 PDF 파일을 끌어서 넣으면 됩니다. 아니면 파일 선택을 눌러 직접 선택하실 수도 있고요. 오른쪽의 “드롭박스에서”, “구글 드라이브에서”를 클릭하면 Dropbox나 Google 드라이브에 올라와 있는 파일로 작업하실 수도 있습니다. 저는 레슨에서 이용했던 낱장 PDF 파일 세 개를 탐색기에서 끌어 넣겠습니다. ▼

Picture118

업로드한 파일이 나타납니다. 왼쪽 아래의 “PDF 파일 더 추가하기”를 클릭하여 파일을 더 추가할 수도 있습니다. 필요한 파일을 다 업로드하셨다면 “PDF 합치기” 버튼을 클릭합니다. ▼

Picture119

잠시 후 병합된 PDF 파일을 다운로드하실 수 있습니다. “지금 파일 다운로드”를 클릭하면 파일 하나로 합쳐진 “merged.pdf” 파일을 다운로드하실 수 있습니다. “다시 시작하기”를 누르면 PDF 합치기 작업을 처음부터 다시 하실 수 있고요. ▼

Picture120

물론 기본적인 PDF 관련 작업은 Acrobat에서도 처리할 수 있습니다. 그러나 외부에서 혹은 급할 때 Acorbat이 설치되어 있지 않은 컴퓨터에서 간단한 작업을 해야 할 때 쓸모가 있습합니다. 무엇보다 사용법이 무척 편리하기도 하고요. 광고가 있지만 그래도 덕지덕지 붙은 수준은 아닙니다. 단, PDF 파일을 서버에 업로드해서 작업하는 방식이니 민감한 정보가 있는 문서를 번역하실 때는 항상 신중하게 사용하시는 것이 좋습니다. “IP 주소 외에 다른 정보를 수집하지 않으며 서버에 업로드된 모든 파일이 작업 파일 한 시간 안에 영구히 삭제된다”고 하긴 하지만, 글쎄요. 모쪼록 PDF 파일을 다룰 때 유용하게 사용하시기를 바랍니다. 영상 보고 따라하기

 

※ 당황스럽게도 이 부록을 작성하고 난 후에 SmallPDF 사이트가 유료 정책을 내놓았습니다. 현재는 한 시간에 2회만 무료로 사용할 수 있게 되었다고 하는군요. 좀 아쉽지만 가끔 사용하는 정도로는 그래도 쓸만합니다. 이 사람들도 먹고 살아야 할 테니… ▼

Picture121

 

Retia OCR

 

이번에는 ABBYY 사의 OCR 엔진을 사용하여 무료로 OCR을 할 수 있는 사이트를 하나 소개해 드리려 합니다. 잠깐 짚고 넘어가자면, 앞서 언급한 것처럼 요즘 많은 문서 관련 프로그램에 OCR 기능이 있지만 한국어 인식은 만족스럽지 못한 것이 사실입니다. 러시아의 ABBYY사(Lingvo라는 전자 사전으로도 유명한 회사지요.)의 제품 중 FineReader라고 한국어 OCR에서는 독보적인 인식률을 자랑하는 프로그램이 있는데, 아니나다를까 가격이 무척 비쌉니다.

Picture122

그리고 같은 회사에서 만든 PDF Transformer+ 라는 제품이 있습니다. 이 녀석은 레이아웃을 편집할 수 없는 대신 가격이 1/3 정도로 저렴합니다. (참고로 한국 총판에서는 FineReader를 295,900원에, Transformer+는 121,000원에 판매하고 있습니다.) “내가 다루는 PDF 문서는 스캔이 잘 되어 있고 표가 그림이 많지 않다, 저렴하고 한국어가 잘 인식되기만 하면 된다.”라고 생각하는 번역가라면 PDF Transformer+도 한번 고려해볼 만 합니다. FineReader와 같은 OCR 엔진을 사용하기 때문에 한국어 인식 성능은 같습니다. 즉, FineReader가 문자 인식과 문서 변환에 초점을 맞춘 프로그램이라면, PDF Transformer+는 Acrobat과 유사하게 PDF 편집에 중점을 둔 프로그램입니다(주석 기능은 오히려 Acrobat보다 좋습니다). 여기에 더하여 간단한 문서 OCR이 가능한 것이고요. 물론 FineReader처럼 파일 변환이 주 기능이 아니기 때문에 전문적인 옵션은 없지만, 프로그램 구조가 단순하고 스캔 상태가 깨끗한 문서라면 아주 잘 인식됩니다. 인터페이스와 속도, 안정성도 나무랄 데 없고 한국어 메뉴도 지원하고요. 내가 OCR하려는 문서가 어느 정도 인식 가능한지 궁금하신 분은 FineReader, Transformer+ 모두 평가판이 있으므로 구입 전에 확인해보실 수 있습니다. ▼

Picture123

“나는 OCR 기능을 가뭄에 콩나듯 정말 가끔 사용한다. 이럴 때 쉽게 OCR 할 수 있는 방법은 없는가?”

네, 방법이 있습니다. 자주 사용하면 모르겠으나 가끔 하는 OCR 작업 때문에 위 제품을 구입하기는 좀 부담스럽지요. 이럴 땐 여기로 가 보시면 온라인으로 OCR을 할 수 있습니다.

ABBYY사 제품의 한국 총판에서 제공하는 서비스입니다. 아래 안내와 같이 PDF 문서 파일과 JPG, PNG, BMP, TIF 그림 파일을 지원하므로 스캔한 PDF 문서를 업로드하셔도 되고 직접 스마트폰으로 찍은 사진 파일을 업로드하셔도 됩니다. 여기도 먹고 살아야 하니 무한정 OCR을 할 수는 없고 제한이 있다고 하는군요. “1회 변환 시 3페이지 이내, 하루에 총 10회까지 변환할 수 있습니다.”라고 합니다. ▼

Picture124

저는 이런 파일을 올려보기로 했습니다. 삼국사기의 “소녀 지은 설화”의 일부분입니다. 보시다시피 스캔 상태가 썩 좋지는 않습니다. ▼

Picture125

먼저 변환할 파일을 선택합니다. ▼

Picture126

언어 옵션은 고정되어 변경할 수 없습니다. 그냥 다음 버튼을 누르시면 됩니다. 로그인을 하라고 하는 경우도 있는데 저는 Google 아이디를 사용하여 로그인했습니다. 개인 정보를 많이 요구하거나 하지는 않습니다. ▼

Picture127

Google 아이디로 로그인하면 이메일 정보가 이미 채워져 있습니다. 레티아로부터 딱히 메일을 받고 싶은 것은 아니므로 “레티아로부터 새 소식을 받고 싶습니다.” 항목은 체크 해제하였습니다.

나머지 항목은 바꿀 수 있는 것이 없군요. 그대로 두고 다음을 클릭합니다. ▼

Picture128

내용을 확인하고 마지막으로 문서변환을 클릭하면 잠시 후 메일로 OCR된 Word 파일이 도착합니다. ▼Picture129

 

시간이 조금 걸릴 때도 있는데 보통 몇 분 내로 이메일이 도착합니다. 첨부 파일을 열어볼까요? ▼Picture130

 

이렇게Word 파일로 OCR되었습니다! 물론 오자가 여기저기 있긴 합니다만, 스캔 상태가 좋지 않은 문서임에도 이 정도 품질이면 무료 치고는 상당하지요. FineReader가 없을 때, 급하게 한국어 문서 몇 장을 OCR해야 할 때 제법 쓸모가 있습니다. ▼

Picture131

 

이상으로 드디어 모든 레슨을 마치셨습니다. 축하드립니다!

이 코스를 완료하신 후에도 언제든지 다시 방문하여 공부하실 수 있습니다.

코스를 구입해 주시고 열심히 공부하신 여러분께 축하와 감사의 마음을 전합니다. 수고 많으셨습니다!

0 Comments

댓글을 남겨주세요

This site uses Akismet to reduce spam. Learn how your comment data is processed.

error: Content is protected !!