CAT Tool의 효용: 왜 CAT tool은 점점 번역가의 필수 도구가 되어가는가?

이 포스트에서는 CAT tool을 정의하고 CAT tool의 기본적인 효용을 살펴 봅니다. TM과 concordance를 활용을 통한 속도 향상, Format 시간 절약, 집중력 향상, Machine translation 기능을 통한 능률 향상 등을 살펴보려고 합니다. 우선 CAT tool이 무엇인지 정의한 후에 그 기본적인 효용을 정리해 보겠습니다.

 

 

 

CAT tool의 정의

CAT은 computer-assisted translation 또는 computer-aided translation의 약자로서 번역가가 번역을 좀 더 빠르고 쉽게 하기 위해 사용하는 컴퓨터 소프트웨어를 가리킵니다. 지금은 CAT tool이라는 표현이 정착된 것 같은데 그래도 영어로는 machine-assisted translation 또는 machine aided translation이란 표현도 꽤 쓰입니다. 그런데 이 표현의 문제점은 machine-assisted translation을 machine translation과 혼동하는 사람이 많다는 겁니다. (여담이지만, 인터넷은 정보의 바다이기도 하지만 혼돈과 혼동의 바다이기도 한데 저런 혼동을 아주 자랑스럽게 혹은 격렬한 감정을 가지고 표현해 둔 것을 가끔 봅니다. 자기 의견을 표현하는 것이야 자유지만 machine-assisted translation과 machine translation도 구분하지 못한 채 자신은 “machine-assisted translation을 한 번도 사용하지 않았고 앞으로도 하지 않을 것”이라고 써 두는 분은 참 딱한 분입니다. 우선 최종 번역본을 machine translation을 넘기는 사람이야 어차피 사기꾼 말고는 아무도 없을 뿐더러, 번역 과정에서야 필요하다면 machine translation을 얼마든지 사용할 수 있는 것인데 그런 것을 고려한 적도 없다면 자신의 비효율성을 자랑하는 것밖에 안되지요. 참고로 제가 machine translation을 어떻게 효율적으로 사용할지에 대한 코스를 만든 것이 있으니 machine translation 이용에 관심이 있는 분은 살펴 보십시오.) 아무튼 저는 그런 이유로 CAT tool이란 표현이 더 좋은 것 같습니다.

 

 

CAT tool의 효용

번역가가 CAT tool을 사용하는 이유야 매우 간단합니다. 다른 모든 도구와 마찬가지로 그걸 사용하면 작업이 쉬워지고 빨라지니까 사용하는 거지요. (이 글은 제가 쓰는 특정한 CAT tool이 아니라 모든 CAT tool에 대한 글을 쓰려고 하니까 쉬워진다는 말은 좀 꺼려지긴 합니다. 종류에 따라서는 번역 작업 자체를 쉽게 해 주는 요소는 별로 없는 것도 많습니다. 그러나 작업이 빨라진다는 것은 모든 CAT tool에 대해 말할 수 있습니다.) 얼마나 쉬워지고 얼마나 빨라지느냐고요? 물론 사람마다 다르고, 얼마나 활용법을 잘 아느냐에 따르고, 또 번역하는 문서의 종류와 성격에 따라 다르겠지만 CAT tool을 사용하고부터 최소 50% 빨라졌다고 하는 사람이 많습니다. 저도 최소 50% 빨라진 것 같습니다. 번역 질의 향상은 CAT tool의 또 다른 효용입니다. 아래에서는 이런 속도와 질의 향상이 어떻게 가능한지 살펴보도록 하겠습니다.

 

 

TM과 concordance를 활용을 통한 속도 향상

이 효용은 아래에 있는 모든 효용을 다 합친 것만큼 중요합니다. CAT tool을 처음 사용해 본 사람들이 짜릿한 기쁨을 느끼는 것도 바로 이 부분입니다. 또 아래에 열거한 효용들 중 일부는 해당되지 않거나 효용이 그다지 크지 않은 CAT tool도 있지만 제가 아는 한 TM과 concordance가 없는 CAT tool은 없습니다. 아니 TM과 concordance는 CAT tool의 핵심이어서 TM과 concordance가 없는 것은 다른 이름으로 불릴 수는 있을지언정 CAT tool이라고 부를 수는 없을 겁니다. (다만, TM을 누가 소유하는가 하는 문제는 별개의 문제입니다. 온라인 CAT tool과 번역가가 소유한 CAT tool과의 차이를 아시려면 여기를 클릭해 보십시오.)

 

예를 들어 설명하면 이해가 쉬울 것 같아서 어떤 번역가(굳이 저라고 상상할 건 없지 않습니까? 이미 그렇게 상상한 분이 있다면 본인이라고 바꾸어 상상하세요!)의 상황을 잠깐 살펴 보겠습니다. 지난 해에 어떤 회사의 브로셔를 번역했는데 해가 바뀌자 같은 고객이 그 브로셔의 개정판을 번역해 달라고 의뢰해 왔습니다. 그런 경우에 고객이나 최종 고객은 사실 그 브로셔의 어느 부분이 어떻게 바뀌었는지 모릅니다. 설사 알아도 그걸 일일이 설명하기도 힘들고 설명해 줄 시간도 없죠. 그런데 그 문서를 직접 번역한 번역가는 척 보니 그 브로셔 내용의 대부분은 새로 첨가된 몇몇 제품에 대한 사항 빼고는 거의 작년 브로셔 그대로입니다. 자, 이런 상황에서 그 번역가에게 CAT tool이 없다면 어떻게 될까요? 사실상 이미 번역한 문서를 새로 번역하는 수밖에 없습니다. 그러면 작년에 번역한 시간에 비해 과연 얼마나 빨리 번역할 수 있을까요? 내용 이해를 위해 애쓰는 시간이야 조금 줄어들겠지만 전체적인 번역 시간은 사실상 별로 차이가 나지 않을 것입니다. 한 글자씩 타이핑을 해 나가는 수밖에 없으니까요.

 

짜증이 난 번역가는 컴퓨터를 뒤져서 용케 작년에 번역한 소스 문서와 타겟 문서를 찾아내었습니다. 그 때부터 꼼꼼하게 작년 소스 문서와 올해 소스 문서를 둘 다 인쇄하여 비교하기 시작합니다. 그리고 빨간 펜으로 번호를 매겨서 같은 단락이나 문장들을 표시해 나가기 시작합니다. 그리고 복사해서 붙이기 작업을 해 나가지요. 그런데, 어럽쇼, 내용을 보니 분명히 같은 단락인 것 같은데 어째 길이가 약간 다릅니다. 뚫어지게 쳐다보니 중간에 단어와 숫자 몇 가지가 바뀐 것이 보입니다. 바뀐 단어는 사람 이름이고 숫자는 매출액 등입니다. 매우 중요한 것들이죠. 그래서 그대로 복사해서 붙여 넣을 수가 없고 내용을 수정해 줍니다. 그런데 그 때부터 슬슬 불안해 집니다. ‘지금까지 이미 붙여 넣은 것은 제대로 된 것일까? 그런 곳에도 혹시 중요한 데이터와 단어가 바뀐 곳이 있으면 어쩌지?’ 이런 생각에 미치자 그 번역가는 이런 “요령”을 포기하고 그냥 전통적인 방식으로 “정직하게” 번역하기로 작정합니다. 그래서 비록 속은 쓰리지만 사막의 낙타처럼 터벅터벅 열심히 한 줄 한 줄 번역을 해 나갑니다. 그러다 잠깐 쉬는 시간에 불현듯 고객이 보낸 이메일이 생각나서 다시 열어보고는 얼굴이 새하얗게 질립니다. 고객이 요청한 것 중 하나가 “작년 브로셔와 문체와 용어가 일관성이 있도록” 만들어 달라는 것이거든요. 이쯤되면 작년에 번역했던 문서와 비슷한 문서를 다시 번역하는 것이 전혀 고맙지 않습니다. 그냥 낙타처럼 걸어가는 방식으로 번역을 하면 안되고 작년에 썼던 동일한 용어를 그대로 유지해 주어야 하니까 작년 문서를 계속 찾아보면서 거기서 내가 어떤 용어와 어떤 표현을 썼는지 확인해야 하니까요. 결국 작업시간은 처음 본 문서를 번역하는 것보다 더 길어지고 말았습니다. 제가 위의 가상의 번역가의 곤경에 대해 더 자세히 쓸 수도 있지만 이 정도만 해도 대충 그림이 그려졌으리라 생각합니다. 저 불쌍한 번역가는 제 옛날 모습일 수도 있고 여러분의 모습일 수도 있습니다. 사람들이 “에잇, 더는 못참아!” 하면서 비싼 돈 주고 CAT tool을 사고 그것을 배우려고 낑낑대기 시작하는 출발점은 대략 저런 경험이 있습니다. 사실 아래에 열거한 다른 효용은 덤이죠.

 

자, 그럼 CAT tool이 있으면 상황이 어떻게 달라질까요? 우선 작년 브로셔와 같은 문장이 있으면 엔터키 하나로 그 문장 번역이 완료됩니다. 만약 중간에 이름이나 숫자가 바뀐 것이 있다면 무엇이 바뀌었는지 시각적으로 명확하게 보이기 때문에 그것만 수정해 주는 것이 아주 쉽습니다. 따라서 바뀐 것을 실수로 그대로 유지할까봐 불안하지 않습니다. 또 새로 삽입된 문장이나 단락에서 기존 문서에 쓰인 중요한 단어가 다시 나왔고 그것을 내가 과거에 어떻게 번역했는지 보고 싶으면 concordance에서 찾아보면 되니까 사전을 다시 찾거나 기억을 더듬으려고 애쓸 필요가 없습니다. 이런 식으로 번역을 하니 낙타처럼 걷는 것이 아니라 제트기를 타고 날아가는 것처럼 작업이 끝나버립니다. 정말 이렇게 쉽게 끝내도 괜찮은 것일까 하는 죄책감이 살짝 들 정도로 작업이 수월해지고 빨라진 것이죠. CAT tool의 이런 효용은 기억과 정확성을 위해 그리고 타이핑 수고를 덜기 위해 컴퓨터를 이용하는 것이니, 이것이야 말로 완벽한 인간과 컴퓨터의 협업이요 computer aided translation입니다. (참고로 위의 예에서 machine translation은 전혀 사용되지 않았습니다. 이미 설명했지만 그래도 아직 개념 정립이 안 된 분이 있을까봐 노파심에서….) 이런 기능 덕분에 CAT tool을 사용하는 번역가는 같은 문장을 결코 두 번 번역하지 않습니다. 비단 한 문서 안에서 좀 전에 번역한 문장만 말하는 것이 아닙니다. 10년 전에 번역한 문장이라도 같은 (혹은 거의 같은) 문장이라면 몇 개의 키 조작으로 번역이 끝납니다.

 

 

Format 시간 절약을 통한 속도 향상

아직 원고지 한 매당 얼마씩 번역료를 주고 받는다는 말도 들었습니다만 제가 본 적은 없으니 그런 경우는 제외하고 나면, CAT tool 이전의 번역 형태는 아마도 마이크로소프트 워드나 기타 유사한 워드프로세싱 프로그램을 사용하여 타이핑을 해 나가는 식일 겁니다. 제가 그랬듯이요. 사실 누구나 그렇게 시작하지요. 그런데 이렇게 하면 타이핑의 수고 위에 포맷을 만들어 주기 위한 수고를 해 주어야 합니다. 예컨대 소스 문서에서 어느 부분에서 여백을 많이 주었으면 번역가도 엔터를 여러번 쳐야 하고, 제목만 폰트 크기가 크면 번역가도 그 부분만 크게 해 주기 위해 작업을 해야죠. 그러나 CAT tool을 쓰면 segmentation을 자동으로 해 주기 때문에 비록 완벽하지는 않아도 적어도 위와 같은 작업은 전혀 필요가 없고, 크게 보아 포매팅 수고의 90% 정도는 덜어주는 것 같습니다.

 

 

향상된 집중력을 통한 능률 향상

CAT tool이 소스 문서의 내용을 마침표나 엔터키 등을 중심으로 잘게 끊어 놓은 것이 segment인데, 번역 작업은 매 segment를 하나씩 번역하는 식으로 이루어지고 현재 번역하고 있는 segment는 하이라이트가 되어 있어서 문맥을 보면서도 현재 segment에 집중할 수 있습니다.

 

 

Machine translation 기능을 통한 능률 향상

CAT tool에 따라 차이는 있지만, 번역가의 선택에 따라 특정 segment 혹은 문서 전체의 machine translation을 제공해 주는 경우가 많습니다. 물론 문서의 종류와 성격에 따라서는 machine translation이 완전히 무용지물인 경우도 있지만 또 어떤 경우에는 번역가에게 자기 tool에 대한 지식이 있고 문서의 내용과 성격에 대한 안목이 있으면 machine translation이 상당히 유용할 때도 있습니다. 예컨대 단어나 짧은 어구로 이루어진 문서나 기술적인 문서의 경우가 그렇습니다. 따라서 잘만 활용하면 이것도 번역가의 작업 능률을 상당히 높여줄 수 있습니다.

 

 

Search 기능을 활용한 속도 향상

특정 내용을 찾아서 바꾸는 것은 마이크로소프트 워드에 이미 있는 잘 알려진 기능입니다만 CAT tool 안에서도 이런 것이 가능합니다.

 

 

Reference file의 효과적인 처리

여러분은 혹시 고객이 짧은 문서 하나를 번역해 달라고 하면서 그 문서보다 더 긴 파일 혹은 서너 개의 파일을 참조 파일로 받은 적이 있으신가요? 어떤 시리즈(잡지나 동영상)를 번역할 때 그 이전의 소스 파일과 타겟 파일들을 보내 주는 경우가 그런 예이지요. 그런데 아주 큰 프로젝트라면 몰라도 작은 프로젝트라면 번역 작업보다 그런 참조 문서를 읽고 정리하는 시간이 더 걸립니다.ㅎㅎ 이럴 때 CAT tool의 alignment라는 기능을 쓰면 번역 작업 도중에 필요한 용어를 쉽게 참조할 수 있고, 경우에 따라서는 마치 내가 만든 TM처럼 그 속에 있는 문장이나 단락까지 순식간에 옮겨올 수 있습니다. (물론 그 참조 파일이 맘에 들지 않아서 내 CAT tool 속에 저장하고 싶지 않으면 프로젝트가 끝난 후에 없애버릴 수도 있습니다.) 얼라인먼트에 대해서는 제가 따로 정리해 둔 글이 있으니 참조하십시오.

 

 

TM과 concordance 활용을 통한 문서 일관성 향상

위의 불쌍한 번역가 예에서 이미 설명했지만, 특정 단어나 특정 어구를 과거(10분전이든 10년전이든)에 어떻게 번역했는지를 기억하는 것은 참 쉽지 않습니다. 예컨대 같은 문서 안에서 동일한 어구가 반복될 경우에 그 어구는 중요한 어구일 가능성이 높은데 그것을 일관성 없이 번역하면 안되지요. 앞에서 어떤 용어를 이미 번역했다면 뒤에서도 같은 표현으로 번역해 주어야 합니다. 저야 워낙 기억력이 나쁘지만 설사 기억력이 아주 좋은 분이라도 이런 면에서 컴퓨터를 따라가는 것은 쉽지 않죠. (사실 완곡하게 표현해서 그렇지 대부분의 인간 번역가는 컴퓨터의 검색 속도와 기억력을 도저히(!) 따라가지 못합니다.) 그러나 CAT tool이라면 다 있는 TM과 concordance를 사용하면 번역하다가 자기 머리를 쥐어박는 불상사가 생기지 않습니다. TM은 문장 단위로 찾아볼 때 사용하고 concordance는 단어나 짧은 어구를 찾아볼 때 사용하는데, 어느 것을 사용하든 타이핑을 하지 않고도 아주 간단한 조작으로 특정 단어/어구/문장을 현재의 target segment 안으로 싹~ 가져올 수 있습니다. 이렇게 하여 10분 전에 번역한 문장과의 일관성이든 10년 전에 번역한 문서와의 일관성이든 문제 없이 성취할 수 있습니다.

 

 

인터넷 리소스 활용을 통한 속도와 질 향상

이건 모든 CAT tool에 해당되는 얘기는 아니지만 적어도 제가 쓰는 Fluency에는 해당됩니다. 여러분은 번역할 때 가장 시간이 많이 걸리는 요소가 무엇입니까? 저는 정확한 개념과 배경 이해를 위해 사전을 비롯해서 많은 문서를 참조하는 일에 가장 시간을 많이 씁니다. 만약 이런 일을 번역 작업과 같은 화면 안에서 그것도 타이핑 없이 간단한 키 조작으로 해 낼 수 있다면 능률이 얼마나 향상되겠습니까? CAT tool 안에서 인터넷 리소스를 직접 활용하여 얻는 생산성 향상은 정말 대단합니다. 또 그렇게 쉽게 찾아볼 수 있으니 아무래도 많이 찾아보게 되고 아는 길도 물어가고 돌다리도 두드려보고 건널 수 있지요. 물론 이것은 인터넷이 늘 연결되어 있어야 한다는 조건이 있지만 오늘날 그건 점점 당연한 상황이 되어가므로 앞으로 모든 tool들이 그런 방향으로 진화하지 않을까 싶습니다. 물론 제 희망 사항에 그칠지도 모르지만요.

Bryan
Bryan

브라이언은 의료분야에서 한영번역을 하는 번역가입니다. 캐나다 온타리오의 작은 시골 마을에서 아내와 둘이 삽니다. 여행과 독서와 음악과 커피를 좋아합니다.

7 Comments

  1. CAT tool을 이용하는 가장 큰 이유는 속도군요. 그렇다면 CAT Tool을 굳이 사용하지 않아도 비슷한 속도와 효율성을 가진다면 사용할 필요가 없는데 일부 번역사들이 이툴을 의무화 하는 뭐라 생각하시나요? 목적과 수단이 전도됐다고 생각하지 않으시나요?

    • 물론 CAT tool을 쓰지 않고도 그것을 쓰는 사람만큼 효율이 난다면 그건 훌륭한 일이지요. 만약 지나가다 님께서 그런 분이시라면 대단한 경지에 오르신 것입니다. 그런데 그런 분이 CAT tool을 쓰면 지금보다 또 다시 50% 효율이 향상된다면 어떨까요? ‘웬만한 사람만큼은 속도가 나니까 난 필요없어!’ 하시겠습니까, 아니면 ‘지금보다 50% 향상된다면야 당연히 써야지!’ 하시겠습니까?

      • 제가 말씀드리는 건 개인적인 차원의 효율성의 제고가 아닙니다. 그걸 넘어 저 툴을 사용하지 않으면 채용을 하지 않는다든가 하는 방식에 대해 말씀을 드리는 것입니다. 특히 저 프로그램 자체의 사용 비용이 만만치 않은 상황에서 그 비용을 오히려 번역자들에게 전가하는 것이 아닌가라는 문제도 제기할 수 있을 것 같고요. 반면 고용자는 저걸 통해 번역 단가를 할인하는 명분으로 사용하지 않을까라는 우려도 있습니다.

        • 아, 그건 맞습니다! 사실 CAT tool을 쓰든 쓰지 않든 좋은 번역을 제공한다면 에이전시에서는 상관하지 말아야 하는데 마치 CAT tool을 쓰지 않으면 수준이 낮은 번역가인 것처럼 취급하는 경우가 많은데 그건 옳지 못하다고 생각합니다. 그리고 CAT tool 할인 핑계로 사용하는 면도 없지 않고요. 그 전에는 단순히 단어수만 가지고 계산했는데 반복과 fuzzy를 계산해서 할인을 요구하니까요.

  2. 일한출판번역가입니다. 원문은 원서 또는 원서를 스캔한 pdf 파일입니다. CAT tool을 써 볼까 해서 try on 버전을 시도했지만 원문을 텍스트로 변환하는 데 어려움이 있었습니다. OCR을 시도해 봤지만 도저히 해독할 수 없는 수준밖에 안 되더라구요. 이런 경우에 주실 만한 조언이 혹시 있을지요? 경력이 10년 가까이 되다보니 데이터베이스 축적의 필요성은 점점 커지는데.. 나날이 쇠퇴하는 기억력에 의존하는 것밖에 별 대안이 없군요.

  3. 아, 곤란한 상황에 처해 계시는군요. 안타깝게도 좋은 원문에서 좋은 번역문이 나오는 것처럼, 겉보기에는 비슷한 PDF 파일이라도 스캔본은 OCR에 근본적으로 한계가 있습니다. 게다가 캣툴에서 자체 제공하는 OCR 기능은 주로 알파벳 문자를 사용하는 언어에 적합한 경우가 많으니 우선 Abby FineReader에서 OCR을 시도해 보시는 방법을 권해드리고 싶습니다. 이렇게 해도 알아볼 수 없는 원서라면 번역외 비용을 추가로 청구해야 할 것 같습니다.

Leave a Reply to 번역가 HCancel Reply

Your email address will not be published. Required fields are marked *

행복한 번역가