1.原理
翻譯記憶 (TM) 的原理其實非常簡單。由于專業(yè)翻譯領(lǐng)域所涉及的翻譯資料數(shù)量巨大,而范圍相對狹窄,集中于某個或某幾個專業(yè),如政治、經(jīng)濟(jì)、軍事、航天、計算機(jī)、通訊等專業(yè)都有自己的專業(yè)翻譯公司或部門。這就必然帶來翻譯資料的不同程度的重復(fù)。據(jù)統(tǒng)計,在不同行業(yè)和部門,這種資料的重復(fù)率達(dá)到 20%―70% 不等。這就意味著譯者至少有 20% 以上的工作是無謂的重復(fù)勞動。翻譯記憶技術(shù)就是從這里著手,首先致力于消除譯者的重復(fù)勞動,從而提高工作效率。
翻譯記憶 (TM) 技術(shù)原理是這樣的:用戶利用已有的原文和譯文,建立起一個或多個翻譯記憶庫 (Translation Memory),在翻譯過程中,系統(tǒng)將自動搜索翻譯記憶庫中相同或相似的翻譯資源(如句子、段落等),給出參考譯文,使用戶避免無謂的重復(fù)勞動,只需專注于新內(nèi)容的翻譯。翻譯記憶庫同時在后臺不斷學(xué)習(xí)和自動儲存新的譯文,變得越來越“聰明”,效率越來越高。幾乎所有翻譯記憶廠家都會告訴用戶:有了 TM,你永遠(yuǎn)不必對同一句話翻譯兩遍!
機(jī)器翻譯界一位著名專家曾經(jīng)說過,機(jī)器翻譯做了人愿意做的工作,卻沒有做好;翻譯記憶則做了人不愿做的工作!可不是嗎,有誰愿意把時間花在重復(fù)勞動上,又有誰樂意讓一臺技術(shù)不成熟機(jī)器來代替自己的工作呢?翻譯記憶技術(shù),實際起了輔助翻譯的作用,也就是“計算機(jī)輔助翻譯”,簡稱 CAT (Computer Aided Translation)。
2.功能與實例
1) 翻譯過程
我們來看一個典型的翻譯記憶軟件工作的例子。利用 TM 系統(tǒng)來翻譯句子 "This is a file for demo"。由于這是 TM 第一次啟動,當(dāng)然沒有任何“記憶”,需要用戶輸入譯文,“這是一個演示文檔”。TM 在翻譯下一句的同時,也把這一原文和譯文做為一個翻譯單元儲存了起來。當(dāng)我們再來翻譯另一個句子 "This is a demo file" 時,TM會搜索翻譯記憶庫,對該句和記憶庫中翻譯單元進(jìn)行對比和匹配,挑出原文最接近的翻譯單元,給出參考譯文。在這里,該參考譯文就是“這是一個演示文檔”。用戶當(dāng)然可以接受該譯文,也可以做一些修改,修改后的新譯文會自動存入記憶庫,供以后使用。翻譯記憶庫就這樣儲存每一句新的譯文,隨時為用戶提供參考。由于專業(yè)領(lǐng)域詞匯和句式相對固定,當(dāng)用戶積累了多個有一定規(guī)模的記憶庫后,遇到的重復(fù)句子會越來越多,翻譯工作也變得越來越輕松。
TM 產(chǎn)品還都支持網(wǎng)絡(luò)共享記憶庫功能。也就是說,當(dāng)多人同時進(jìn)行翻譯時,可以通過局域網(wǎng)共享一個翻譯記憶庫。比如,譯員 A 剛剛翻譯了 "This is a file for demo",當(dāng)譯員 B 遇到 "This is a demo file" 時,系統(tǒng)會給出 A 的譯文 "這是個演示用的文件"。B 可以接受,也可以修改,修改后的譯文又可供自己或他人重復(fù)使用。翻譯記憶庫就在這樣的不斷補(bǔ)充和完善過程中,發(fā)揮著越來越大的作用。
2) 自動建庫
對于在使用 TM 產(chǎn)品前,已經(jīng)積累了大量翻譯資料的用戶,TM 產(chǎn)品會提供一個自動建庫工具。該工具能自動分析和匹配原文和譯文,以句子為單位將原文和譯文一一對應(yīng)。用戶做完一些調(diào)整和校對之后,該工具會自動生成一個標(biāo)準(zhǔn)的翻譯記憶庫文件。用戶所有的資料都可以通過該工具得到回收,從而高效、快捷地建立起翻譯記憶庫。這些庫在不斷的使用過程中,又會得到進(jìn)一步補(bǔ)充和完善。
3)術(shù)語管理
TM 產(chǎn)品一般還提供一個非常重要的功能:術(shù)語管理。對于專業(yè)技術(shù)領(lǐng)域來說,幾乎每篇文檔都帶有大量的專業(yè)術(shù)語,術(shù)語譯文的前后一致,始終是校對的重要內(nèi)容之一。這項工作費時費力,難保還會有疏漏。TM 產(chǎn)品通過一個術(shù)語管理工具(一般是個電子辭典),來規(guī)范所有的術(shù)語。用戶只需一次性建立一個或多個標(biāo)準(zhǔn)術(shù)語列表(表中包括術(shù)語原文和譯文),在使用 TM 系統(tǒng)翻譯時,打開術(shù)語管理工具中相應(yīng)的術(shù)語列表,TM 會自動識別出當(dāng)前句子中有哪些詞是已定義的術(shù)語,并給出標(biāo)準(zhǔn)的術(shù)語譯文。這樣就不會在一篇文章或一本書中,不同的人把 "Mouse" 分別譯為“鼠標(biāo)”、“滑鼠”,甚至“老鼠”了,也省掉了校對的麻煩。不同的 TM 產(chǎn)品對術(shù)語管理的實現(xiàn)方式雖有不同,但殊途同歸,最終都是為了保證術(shù)語的統(tǒng)一。
4) 多語種間雙向互譯
由于翻譯記憶實現(xiàn)的是原文和譯文的比較和匹配,這還帶來了 TM 的一個先天優(yōu)勢--支持多語種之間的雙向互譯。以全球最著名的翻譯記憶軟件廠商,德國塔多思 (TRADOS) 公司為例,該公司的產(chǎn)品基于 UNICODE,支持 55 種語言,覆蓋了幾乎所有語言版本的 Windows 95/98/NT。換句話說,一套產(chǎn)品就可以實現(xiàn)各語種間的雙向互譯,這在機(jī)器翻譯是難以想像的。
5) 自動排版
人不愿做的事情又豈止是重復(fù)勞動。電子文檔的排版工作也是讓翻譯人員頭疼的工作。尤其本地化行業(yè),對譯文的格式要求極為嚴(yán)格,必須和原文檔的格式保持一致。在這方面,翻譯記憶產(chǎn)品又遠(yuǎn)遠(yuǎn)地走在了前頭。目前的翻譯記憶產(chǎn)品一般都提供各種格式處理工具,支持流行文檔格式,如 DOC、RTF、HTML、SGML、PPT 等等。譯文會自動套用原文的格式,翻譯人員不必費心排版,只要全神貫注從事翻譯就可以了。
統(tǒng)計數(shù)據(jù)表明,通過在翻譯流程中應(yīng)用 TM 技術(shù),工作效率能提高 30%―60%,效益十分可觀。
6)項目管理
翻譯軟件市場,誰主沉浮
答案似乎不言自明,難道不是翻譯記憶嗎?其實翻譯記憶的技術(shù)特點決定了它的用戶群主要是專業(yè)和行業(yè)用戶。對外語水平較差的個人用戶來說,機(jī)器翻譯的譯文盡管還“不太明白”,但總比“一點都不明白”要好得多了。而翻譯記憶產(chǎn)品昂貴的價格,日復(fù)一日的翻譯記憶庫建立工作,都是非專業(yè)用戶所無法承受的。所以現(xiàn)階段,TM 和 MT 各有所需,各得其所,倒也相安無事。
目前在全球翻譯記憶 (TM) 市場上,德國塔多思 (TRADOS) 公司處于絕對領(lǐng)先地位,其核心產(chǎn)品 Translator's Workbench(翻譯工作平臺)直接和微軟 Word 集成,界面友好,此外還有強(qiáng)大的網(wǎng)絡(luò)共享、術(shù)語管理、翻譯項目管理,以及格式轉(zhuǎn)換處理功能,為專業(yè)翻譯領(lǐng)域提供了一整套解決方案。
隨著 TM 這一技術(shù)在國內(nèi)的推廣應(yīng)用,人們必然面臨一個選擇的問題。其實只要做到了以下幾點,就可以說是真正的 TM 產(chǎn)品:第一,支持 TMX(Translation Memory Exchange - 翻譯記憶交換)標(biāo)準(zhǔn)。因為只有翻譯記憶庫文件的輸出格式符合 TMX 標(biāo)準(zhǔn),才能實現(xiàn)不同 TM 產(chǎn)品間的數(shù)據(jù)交換。第二,支持多語種之間的雙向互譯。第三,開放的翻譯記憶庫管理機(jī)制,允許用戶根據(jù)需要,對記憶庫進(jìn)行分類、檢索、合并、拆分及加密。第四,支持多種常用文檔格式(DOC、RTF、HTML、SGML、PPT、FM、MIF 等),避免用戶再排版。第五,提供術(shù)語管理功能,即通過統(tǒng)一的術(shù)語列表,在翻譯過程中動態(tài)提示術(shù)語的譯文,規(guī)范術(shù)語的翻譯。如果您所面對的 TM 產(chǎn)品完全符合這些條件,那就值得進(jìn)一步評估。至于其它功能,當(dāng)然多多益善,但以上幾條是必需的。
對于專業(yè)翻譯領(lǐng)域來說,翻譯記憶 (TM) 是目前唯一的選擇。該領(lǐng)域特點決定了翻譯記憶技術(shù)有著廣闊的應(yīng)用前景!
(摘自SDL-TRADOS中國技術(shù)中心)
Copyright @ 2005-2020 南京同傳翻譯公司 版權(quán)所有