Technologie překladové paměti. Systémy překladové paměti Koncepce a implementace překladové paměti OCR software

Překladatelská paměť projektu (TM) je úložiště zdrojových řetězců a jejich překladů do různých jazyků, které můžete použít k urychlení překladu stejných nebo podobných řetězců ve vašem projektu nebo jiných projektech.

Každý překlad vytvořený v projektu je automaticky přidán do překladové paměti projektu. Vlastník nebo projektoví manažeři mohou v případě potřeby také nahrávat do projektu. Překladová paměť.

Stahování nebo nahrávání překladových pamětí

  1. Přejděte na kartu TM&MT položka nastavení projektu.
  2. Klepněte na tlačítko stažení nebo stažení.

TM můžete nahrávat a stahovat v následujících formátech souborů .tmx, .csv, .xlsx.

Pokud nahráváte TM ve formátech souborů .csv nebo .xlsx, namapujte sloupce do příslušných jazyků v konfiguračním dialogu.

TM vazba

Chcete-li svázat konkrétní TM pro váš projekt, postupujte takto:

  1. Přejděte na kartu TM&MT položka nastavení projektu.
  2. Klikněte na **Link TM**.
  3. V otevřeném dialogovém okně vyberte potřebné TM.
  4. Klepněte na tlačítko Uložit.

Ve stejném dialogu můžete nastavit prioritu vybraných TM.

Sdílení TM

Se sdílenými všemi vašimi PP budete moci předem přeložit jakýkoli ze svých projektů pomocí všech sdílených PP. Kromě toho editor zobrazí návrhy překladů pro PP ze všech PP přiřazených k projektům, které vlastníte.


Aplikace překladové paměti prostřednictvím předpřekladu

Předběžný překlad přes TM vám umožňuje používat minimálně 100% a dokonalé shody.

Tento článek obsahuje programy (programy pro překladovou paměť, elektronické slovníky, programy pro rozpoznávání textu, programy pro výpočet statistik, programy pro lokalizaci aplikací, programy pro překlad webových stránek, další programy pro překladatele), včetně bezplatných, které umožňují přeložit více textů za kratší dobu. Také dané krátké popisy tyto programy s odkazy na původní zdroje ke stažení a instalaci. Doufáme, že zde najdete něco užitečného.

PROGRAMY PŘEKLADOVÉ PAMĚTI

Překladová paměť (překladová paměť, překladové jednotky) – programy, které umožňují „nepřekládat stejnou věc dvakrát“. Jedná se o databáze, které obsahují dříve přeložené jednotky textu. Pokud je v novém textu, který je již v databázi, nalezena jednotka, systém ji automaticky přidá do překladu. Takové programy výrazně šetří čas překladatele, zvláště pokud pracuje s texty stejného typu.

Trados. V době psaní článku jeden z nejoblíbenějších Překladatelské programy Paměť. Umožňuje pracovat s dokumenty MS Word, PowerPointové prezentace, HTML dokumenty a další formáty souborů. Trados má modul slovníku. Webové stránky: http://www.translationzone.com/trados.html

Deja Vu. Také jeden z lídrů v popularitě. Umožňuje pracovat s dokumenty téměř všech oblíbených formátů. Tady je jednotlivé verze programy pro překladatele na volné noze a překladatelské agentury. Webové stránky: http://www.atril.com/

OmegaT. Podporuje velký počet oblíbené formáty, ale dokumenty v MS Word, Excel, PowerPoint je potřeba převést do jiných formátů. Pěkná funkce: program je zdarma. Web: http://www.omegat.org/

MetaTexis. Umožňuje pracovat s dokumenty hlavních populárních formátů. Nabízeny jsou dvě verze programu - modul pro MS Word a serverový program. Webové stránky: http://www.metatexis.com/

MemoQ. Funkčnost je podobná jako u Trados a Déjà Vu, cena programu (v době psaní tohoto článku) je nižší než u populárnějších systémů. Webové stránky: http://kilgray.com/

Star Transit. Navrženo pro překlad a lokalizaci. Na tento moment kompatibilní pouze s OS Windows. Webové stránky: http://www.star-group.net/DEU/group-transit-nxt/transit.html

WordFisher. Volný systém Překladová paměť vytvořena a udržována profesionální překladatel. Webové stránky: http://www.wordfisher.com/

Přes. Existují 4 různé verze programu, které se liší množstvím funkcí. Webová stránka: http://www.across.net/us/translation-memory.aspx

Catnip. Bes placený program, „nástupce“ programu MT2007. Webové stránky: http://mt2007-cat.ru/catnip/

ELEKTRONICKÉ SLOVNÍKY

Zde jsme uvedli pouze elektronické slovníky pro životnost baterie(bez přístupu k internetu). Internetových slovníků je mnohem více a bude jim věnován samostatný článek. Přestože internet pronikl do nejvzdálenějších koutů planety, je užitečné mít alespoň 1 slovník, se kterým můžete pracovat offline. Zvažovali jsme slovníky pro profesionální použití, fráze a slovníky pro studenty jazyků zde nejsou zahrnuty.

ABBYY Lingvo. V současnosti umožňuje překládat z 15 jazyků. Existuje několik verzí programu s různými objemy slovníků. Existuje verze pro mobilní zařízení. Placená verze Slovník je nainstalován na počítači a může fungovat bez připojení k internetu, bezplatný je dostupný pouze online. Program je kompatibilní s Windows, Symbian, Mac OS X, iOS, Android. Webové stránky: http://www.lingvo.ru/

Multitran. Ne každý ví, že existuje offline verze tohoto oblíbeného slovníku. Lze jej nainstalovat na počítače (stacionární i kapesní), chytré telefony. Funguje s Windows, Symbian a Android, stejně jako Linux (přes prohlížeč). V tuto chvíli vám umožňuje překládat z / do 13 jazyků. Webové stránky: http://www.multitran.ru/c/m.exe

výzva. Tento program má verze pro profesionální použití. Výhodou Promtu je, že vám umožňuje pracovat s Trados. Webové stránky: http://www.promt.ru/

Slovoed. Dokáže přeložit c/do 14 jazyků. Instalováno na stolní počítače a notebooky mobilní zařízení a čtenáři Amazon Kindle. Pracovat s operační systémy iOS, Android, Windows, Symbian, BlackBerry, Bada, Tizen. Slovník má několik verzí, včetně vysoce specializovaných tematických slovníků. Webové stránky: http://www.slovoed.ru/

SOFTWARE PRO ROZPOZNÁVÁNÍ TEXTU

ABBYY FineReader. Rozpoznává text na fotografiích, skenech a dokumentech PDF. Nejnovější (v době psaní tohoto článku) verze rozpoznává text ve 190 jazycích a u 48 z nich provádí kontrolu pravopisu. Výsledný text můžete uložit téměř ve všech oblíbených formátech (Word, Excel, PowerPoint, PDF, html atd.) Stránky: http://www.abbyy.ru/finereader/

CuneiForm(OpenOCR). Program byl vytvořen jako komerční produkt, ale v současné době je volně šířen. Kompatibilní s provozem Linuxové systémy, Mac OS X, Windows. Webové stránky: http://openocr.org/

PROGRAMY PRO POČÍTÁNÍ STATISTIKY

Překladatelské počítadlobezplatný program spočítat počet slov v dokumentech různé typy. Web: http://www.globalrendering.com/

AnyCount- placený program, který má velký počet nastavení. Můžete například počítat počet znaků s mezerami nebo bez nich, počet slov, řádků, stránek nebo si sami nastavit jednotku počítání. Web: http://www.anycount.com/

FineCount- program je dostupný ve dvou verzích, placené a bezplatné, které se liší množstvím funkcí. Webové stránky: http://www.tilti.com/

PROGRAMY LOKALIZACE APLIKACE

PROGRAMY PRO PŘEKLAD STRÁNEK

DALŠÍ PROGRAMY PRO PŘEKLADAČE

Komparátor ApSIC- program pro porovnávání souborů (původní text VS text se změnami provedenými překladatelem). Webová stránka.

Programy strojového překladu jsou programy, které jsou speciálně navrženy pro usnadnění procesu překladu pomocí počítače (lit. počítačově podporovaný překlad ), jak AutoCAD pro inženýry popř ArchiCAD pro architekty. Takový software je speciálně navržen tak, aby vytvářel, ukládal, četl a zapisoval informace ve formě souborů zvaných „překladové paměti“ (dosl. překladové paměti), přičemž program vytváří řetězec s jazykovým párem, přičemž automaticky najde shodu pro jedno slovo nebo frázi v jiném jazyce. Program vytvoří soubor s názvem, např. RU_EN nebo RU_IT atd., ve kterém slovo nebo fráze v jednom jazyce odpovídá jeho významu v jiném jazyce.

Co je překladová paměť a jak funguje.

Překladová paměť (překladová paměť, TM) je objemný soubor s odbornými termíny, zkratkami, ustálenými výrazy.

Pokud musíte pomocí programu pro strojový překlad (CAT) přeložit např. zkratku „CCCP“ z ruštiny do angličtiny, program vám okamžitě nabídne možnost překladu: Sovětský svaz.

Na první pohled je vše jednoduché, ale ne vše je tak jednoduché, jak se zdá. Pokud překládáme dokument, který nemá s historií nic společného, ​​pak tato zkratka může znamenat něco úplně jiného: C arbonyl C yanid m- C chlorfenyl h ydrazon , toxický ionofor, odpojovač dýchacího řetězce. Nebo by to například mohlo znamenat „ C kombinovaný C společenství C odec p ack «, softwarový balík Microsoft Windows pro přehrávání multimediálních souborů.

To je důvod, proč společnost "Příklad" nepoužívá v programu automatický překlad. Pro technické překlady používáme výhradně terminologické databáze.

(méně často - část souvětí nebo odstavce). Pokud se jednotka překladu zdrojového textu přesně shoduje s jednotkou překladu uloženou v databázi (přesná shoda, eng. přesná shoda), může být automaticky dosazen do překladu. Nový segment se také může mírně lišit od segmentu uloženého v databázi (fuzzy párování, eng. fuzzy shoda). Takový segment lze také nahradit v překladu, ale překladatel bude muset provést potřebné změny.

Kromě urychlení procesu překladu opakovaných fragmentů a změn provedených v již přeložených textech (např. nové verze softwarových produktů nebo změny v legislativě), systémy PP také zajišťují jednotnost překladu terminologie ve stejných fragmentech, což je důležité zejména pro technický překlad. Na druhou stranu, pokud překladatel pravidelně do svého překladu dosazuje přesné shody získané z překladové paměti, aniž by kontroloval jejich použití v novém kontextu, může se kvalita přeloženého textu zhoršit.

V každém specifický systém Data PP jsou uložena ve vlastním formátu (textový formát ve Wordfastu, databáze Access v Deja Vu), ale existuje mezinárodní standard TMX (angl. Formát eXchange překladové paměti ), který je založen na XML a který lze generovat téměř všemi softwarovými systémy. Díky tomu mohou být provedené překlady použity v různých aplikacích, to znamená, že překladatel pracující s OmegaT může používat PR vytvořený v TRADOS a naopak.

Většina softwarových systémů alespoň podporuje tvorbu a používání uživatelských slovníků, vytváření nových databází založených na paralelních textech (angl. zarovnání), stejně jako poloautomatická extrakce terminologie z původních a paralelních textů.

Populární softwarové systémy PP

Podle průzkumů používání PP systémů patří mezi nejoblíbenější systémy:

Anglická Wikipedie má seznam porovnávající možnosti různých systémů.

Standardy a formáty překladové paměti

  • Formát TMX (Translation Memory Exchange Format). Tento standard umožňuje výměnu mezi různými poskytovateli překladové paměti. TMX je mezi překladateli běžně používaný formát a je nejvhodnější pro import a export překladových pamětí. Nejnovější verze tento formát - 1.4b umožňuje obnovit původní dokumenty a jejich překlad ze souboru TMX.
  • TBX (formát Termbase Exchange - Termbase Exchange). Tento formát LISA (Localization Industry Association) je v současné době revidován a znovu publikován podle ISO 30042. Tato norma umožňuje výměnu terminologie, včetně podrobných lexikálních informací. Základní základ TBX je definován standardy: ISO 12620, ISO 12200 a ISO 16642. ISO 12620 poskytuje registr dobře definovaných „kategorií dat“ se standardizovanými názvy, které fungují jako typy datových prvků nebo předdefinované hodnoty. ISO 12200 (také známý jako MARTIF) poskytuje rámec pro rámec TBX. ISO 16642 (také známý jako Terminological Markup Framework) obsahuje strukturní metamodel pro terminologické značkovací jazyky obecně.
  • SRX je navržen tak, aby zlepšil formát TMX a zefektivnil přenos překladových pamětí mezi programy. Možnost specifikovat pravidla segmentace, která byla použita v předchozím překladu, zlepšuje efektivitu identifikace segmentů v aktuálním textu s obsahem PG.
  • GMX GILT je zkratka pro globalizaci, internacionalizaci, lokalizaci a překlad (Globalizace, internacionalizace, lokalizace, překlad). Standard GILT Metrics se skládá ze tří částí: GMX-V pro objemové metriky, GMX-C pro metriky složitosti, GMX-Q pro metriky kvality. Navrhovaný standard GILT Metrics si klade za cíl kvantifikovat rozsah práce a požadavky na kvalitu pro realizaci cílů GILT.
  • OLIF je otevřený standard kompatibilní s XML, který se používá pro výměnu terminologických a lexikálních dat. Ačkoli byl původně používán jako způsob výměny lexikálních dat mezi soukromými lexikony strojového překladu, postupně se tento formát vyvinul v obecnější standard pro výměnu terminologie.
  • XLIFF (XML Localization Interchange File Format - XML ​​​​Localization Interchange File Format), vytvořený jako jediný formát souboru pro výměnu, který je uznáván všemi softwarové nástroje lokalizace. XLIFF je nejlepší způsob výměny informací ve formátu XML v dnešním překladatelském průmyslu.
  • TransWS (překlad webové služby- překladové webové služby), definuje požadované parametry pro volání webových služeb při odesílání a přijímání souborů a zpráv souvisejících s lokalizačními projekty. Byl koncipován jako nasazený systém pro automatizaci procesu lokalizace pomocí služeb na internetu.
  • xml:tm je tento přístup k překladové paměti založen na konceptu textové paměti, která umožňuje kombinaci paměti autora a překladové paměti. Formát xml:tm poskytla Lise OSCAR XML-INTL.

Výhody a nevýhody

Výhody

  • Snížení času a objemu práce překladatele
  • Zlepšení konzistence překladů, zvláště když skupina překladatelů pracuje na stejném projektu.
  • Zvyšování zisků zvýšením produktivity překladatele, skupiny překladatelů
  • Zkvalitňování služeb zvýšením přesnosti a jednotnosti překladů termínů, zejména v odborných textech.

nevýhody

  • Může udělat překlad „suchější“; samotná podstata textu se ztrácí, pokud překlad pomocí překladové paměti provádí nekvalifikovaný překladatel
  • Často neexistuje žádná souvislost mezi větou/textem navrženým programem se sousedními větami a textem jako celkem
  • Originál musí být uvnitř v elektronické podobě
  • Jedna nepovšimnutá chyba se může rozšířit na celý projekt
  • Je nutné trénovat samotný program a při změně zaměstnání - možná více než jednou (pokud zaměstnavatelé spolupracují různé programy TM)
  • Vhodné pro všechny typy textů
  • Vysoká cena licencovaného softwaru

viz také

Literatura

  • Překladová paměť technologie Grabovsky VN // Bridges. Časopis překladatelů. 2004. č. 2. - S. 57-62.

Odkazy

  • Nedělejte stejný překlad dvakrát // Computerra Online, 14. února 2005.

Poznámky


Nadace Wikimedia. 2010

Podívejte se, co je "Překladová paměť" v jiných slovnících:

    Obsah 1 V psychologii 2 V počítačová technologie... Wikipedie

    Mozaika s obrázkem ... Wikipedie

    Text v jednom jazyce spolu s jeho překladem do jiného jazyka. "Parallel Text Alignment" je identifikace shodných vět v obou polovinách paralelního textu. Velké sbírky paralelních textů se nazývají ... ... Wikipedie

    Paralelní text (bitext) text v jednom jazyce spolu s jeho překladem do jiného jazyka. "Parallel Text Alignment" je identifikace shodných vět v obou polovinách paralelního textu. Velká shromáždění ... ... Wikipedie

    Překladová paměť (TM, někdy označovaná jako "Překladová paměť") je databáze obsahující soubor dříve přeložených textů. Jeden záznam v takové databázi odpovídá segmentu nebo „překladové jednotce“ (anglicky ... ... Wikipedia

Systémy překladové paměti: koncepce a implementace 1. Ideologie nástrojů TM 2. Obecná zásadaТМ 3. Složení systému ТМ 4. Funkce ТМ 5. Přehled hlavních programů třídy Translation Memory: TRADOS 3. 0 Deja. Vu SDLX 3.0 Transit and Termín. hvězdné slovo. Fisher 4 Překlad IBM. Manažer 2. 0 6. Výhody a nevýhody TM TM

Ideologie TM-Tools Makoto Nagao, Japonsko, Univerzita v Kjótu. V roce 1982 navrhl nový koncept strojového překladu, který byl založen na tvrzení, že texty by měly být překládány analogicky s texty dříve překládanými ručně. M. Nagao nazval svůj přístup k technickému překladu z angličtiny do ruštiny „Překlad založený na příkladu“. Nápad M. Nagaa použil nějaký Makoto Nagao

Co je překladová paměť? Překladová paměť (TM) je databáze, kde se ukládají dokončené překlady. Technologie TM funguje na principu akumulace: během procesu přenosu je původní segment (nabídka) a jeho překlad uloženy v TM. Při zpracování nového textu přijatého k překladu systém porovná každou jeho větu se segmenty uloženými v databázi. Pokud je nalezen identický nebo podobný segment, zobrazí se tento segment spolu s překladem a procentuální shodou. Slova a fráze, které se liší od uloženého textu, jsou zvýrazněny. Překladač tedy potřebuje přeložit pouze nové segmenty a upravit překrývající se segmenty. Každá změna nebo nový překlad se uloží do PP.

Ideologie TM-Tools TM-tools jsou navrženy pro ukládání dvojic vět v překladové databázi. Každá taková dvojice se skládá z věty z originálu a jejího technického překladu do jiného jazyka. Je možné umístit fragmenty textu a jiné formáty, které přesahují délku věty nebo jsou pouze její částí. Ale v automatický režim ukládají se právě věty, proto se těmto programům dost často říká „sentence memory“ (z angl. Sentence Memory).

Princip fungování nástrojů TM Programy TM jsou integrovány s takovými kancelářské programy jako například Word. Některé prostředky textu. z nich mají vlastní technickou editaci.Jejich rozhraní se jen málo liší od rozhraní textových editorů známých modernímu překladateli.

Překladová paměť a pomocné programy pro překlad Třídy: MT (Machine Translation) - automatický nebo strojový překlad; Programy CAT (Computer-assisted/aided translation) automatizují a usnadňují práci překladatele v jejích různých aspektech, implementují koncept překladové paměti (překladové paměti), např. Trados, Omega. T, Deja. Wu, slovo. Rychle atd.

Jak fungují moderní CAT programy Program rozděluje zdrojový text na segmenty (zpravidla se jedná o věty nebo části vět) a překlad každého segmentu zadá překladatel přímo pod zdrojový text nebo, pokud je text uveden v ve formě tabulky napravo od ní. Překlad segmentu se uloží spolu s původním textem. Zaznamenává se také jméno překladatele a datum překladu (což je důležité pro týmová práce). Do segmentu se můžete kdykoli vrátit a zkontrolovat nebo změnit překlad. Program umístí segment do překladové paměti, takže pokud se znovu objeví ve zdrojovém textu, bude jeho překlad automaticky nahrazen z PP. Kromě toho má program CAT funkci fuzzy párování: detekuje segmenty, které jsou jen částečně podobné těm, které již byly přeloženy (například shoda o 75 %), a poskytuje „nápovědu“ pro jejich překlad.

Automatizovaný překladový systém Trados (Trados) Trados je počítačově podporovaný překladatelský systém vyvinutý německou společností Trados Gmb. H v roce 1992. Jeden ze světových lídrů ve třídě systémů překladové paměti (TM). Systém Trados obsahuje několik modulů určených k překladu textů různých formátů: dokumentů Microsoft Word, silové prezentace. Bod, HTML texty a další metadata, Frame dokumenty. Výrobce, Inter. Leaf a další, jakož i pro údržbu terminologických databází (modul Multi. Term).

Jak funguje systém Trados Koncept překladové paměti zahrnuje identifikaci fragmentů v přeloženém textu, jejichž překlady jsou již k dispozici v překladové databázi, a tím snižuje množství práce překladatele. Tato identifikace se nazývá zarovnání nebo srovnání (zarovnání). Fragmenty, které zůstanou nepřeložené po zarovnání (spárování), jsou předány k ručnímu zpracování překladateli nebo systému strojového překladu (Machine Translation, MT). V této fázi může překladatel vybrat nově přeložené fragmenty a vložit do databáze nové dvojice paralelních textů ve dvou jazycích. Takové schéma nejlepší způsob pracuje na textech stejného typu, kde je opakování frází poměrně vysoké.

Hlavní moduly systému Trados * Trados Workbench - hlavní modul pro překlad dokumentů, integrovaný do shellu Microsoft Word; * Tag. Editor - modul pro překlad dokumentů ve formátu HTML, XML atd.; * vyhrát. Align - modul pro vytváření překladové paměti na základě dříve přeložených dvojjazyčných textů; * S-Tagger - modul pro překlad dokumentů ve formátu Frame. Maker a Inter. List; * T-Window - modul pro překlad dokumentů ve formátu Power. směřovat; * Vícenásobné. Termín - modul pro údržbu glosářů; *Další. Období

Co mají programy Překladové paměti společného - Mixování - Údržba zarovnání - Slovník údržby - Terminologický program Textový editor– Editor dokumentu Concordance (Vazba použití s ​​kontextem) – Concordance

Výhody a nevýhody programů třídy překladové paměti Výhody - Snížení času a úsilí překladatele - Zlepšená konzistence překladu, zvláště když na stejném projektu pracuje několik překladatelů. - Zvýšení zisku zvýšením produktivity práce - Zkvalitnění služeb zvýšením přesnosti překladů termínů, zejména v odborných textech. Nevýhody - Překlad může být více „suchý“, ztrácí se samotná podstata textu - Často neexistuje žádná souvislost mezi větou / textem navrženým programem se sousedními větami a s textem jako celkem - Originál musí být v elektronický formulář - Jedna chyba se týká celého projektu - Pro samotný program je vyžadováno školení a při změně zaměstnání je možné vícekrát (pokud zaměstnavatelé pracují s různými programy TM) - Nevhodné pro všechny typy textů - Vysoká cena

Literatura: 1. 2. 3. 4. Grabovsky VN : Translation Memory Technology. "Mosty" 2/2004 Kutuzov, A. B.: Počítačové technologie při utváření odborné způsobilosti překladatele // Jazyky odborné komunikace: sborník článků 3. mezinárodní vědecké konference, svazek 2. - Čeljabinsk, 2007. URL: http: //tc. utmn. ru/files/kutuzov_it. pdf Shakhova N. G.: Vlak opět odjíždí. domácí počítačč. 5 1. 05. 2000 Silonov A.: Programy, které pomáhají překladateli. Počítačový týden č. 16 (238) Moskva 16. -22. 5. 2000