Tehnologia memoriei de traducere. Sisteme de memorie de traducere Conceptul memoriei de traducere și implementarea programelor OCR

O memorie de traducere a proiectului (TM) este un depozit de șiruri sursă și traducerile acestora în diferite limbi pe care le puteți utiliza pentru a accelera traducerea acelorași șiruri sau similare în proiectul dvs. sau în alte proiecte.

Fiecare traducere realizată într-un proiect este adăugată automat în memoria de traducere a proiectului. Proprietarul sau managerii de proiect pot încărca, de asemenea, memoria de traducere în proiect, dacă este necesar.

Descărcarea sau încărcarea unei memorie de traducere

  1. Accesați fila TM & MT paragraf setările proiectului.
  2. Faceți clic pe butonul Descarca sau Descarca.

Puteți încărca și descărca TM în următoarele formate de fișiere .tmx, .csv, .xlsx.

Dacă încărcați TM în formate de fișiere .csv sau .xlsx, mapați coloanele la limbile corespunzătoare în dialogul de configurare.

Legarea TM

Pentru a lega orice TM-uri specifice pentru proiectul dvs., urmați acești pași:

  1. Accesați fila TM & MT paragraf setările proiectului.
  2. Faceți clic pe ** Leagă TM **.
  3. Selectați TM-ul dorit în caseta de dialog deschisă.
  4. Faceți clic pe butonul salva.

Puteți seta prioritatea TM-urilor selectate în același dialog.

Partajarea TM

Cu toate TM-urile partajate, veți putea pretraduce oricare dintre proiectele dvs. folosind toate TM-urile partajate. În plus, editorul va afișa sugestii de traducere TM de la toate TM-urile atribuite proiectelor pe care le dețineți.


Aplicarea memoriei de traducere prin traducere preliminară

O traducere preliminară prin TM vă permite să utilizați cel puțin 100% și potriviri perfecte.

Acest articol conține programe (programe de memorie de traducere, dicționare electronice, programe de recunoaștere a textului, programe de calcul de statistici, programe de localizare a aplicațiilor, programe de traducere de site-uri, alte programe pentru traducători), inclusiv gratuite care vă permit să traduceți mai multe texte în mai puțin timp. . Există, de asemenea, scurte descrieri ale acestor programe cu link-uri către sursele primare pentru descărcare și instalare. Sperăm să găsiți ceva util aici.

PROGRAME DE MEMORIE DE TRADUCERE

Memoria de traducere (memorie de traducere, memorie de traducere) - programe care vă permit „să nu traduceți același lucru de două ori”. Acestea sunt baze de date care conțin unități de text traduse anterior. Dacă o unitate este găsită în noul text care se află deja în baza de date, sistemul o adaugă automat la traducere. Astfel de programe economisesc semnificativ timpul traducătorului, mai ales dacă lucrează cu același tip de texte.

Trados... La momentul scrierii acestui articol, acesta este unul dintre cele mai populare programe de memorie de traducere. Vă permite să lucrați cu documente MS Word, prezentări PowerPoint, documente HTML și alte formate de fișiere. Trados are un modul pentru menținerea glosarelor. Site: http://www.translationzone.com/trados.html

Deja vu... De asemenea, unul dintre liderii în popularitate. Vă permite să lucrați cu documente de aproape toate formatele populare. Există versiuni separate ale programului pentru traducătorii independenți și agențiile de traduceri. Site: http://www.atril.com/

OmegaT... Acceptă un număr mare de formate populare, dar documentele în MS Word, Excel, PowerPoint trebuie convertite în alte formate. Funcție plăcută: programul este gratuit. Site: http://www.omegat.org/

MetaTexis... Vă permite să lucrați cu documente din principalele formate populare. Sunt oferite două versiuni ale programului - un modul pentru MS Word și un program server. Site: http://www.metatexis.com/

MemoQ... Funcționalitatea este similară cu Trados și Déjà Vu, costul programului (la momentul scrierii acestui articol) este mai mic decât cel al sistemelor mai populare. Site: http://kilgray.com/

Tranzit de stele... Proiectat pentru traducere și localizare. Momentan compatibil doar cu sistemul de operare Windows. Site: http://www.star-group.net/DEU/group-transit-nxt/transit.html

WordFisher... Sistem gratuit de memorie de traducere creat și întreținut de un traducător profesionist. Site: http://www.wordfisher.com/

Peste tot... Există 4 versiuni diferite ale programului, care diferă în domeniul de aplicare al funcționalității. Site: http://www.across.net/us/translation-memory.aspx

Catnip... Program gratuit, „succesorul” programului MT2007. Site: http://mt2007-cat.ru/catnip/

DICTIONARE ELECTRONICE

Aici am prezentat doar dicționare electronice pentru lucru offline (fără acces la Internet). Există mult mai multe dicționare online; le va fi dedicat un articol separat. Deși internetul a pătruns în cele mai îndepărtate colțuri ale planetei, este util să aveți cel puțin 1 dicționar care să funcționeze offline. Am analizat dicționare pentru uz profesional, manualele și dicționarele pentru cursanții de limbi străine nu sunt incluse aici.

ABBYY Lingvo... În prezent, poate traduce din 15 limbi. Există mai multe versiuni ale programului cu diferite dimensiuni de dicționare. Există o versiune mobilă. Versiunea plătită a dicționarului este instalată pe un computer și poate funcționa fără conexiune la internet, versiunea gratuită este disponibilă doar online. Programul este compatibil cu Windows, Symbian, Mac OS X, iOS, Android. Site: http://www.lingvo.ru/

Multitran... Nu toată lumea știe că există o versiune offline a acestui dicționar popular. Poate fi instalat pe computere (staționare și de buzunar), smartphone-uri. Funcționează cu Windows, Symbian și Android, precum și cu Linux (prin browser). În prezent, se poate traduce din/în 13 limbi. Site: http://www.multitran.ru/c/m.exe

Promt... Acest program are versiuni pentru uz profesional. Avantajul Promta este că vă permite să lucrați împreună cu Trados. Site: http://www.promt.ru/

Slovoed... Poate traduce din/în 14 limbi. Instalat pe computere desktop și laptopuri, dispozitive mobile și cititoare Amazon Kindle. Funcționează cu sistemele de operare iOS, Android, Windows, Symbian, BlackBerry, bada, Tizen. Dicționarul are mai multe versiuni, inclusiv dicționare tematice foarte specializate. Site: http://www.slovoed.ru/

SOFTWARE DE RECUNOAȘTERE TEXTULUI

ABBYY FineReader... Recunoaște textul din fotografii, scanări, documente PDF. Cea mai recentă versiune (la momentul scrierii acestui articol) recunoaște textul în 190 de limbi, iar pentru 48 dintre ele face o verificare ortografică. Puteți salva textul rezultat în aproape toate formatele populare (Word, Excel, PowerPoint, PDF, html etc.) Site: http://www.abbyy.ru/finereader/

Cuneiform(OpenOCR). Programul a fost creat ca produs comercial, dar în prezent este distribuit gratuit. Compatibil cu sistemele de operare Linux, Mac OS X, Windows. Site: http://openocr.org/

SOFTWARE DE STATISTICĂ

Abac al traducătorului- un program gratuit pentru numărarea numărului de cuvinte din documente de diferite tipuri. Site: http://www.globalrendering.com/

AnyCount- un program plătit cu un număr mare de setări. De exemplu, puteți număra numărul de caractere cu sau fără spații, numărul de cuvinte, rânduri, pagini sau puteți seta singur unitatea de numărare. Site: http://www.anycount.com/

FineCount- programul este disponibil în două versiuni, plătită și gratuită, care diferă în domeniul de aplicare a funcțiilor. Site: http://www.tilti.com/

SOFTWARE DE LOCALIZARE A APLICAȚII

SOFTWARE DE TRADUCERE SITE WEB

ALTE PROGRAME PENTRU TRADUCĂTORI

Comparator ApSIC- un program de comparare a fișierelor (text sursă VS text cu modificările făcute de traducător). Site.

Programele de traducere automată sunt programe special concepute pentru a facilita procesul de traducere folosind un computer (lit. traducere asistată de calculator ), Cum AutoCAD pentru ingineri sau ArchiCAD pentru arhitecti. Un astfel de software este special conceput pentru a crea, stoca, citi și scrie informații sub formă de fișiere numite „memorii de traducere” (lit. memorii de traducere), în timp ce programul creează un șir cu o pereche de limbi, găsind automat un singur cuvânt sau frază. e o altă limbă. Programul creează un fișier cu un nume, de exemplu, RU_EN sau RU_IT etc., în care un cuvânt sau o expresie într-o limbă corespunde semnificației sale într-o altă limbă.

Ce este memoria de traducere și cum funcționează.

Memoria de traducere (memorie de traducere, TM) Este un fișier voluminos cu termeni tehnici, abrevieri și expresii bine stabilite.

Dacă trebuie să traduceți, de exemplu, abrevierea „CCCP” din rusă în engleză folosind un program de traducere automată (CAT), programul vă va oferi imediat o opțiune de traducere: Uniunea Sovietică.

La prima vedere, totul este simplu, dar nu totul este atât de simplu pe cât pare. Dacă traducem un document care nu are legătură cu istorie, atunci această abreviere poate însemna cu totul altceva: c arbonil c yanide m- c hlorofenil h ydrazonă , ionofor toxic, decuplator al lanțului respirator. Sau, de exemplu, ar putea însemna „ c combinate c comunitate c odec p ack ", pachet software Microsoft Windows pentru redarea fișierelor multimedia.

De aceea, Exprimere nu folosește software de traducere automată în activitatea sa. Folosim exclusiv baze de date terminologice pentru traduceri tehnice.

(mai rar - o parte dintr-o propoziție complexă sau un paragraf). Dacă unitatea de traducere a textului sursă se potrivește exact cu unitatea de traducere stocată în baza de date (potrivire exactă, ing. potrivire perfecta), poate fi inserat automat în traducere. Noul segment poate diferi ușor de cel stocat în baza de date (potrivire fuzzy, ing. meci neclar). Un astfel de segment poate fi introdus și în traducere, dar traducătorul va trebui să facă modificările necesare.

Pe lângă accelerarea procesului de traducere a fragmentelor repetitive și a modificărilor aduse textelor deja traduse (de exemplu, versiuni noi de produse software sau modificări ale legislației), sistemele software asigură și uniformitatea traducerii terminologiei în aceleași fragmente, ceea ce este deosebit de important pentru traducerea tehnică. Pe de altă parte, dacă un traducător substituie în mod regulat potriviri exacte extrase din memoriile de traducere în traducerea sa fără a monitoriza utilizarea acestora într-un nou context, calitatea textului tradus se poate deteriora.

În fiecare sistem PP specific, datele sunt stocate în format propriu (format text în Wordfast, baza de date Access în Deja Vu), dar există un standard internațional TMX (ing. Format de schimb de memorie de traducere ), care se bazează pe XML și care poate fi generat de aproape toate sistemele PP. Datorită acesteia, traducerile realizate pot fi folosite în diferite aplicații, adică traducătorul care lucrează cu OmegaT poate folosi software-ul creat în TRADOS și invers.

Majoritatea sistemelor PP suportă cel puțin crearea și utilizarea dicționarelor utilizatorilor, crearea de noi baze de date bazate pe texte paralele (ing. aliniere), precum și extragerea semiautomată a terminologiei din texte originale și paralele.

Sisteme software populare PP

Conform recenziilor privind utilizarea sistemelor PCB, cele mai populare sisteme includ:

Wikipedia în engleză are o listă care compară capacitățile diferitelor sisteme.

Standarde și formate de memorie de traducere

  • Format TMX (Format de schimb de memorie de traducere). Acest standard permite schimbul între diferiți furnizori de memorie de traducere. TMX este un format general acceptat în mediul de traducere și este cel mai potrivit pentru importarea și exportul de memorii de traducere. Cea mai recentă versiune a acestui format, 1.4b, vă permite să recuperați documente originale și traducerile acestora dintr-un fișier TMX.
  • TBX (format Termbase Exchange). Acest format adoptat de LISA (Localization Industry Association) este în prezent revizuit și reeditat în conformitate cu ISO 30042. Acest standard permite schimbul de terminologie, inclusiv informații lexicale detaliate. Baza de bază TBX este definită de standarde: ISO 12620, ISO 12200 și ISO 16642. ISO 12620 oferă un registru de „categorii de date” bine definite cu nume standardizate care funcționează ca tipuri de elemente de date sau valori predefinite. ISO 12200 (cunoscut și ca MARTIF) oferă cadrul pentru cadrul TBX. ISO 16642 (cunoscut și sub numele de Cadrul de marcare terminologică) include un metamodel structural pentru limbaje de marcare terminologică în general.
  • SRX este conceput pentru a îmbunătăți formatul TMX și a face schimbul de memorii de traducere între programe mai eficient. Capacitatea de a specifica regulile de segmentare care au fost utilizate în traducerea anterioară crește eficiența identificării segmentelor din textul curent cu conținutul software-ului.
  • GMX GILT înseamnă globalizare, internaționalizare, localizare și traducere. Standardul GILT Metrics are trei părți: GMX-V pentru volum, GMX-C pentru complexitate, GMX-Q pentru calitate. Standardul GILT Metrics propus urmărește cuantificarea domeniului de activitate și cerințele de calitate pentru implementarea sarcinilor GILT.
  • OLIF este un standard deschis, compatibil cu XML, utilizat pentru schimbul de date terminologice și lexicale. Deși a fost folosit inițial ca o modalitate de a face schimb de date lexicale între anumite lexiconi de traducere automată, a evoluat treptat într-un standard mai general pentru schimbul terminologic.
  • XLIFF (XML Localization Interchange File Format) este creat ca un singur format de fișier de schimb care este recunoscut de toate programele de localizare. XLIFF este cea mai bună modalitate de a face schimb de informații în format XML în industria traducerilor de astăzi.
  • TransWS (Translation Web Services) definește parametrii necesari pentru invocarea serviciilor web la trimiterea și primirea fișierelor și mesajelor legate de proiectele de localizare. A fost conceput ca un sistem implementat pentru automatizarea procesului de localizare folosind servicii de pe Internet.
  • xml: tm, această abordare a memoriei de traducere se bazează pe conceptul de memorie de text, care vă permite să combinați memoria autorului și memoria de traducere. Formatul xml:tm a fost introdus de Lisa OSCAR prin XML-INTL.

Avantaje și dezavantaje

Avantaje

  • Reducerea timpului și volumului muncii traducătorului
  • Îmbunătățirea coerenței traducerii, mai ales atunci când o echipă de traducători lucrează la un singur proiect.
  • Creșterea profitului prin creșterea productivității unui traducător, a unui grup de traducători
  • Îmbunătățirea calității serviciilor prin creșterea acurateței și uniformității traducerii termenilor, în special în textele de specialitate.

Defecte

  • Poate face traducerea mai „uscă”; esența textului se pierde dacă traducerea folosind o memorie de traducere este efectuată de un traducător cu calificări scăzute
  • Adesea nu există nicio legătură între propoziţia/textul oferit de program cu propoziţiile învecinate şi cu textul în ansamblu
  • Originalul trebuie să fie în formă electronică
  • O greșeală neobservată se poate răspândi la întregul proiect.
  • Instruirea programului în sine este necesară, iar atunci când se schimbă locul de muncă, poate de mai multe ori (dacă angajatorii lucrează cu diferite programe de MT)
  • Nu este potrivit pentru toate tipurile de texte
  • Costul ridicat al software-ului licențiat

Vezi si

Literatură

  • Grabovskiy V.N. Tehnologia memoriei de traducere // Poduri. Jurnalul traducătorilor. 2004. Nr 2. - S. 57-62.

Legături

  • Nu faceți aceeași traducere de două ori // Computerra Online, 14 februarie 2005.

Note (editare)


Fundația Wikimedia. 2010.

Vedeți ce este „Memoria de traducere” în alte dicționare:

    Cuprins 1 În psihologie 2 În tehnologia calculatoarelor ... Wikipedia

    Mozaic cu o imagine... Wikipedia

    Un text într-o limbă împreună cu traducerea acestuia în altă limbă. „Alinierea textului paralel” este identificarea propozițiilor care se potrivesc în ambele jumătăți de text paralel. Colecții mari de texte paralele se numesc ...... Wikipedia

    Text paralel (bittext) text într-o limbă împreună cu traducerea acestuia în altă limbă. „Alinierea textului paralel” este identificarea propozițiilor care se potrivesc în ambele jumătăți de text paralel. Adunări mari ... ... Wikipedia

    Memoria de traducere (TM, numită uneori „Memoria de traducere”) este o bază de date care conține un set de texte traduse anterior. O înregistrare dintr-o astfel de bază de date corespunde unui segment sau „unitate de traducere” (în engleză ...... Wikipedia

Sisteme de memorie de traducere: concept și implementare 1. Ideologia truselor de instrumente TM 2. Principiul general al TM 3. Compoziția sistemului TM 4. Funcții TM 5. Revizuirea principalelor programe ale clasei Memorie de traducere: TRADOS 3. 0 Deja. Vu SDLX 3.0 Tranzit și termen. Star Word. Fisher 4 IBM Traducere. Manager 2. 0 6. Avantajele și dezavantajele TM TM

Ideologia truselor de instrumente TM Makoto Nagao, Japonia, Universitatea Kyoto. În 1982, el a propus un nou concept de traducere automată, care se baza pe afirmația că textele ar trebui traduse prin analogie cu textele traduse anterior manual. M. Nagao a numit abordarea sa față de traducerea tehnică din engleză în rusă „traducere bazată pe exemple”. Ideea lui M. Nagao a fost folosită de unii Makoto Nagao

Ce este memoria de traducere? Memoria de traducere (TM) este o bază de date care stochează traducerile finalizate. Tehnologia TM funcționează pe principiul acumulării: în procesul de traducere, segmentul original (propoziție) și traducerea acestuia sunt salvate în TM. La procesarea unui text nou primit pentru traducere, sistemul compară fiecare dintre propozițiile sale cu segmentele salvate în baza de date. Dacă se găsește un segment identic sau similar cu segmentul original, segmentul respectiv este afișat împreună cu o traducere și o potrivire procentuală. Sunt evidențiate cuvintele și expresiile care diferă de textul salvat. Astfel, traducătorul trebuie doar să traducă noile segmente și să editeze pe cele care se suprapun. Fiecare modificare sau traducere nouă este salvată în TM.

Ideologia instrumentelor TM Instrumentele TM sunt concepute pentru a stoca perechi de propoziții într-o bază de date de traducere. Fiecare astfel de pereche constă dintr-o propoziție din original și traducerea sa tehnică în altă limbă. Este posibil să plasați fragmente de text și alte formate care depășesc lungimea propoziției sau sunt doar o parte a acesteia. Dar propozițiile sunt salvate în modul automat, așa că destul de des astfel de programe sunt numite „Memorie de propoziții”.

Cum funcționează instrumentele TM Programele TM se integrează cu programele de birou, cum ar fi Word. Unele mijloace de text. dintre ele au propriile editări tehnice.Interfețele lor diferă puțin de interfețele editorilor de text care sunt uzuale pentru un traducător modern.

Memorii de traducere și instrumente de traducere Clase: MT (Traducere automată) - traducere automată sau automată; Programele CAT (traducere asistată/asistată de calculator) automatizează și facilitează munca unui traducător în diferitele sale aspecte, implementează conceptul de memorie de traducere, precum Trados, Omega. T, Deja. Vu, Word. Rapid, etc.

Cum funcționează programele CAT moderne.Programul împarte textul sursă în segmente (de regulă, acestea sunt propoziții sau părți de propoziție), iar traducătorul introduce traducerea fiecărui segment chiar sub textul sursă sau, dacă textul este prezentat în forma unui tabel, în dreapta acestuia. Traducerea segmentului este salvată împreună cu textul original. Sunt înregistrate și numele traducătorului și data traducerii (ceea ce este important pentru munca în echipă). Puteți reveni oricând la segment pentru a verifica sau modifica traducerea. Programul plasează un segment în memoria de traducere, astfel încât dacă acesta apare din nou în textul sursă, traducerea acestuia va fi inserată automat din TM. În plus, programul CAT are o funcție de căutare a potrivirii neclare: detectează segmente care sunt doar parțial similare cu cele deja traduse (de exemplu, ele coincid cu 75%) și oferă „sfaturi” pentru traducerea lor.

Sistemul de traducere automată Trados Trados este un sistem de traducere automatizată dezvoltat de compania germană Trados Gmb. H în 1992. Unul dintre liderii mondiali în clasa sistemelor de memorie de traducere (TM, stocare traduceri). Sistemul Trados include mai multe module concepute pentru a traduce texte de diferite formate: documente Microsoft Word, prezentări Power. Punct, texte HTML și alte metadate, documente Frame. Creator, Inter. Leaf etc., precum și pentru întreținerea bazelor de date terminologice (modulul Multi. Term).

Cum funcționează sistemul Trados Conceptul Memorie de traducere presupune identificarea fragmentelor din textul tradus ale căror traduceri sunt deja disponibile în baza de date a traducerilor și, din această cauză, reducerea volumului de muncă al traducătorului. Această identificare se numește aliniere sau aliniere. Fragmentele care rămân netraduse după aliniere (potrivire) sunt transmise pentru procesare manuală unui traducător sau unui sistem de traducere automată (Machine Translation, MT). În această etapă, traducătorul poate selecta fragmentele nou traduse și poate introduce noi perechi de texte paralele în două limbi în baza de date. Această schemă funcționează cel mai bine pentru texte de același tip, unde repetabilitatea frazelor este destul de mare.

Modulele principale ale sistemului Trados * Trados Workbench - modulul principal pentru traducerea documentelor, se integrează în shell-ul Microsoft Word; * Etichetă. Editor - un modul pentru traducerea documentelor în format HTML, XML etc.; * Victorie. Align - un modul pentru crearea unei memorie de traducere pe baza textelor bilingve traduse anterior; * S-Tagger - modul pentru traducerea documentelor în format Frame. Maker și Inter. Frunze; * T-Window - un modul pentru traducerea documentelor în format Power. Punct; * Multi. Termen - modul pentru menținerea glosarelor; * Extra. Termen

Ce au în comun programele de memorie de traducere - Aliniere - Aliniere - Întreținere - Program de terminologie - Editor de text - Editor de documente Concordanță

Avantajele și dezavantajele programelor din clasa Memorie de traducere Avantaje - Reducerea timpului și a volumului de muncă al traducătorului - Îmbunătățirea secvenței traducerii, mai ales atunci când mai mulți traducători lucrează la un singur proiect. - Creșterea profiturilor prin creșterea productivității muncii - Îmbunătățirea calității serviciilor prin creșterea acurateței traducerii termenilor, în special în textele de specialitate. Dezavantaje - Poate face traducerea mai „secată”, se pierde însăși esența textului - Adesea nu există nicio legătură între propoziția/textul oferit de program cu propozițiile învecinate și cu textul în ansamblu - Originalul trebuie să fie în formular electronic - O greșeală se aplică întregului proiect - Programul în sine are nevoie de pregătire, iar la schimbarea locului de muncă, este posibil și de mai multe ori (dacă angajatorii lucrează cu diferite programe TM) - Nu este potrivit pentru toate tipurile de texte - Cost ridicat

Literatură: 1. 2. 3. 4. Grabovsky VN: Tehnologia memoriei de traducere. „Poduri” 2/2004 Kutuzov, AB: Tehnologii informatice în formarea competenței profesionale a traducătorului // Limbi de comunicare profesională: colecție de articole ale celei de-a treia conferințe științifice internaționale, vol. 2. - Chelyabinsk, 2007 URL : http: // tc... utmn. ru / files / kutuzov_it. pdf Shakhova NG: Trenul pleacă din nou. Calculatorul de acasă numărul 5 1. 05. 2000 A. Silonov: Programe de ajutor pe traducător. Săptămâna calculatoarelor № 16 (238) Moscova 16 -22. 05.2000