Trados - separátor segmentů
Thread poster: Milan Sochor
Milan Sochor
Milan Sochor  Identity Verified
Czech Republic
Local time: 17:40
German to Czech
+ ...
Sep 30, 2012

Vážení kolegové,
prosil bych o radu: Zákazník chce přeložit DOC soubor, který údajně vytvořil konverzí z PDF. DOC soubor má ale "tvrdé" konce řádků - jako když se psalo na psacím stroji, to znamená, že se ve Wordu, když zvolím "Zobrazit vše", objeví na konci řádku znak pro odřádkování (bohužel to sem nedokážu překopírovat).
Když takový text překládám Tradosem, tak výchozí segment skončí tímto odřádkováním a nikoli koncem věty, tak
... See more
Vážení kolegové,
prosil bych o radu: Zákazník chce přeložit DOC soubor, který údajně vytvořil konverzí z PDF. DOC soubor má ale "tvrdé" konce řádků - jako když se psalo na psacím stroji, to znamená, že se ve Wordu, když zvolím "Zobrazit vše", objeví na konci řádku znak pro odřádkování (bohužel to sem nedokážu překopírovat).
Když takový text překládám Tradosem, tak výchozí segment skončí tímto odřádkováním a nikoli koncem věty, takže je efektivita Tradosu značně snížena.
Mám takový pocit, že ve starších verzích Tradosu to šlo nějak nastavit, i když jsem to nezkoušel. Jde to v Tradosu 2011? Nebo to můžu nějak ovlivnit ve Wordu? Děkuji za každou radu.
Milan
Collapse


 
Vladimír Hoffman
Vladimír Hoffman  Identity Verified
Slovakia
Local time: 17:40
Member (2009)
English to Slovak
+ ...
No, toto nie je uplne banalna uloha, Sep 30, 2012

ale riesit sa da. Ja postupujem takto:

1. Vo Worde CTRL+F a do okienka Hladat vlozit znak pre koniec riadku /ta zahnuta sipka vpravo/, do okienka Nahradit cim znak pre koniec odseku /Vybrat zo specialnych znakov alebo ^p/. To je jednoduchy zaciatok, ak to problem nevyriesi /cize ak budu riadky zalomene niekde v polovicke/, pokracujeme dalej.

Napiste, ci to funguje, tento problem riesim velmi casto pri vytvarani pamati z textov prevzatych z webu, takze na to mam vyporac
... See more
ale riesit sa da. Ja postupujem takto:

1. Vo Worde CTRL+F a do okienka Hladat vlozit znak pre koniec riadku /ta zahnuta sipka vpravo/, do okienka Nahradit cim znak pre koniec odseku /Vybrat zo specialnych znakov alebo ^p/. To je jednoduchy zaciatok, ak to problem nevyriesi /cize ak budu riadky zalomene niekde v polovicke/, pokracujeme dalej.

Napiste, ci to funguje, tento problem riesim velmi casto pri vytvarani pamati z textov prevzatych z webu, takze na to mam vyporacovany postup.




Milan Sochor wrote:

Vážení kolegové,
prosil bych o radu: Zákazník chce přeložit DOC soubor, který údajně vytvořil konverzí z PDF. DOC soubor má ale "tvrdé" konce řádků - jako když se psalo na psacím stroji, to znamená, že se ve Wordu, když zvolím "Zobrazit vše", objeví na konci řádku znak pro odřádkování (bohužel to sem nedokážu překopírovat).
Když takový text překládám Tradosem, tak výchozí segment skončí tímto odřádkováním a nikoli koncem věty, takže je efektivita Tradosu značně snížena.
Mám takový pocit, že ve starších verzích Tradosu to šlo nějak nastavit, i když jsem to nezkoušel. Jde to v Tradosu 2011? Nebo to můžu nějak ovlivnit ve Wordu? Děkuji za každou radu.
Milan


Collapse


 
Milan Sochor
Milan Sochor  Identity Verified
Czech Republic
Local time: 17:40
German to Czech
+ ...
TOPIC STARTER
Zatím nic Sep 30, 2012

Vladímíre - zdravím a děkuji.
Omlouvám se, že reaguji se zpožděním, ale celou tu dobu hledám možnosti, ale nic mně nefunguje.
Vypadá to logicky,
ale nějak se mě nedaří vložit příslušné znaky.
Můj postup:
Ve Wordu kliknu napravo na "Najít" /za symbolem dalekohledu/
Kliknu na "Vložení" pak "Symbol", podsada "Západoevropská latinka-dodatek" najdu si znak ¶, ten se mi vloží do Word souboru, ten nakopíruji do sloupce vlevo pod "Navi
... See more
Vladímíre - zdravím a děkuji.
Omlouvám se, že reaguji se zpožděním, ale celou tu dobu hledám možnosti, ale nic mně nefunguje.
Vypadá to logicky,
ale nějak se mě nedaří vložit příslušné znaky.
Můj postup:
Ve Wordu kliknu napravo na "Najít" /za symbolem dalekohledu/
Kliknu na "Vložení" pak "Symbol", podsada "Západoevropská latinka-dodatek" najdu si znak ¶, ten se mi vloží do Word souboru, ten nakopíruji do sloupce vlevo pod "Navigace" , ale neobjeví se mě žádný výskyt. Když tento znak nakopíruji přimo v "postiženém" textu a vložím pod "Navigace", neobjeví se v okénku vůbec nic a výskyt taky žádný.
Když jsem zvolil v Najít možnost rozšířené hledání a vkládal jsem různé pod "Zvláštní",tak jediný znak, který našel odpovídající počet výskytů byl ^p-Znak konce odstavce; znak ^l - ručně zadaný počet řádků, ani ^v- znak odstavce, což je v tabulce možností zobrazeno také jako ¶ , nepřinesly nic.
Takže možná ^p-znak konce odstavce je to, co hledám, ale nevím, čím to nahradit.
Mám Word 2010.

Milan
Collapse


 
Vladimír Hoffman
Vladimír Hoffman  Identity Verified
Slovakia
Local time: 17:40
Member (2009)
English to Slovak
+ ...
Je to ten znak konca odstavca, Sep 30, 2012

^p. Do Najit dajte ^l /to je manualny zlom riadku/, do Nahradit ^p /to je znak konca odstavca/. Potom si upraveny text oznacte, dajte ho zarovnat k okraju (Cez Format/Odsek) a dajte si zobrazovat skyte znaky (ikonka ¶ na liste). Hned uvidite, ci to zabralo, ked nie, skusime dalej.

Ja by som vam to kludne urobil sam, nie je to tazke, ale teraz dost nestiham s prekladom. Pozriem sa sem o dve hodiny, dajte vediet ako to vyslo.

Milan Sochor wrote:

Vladímíre - zdravím a děkuji.
Omlouvám se, že reaguji se zpožděním, ale celou tu dobu hledám možnosti, ale nic mně nefunguje.
Vypadá to logicky,
ale nějak se mě nedaří vložit příslušné znaky.
Můj postup:
Ve Wordu kliknu napravo na "Najít" /za symbolem dalekohledu/
Kliknu na "Vložení" pak "Symbol", podsada "Západoevropská latinka-dodatek" najdu si znak ¶, ten se mi vloží do Word souboru, ten nakopíruji do sloupce vlevo pod "Navigace" , ale neobjeví se mě žádný výskyt. Když tento znak nakopíruji přimo v "postiženém" textu a vložím pod "Navigace", neobjeví se v okénku vůbec nic a výskyt taky žádný.
Když jsem zvolil v Najít možnost rozšířené hledání a vkládal jsem různé pod "Zvláštní",tak jediný znak, který našel odpovídající počet výskytů byl ^p-Znak konce odstavce; znak ^l - ručně zadaný počet řádků, ani ^v- znak odstavce, což je v tabulce možností zobrazeno také jako ¶ , nepřinesly nic.
Takže možná ^p-znak konce odstavce je to, co hledám, ale nevím, čím to nahradit.
Mám Word 2010.

Milan


 
Milan Sochor
Milan Sochor  Identity Verified
Czech Republic
Local time: 17:40
German to Czech
+ ...
TOPIC STARTER
To nejde Sep 30, 2012

Děkuji Vladimíre,
ale když zadám ^l - manuální zlom řádku a vyhledání, tak mi to nic nenajde, takže to ani nemůže nic nahradit. Když zadám vyhledat ^p-znak konce odstavce a nahradit (třeba)mezerou, tak mě sice manuální zlomy odstraní, ale také všechny skutečné konce odstavce, které tam mají zůstat, což je sice o něco málo lepší, ale taky to moc neřeší.


Moc děkuji za snahu
Milan


 
Daniel Meier
Daniel Meier  Identity Verified
Local time: 17:40
English to German
+ ...
Priprava dokumentu Sep 30, 2012

V danem pripade bych nejprve pripravil odstavce, ktere tam maji zustat, tzn. prechodne nahradit tyto znaky (tam kde skutecne je odstavec!) budto rucne nebo pres hledat/nahradit libovolnym znakem, napr. $$
Potom nahradit zbyvajici znaky konec odstavce (rucne zalomene radky) mezerou.
V zaveru pak vratit $$ zpet na znak konec odstavce.
Pokud je dokument vytvoren z PDF, mohou tam byt jeste dalsi zaludnosti (tagy kolem mezer apod.). Nez zacnu prekladat, tak si takovy doument radeji
... See more
V danem pripade bych nejprve pripravil odstavce, ktere tam maji zustat, tzn. prechodne nahradit tyto znaky (tam kde skutecne je odstavec!) budto rucne nebo pres hledat/nahradit libovolnym znakem, napr. $$
Potom nahradit zbyvajici znaky konec odstavce (rucne zalomene radky) mezerou.
V zaveru pak vratit $$ zpet na znak konec odstavce.
Pokud je dokument vytvoren z PDF, mohou tam byt jeste dalsi zaludnosti (tagy kolem mezer apod.). Nez zacnu prekladat, tak si takovy doument radeji vzdy v TagEditoru prochazim a pripadne se jeste vratim a doupravim original. Myslim, ze je lepsi venovat priprave dokumentu tech par minut navic, nez se pak trapit mnozstvim zbytecnych tagu.
Collapse


 
Milan Condak
Milan Condak  Identity Verified
Local time: 17:40
English to Czech
PlusTools v MS Wordu Sep 30, 2012

Milan Sochor wrote:

Jde to v Tradosu 2011? Nebo to můžu nějak ovlivnit ve Wordu? Děkuji za každou radu.
Milan


Ze stránek www.wordfast.net je možno stáhnout PlusTools.dot. Tato šablona umí vyextrahovat do DOCu text bez fontů nebo s fonty.
Pro úpravu formátováni odstavců a segmentů, stačí spustit MS Word + PlusTools, otevřít soubor a zašktnout jej. Na stránce Conv (konverze) stisknout tlačítko vpravo dole "Recreate paragraphs in current doc" .

Pokud nepotřebuji formátování a stačí mi jen segmentace, tak buď na extrakci do textu použiji LF Aligner. Další možností je uložit otevřený PDF (pokud jej mám) jako TXT a uložit jako UTF-8.

Tuto metodu jsem použil pro strojový překlad studií EU, všechno to jsou PDF

http://www.condak.net/lekce/eu-q-manag/encs/001.html

S pozdravem,

Milan Čondák


 
Vladimír Hoffman
Vladimír Hoffman  Identity Verified
Slovakia
Local time: 17:40
Member (2009)
English to Slovak
+ ...
Presne! Sep 30, 2012

Toto je to pokracovanie, keby prvy postup nezabral. Splietlo ma, ze kolega hovoril o "tvrdych koncoch riadkov".

Daniel Meier wrote:

V danem pripade bych nejprve pripravil odstavce, ktere tam maji zustat, tzn. prechodne nahradit tyto znaky (tam kde skutecne je odstavec!) budto rucne nebo pres hledat/nahradit libovolnym znakem, napr. $$
Potom nahradit zbyvajici znaky konec odstavce (rucne zalomene radky) mezerou.
V zaveru pak vratit $$ zpet na znak konec odstavce.



 
Milan Sochor
Milan Sochor  Identity Verified
Czech Republic
Local time: 17:40
German to Czech
+ ...
TOPIC STARTER
Díky Sep 30, 2012

Děkuji všem kolegům, kteří se v neděli zabývali mým problémem.
Vyzkouším vše, bohužel však dnes musím (pro stejného zákazníka) dokončit jiný překlad.
Domníval jsem se, že je nějak možno "zlomit" Trados 2011, aby za konec segmentu považoval tečku a ne nějaký formátovací znak.
Znova děkuji, přeji všem spoustu dobře placené práce a pokud nějaká rada pomůže, rád se podělím o výsledek.
Milan


 
Vladimír Hoffman
Vladimír Hoffman  Identity Verified
Slovakia
Local time: 17:40
Member (2009)
English to Slovak
+ ...
Nema problema:-) Sep 30, 2012

Postupujte takto:

1. CTRL+F Najit .^p /to je bodka + koniec odstavca/ Nahradit .qqq^p
1. CTRL+F Najit :^p Nahradit :.qqq^p

Potom si pozrite text pri zapnutom zobrazovani skryych znokov a za kazdy odsek, ktory by ste este chceli zachovat zalomeny (povedzme nadpisy, vety konciace ; a pod.) vlozte ten retazec qqq. Pozor, este pred znak konca odstavca (to je to ¶)

Ked mate pripravu hotovu, pokracujte.
1. CTRL+F Najit ^p Nahradit " " /jedna medzera,
... See more
Postupujte takto:

1. CTRL+F Najit .^p /to je bodka + koniec odstavca/ Nahradit .qqq^p
1. CTRL+F Najit :^p Nahradit :.qqq^p

Potom si pozrite text pri zapnutom zobrazovani skryych znokov a za kazdy odsek, ktory by ste este chceli zachovat zalomeny (povedzme nadpisy, vety konciace ; a pod.) vlozte ten retazec qqq. Pozor, este pred znak konca odstavca (to je to ¶)

Ked mate pripravu hotovu, pokracujte.
1. CTRL+F Najit ^p Nahradit " " /jedna medzera, tie uvodzovky tam nepiste/. Cely text vam to sprace do jednej hromady, ako ste pisali. A nakoniec:

1. CTRL+F Najit qqq Nahradit :^p

A mate to pozalamovane tam, kde ste chceli. Pre istotu to ale robte na zaloznej kopii, potom si ju premenujte na original.

Milan Sochor wrote:

Děkuji Vladimíre,
ale když zadám ^l - manuální zlom řádku a vyhledání, tak mi to nic nenajde, takže to ani nemůže nic nahradit. Když zadám vyhledat ^p-znak konce odstavce a nahradit (třeba)mezerou, tak mě sice manuální zlomy odstraní, ale také všechny skutečné konce odstavce, které tam mají zůstat, což je sice o něco málo lepší, ale taky to moc neřeší.


Moc děkuji za snahu
Milan
Collapse


 
Milan Condak
Milan Condak  Identity Verified
Local time: 17:40
English to Czech
Jak funguje LF-Aligner Sep 30, 2012

Milan Condak wrote:
Pokud nepotřebuji formátování a stačí mi jen segmentace, tak buď na extrakci do textu použiji LF Aligner.

S pozdravem,
Milan Čondák


LF-Aligner obsahuje skripty a programy pro Perl (a Windows) + data pro jednotlivé jazyky

1. PDF je převeden do TXT pomocí programu pdftotext

2. Textový soubor je nasegmentován pomocí programu split-sentences

3. V souborech nonbreaking_prefix jsou zkratky, které obsahují tečky, tj. výraz před tečkou nemá ukončit větu.

V programu je pouze 20 jazyků, soubory je možno editovat nebo vytvořit nové pro další jazyky.

Programy není nutno instalovat. Stačí je stáhnout a odzipovat.

http://sourceforge.net/projects/aligner/files/latest/download

Milan


[Upraveno: 2012-10-01 07:39 GMT]


 
Milan Sochor
Milan Sochor  Identity Verified
Czech Republic
Local time: 17:40
German to Czech
+ ...
TOPIC STARTER
Poděkování Sep 30, 2012

Děkuji znovu všem.
Zkoušel jsem hlavně návod Vladimíra, dostal jsem se poněkud jiným způsobem (ale na základě jeho námětů) k nějakému výsledku, ale: v tom souboru je ještě spousta "konců odstavců" které by bylo nutné zachovat a tak by příprava byla neúnosná.
Zkusím to ještě uzadavatele.
Děkuji zdravím a hodně štěstí při práci.
Milan


 


There is no moderator assigned specifically to this forum.
To report site rules violations or get help, please contact site staff »


Trados - separátor segmentů






TM-Town
Manage your TMs and Terms ... and boost your translation business

Are you ready for something fresh in the industry? TM-Town is a unique new site for you -- the freelance translator -- to store, manage and share translation memories (TMs) and glossaries...and potentially meet new clients on the basis of your prior work.

More info »
Protemos translation business management system
Create your account in minutes, and start working! 3-month trial for agencies, and free for freelancers!

The system lets you keep client/vendor database, with contacts and rates, manage projects and assign jobs to vendors, issue invoices, track payments, store and manage project files, generate business reports on turnover profit per client/manager etc.

More info »