Formátové konverze
   
Formátové konverze CSTUG


Konverze mezi TeXem/LaTeXem a ostatními

  • troff troff-to-latex (k dispozici jako CTANtroff-to-latex), jenž napsal Kamal Al-Yahya na Standfordské universitě (Kalifornie, USA), napomáhá při překladu troff dokumentu do formátu LaTeXu. Rozlišuje většinu -ms-man maker, k tomu většinu eqn a některé tbl příkazy preprocesoru. Složitější věci je potřeba dodělat ručně. Jsou podporovány dva styly souborů. Existuje také manuálová stránka (která se velmi dobře konvertuje do LaTeXu). Program má copyright, ale je zdarma. Rozšířená verze tohoto programu, tr2latex, je dostupná v CTANtr2latex

    Distribuce DECUS TeX (viz Co je CTAN) také obsahuje program konvertující troff do TeXu.

  • Scribe Mark James (jamesm@dialogic.com) vlastní kopii programu scribe2latex, kterou nemohl vyzkoušet, ale kterou přenechá každému, kdo projeví zájem. Program napsal Van Jacobson z Lawrence Berkeley Laboratory.

  • WordPerfect wp2latex (lze získat v CTANwp2latex) je program pro PC napsaný v Turbo Pascalu R. C. Houtepenem na univerzitě v Eindhovenu v Holandsku. Konvertuje dokumenty z formátu WordPerfectu 5.0 do LaTeXu. Zdrojové texty v Pascalu jsou také k dispozici. Uživatel jej přes některá omezení shledá `celkem ucházejícím'. Je vysoce hodnoceno jeho rozlišování změn fontů, ale neumí dělat indexy, obsah, okraje a grafiku a nezvládá nové prvky WordPerfectu verze 5.1, speciálně formátování rovnic. Na program je copyright, ale je zdarma.

    Glenn Geers z univerzity v Sydney, Austrálie (glenn@qed.physics.su.oz.au) přepisuje wp2latex do jazyka C a přidává některé rysy WordPerfectu 5.1, zejména jeho práci s rovnicemi. Program je v podadresáři glenn na CTANwp2latex

  • PC-Write pcwritex.arc je k dispozici v CTANpcwritex

    Jedná se o ovladač tisku pro PC-Write, který ,,tiskne`` dokument formátu PC-Write V2.71 do souboru kompatibilního s TeXem. Napsal ho Peter Flynn z University College, Cork, Irská republika.

  • runoff Konverzní program Petera Vanroose (jeho adresa je vanroose@esat.kuleuven.ac.be) je napsán ve VMS Pascalu. Zdrojové texty a běhuschopný kód pro VAX jsou dostupné v CTANrnototex

  • refer/tib Existuje několik programů pro konverzi bibliografických dat mezi BibTeXem a formátem refer/tib. Lze je nalézt v adresáři CTANrefer-tools

    Ačkoli to jeho název nenapovídá, adresář také obsahuje dávku pro převod BibTeXu do refer. Kolekce není udržována.

  • RTF Program pro konverzi z Microsoft Rich Text Format do TeXu je k mání na CTANrtf2tex. Napsal a spravuje jej Robert Lupton (rhl@astro.princeton.edu). Existuje také konvertor do LaTeXu od Erwina Wechtla v CTANrtf2latex

  • Microsoft Word Často používaný způsob je konvertovat dokument do formátu RTF a použít některý z RTF konvertorů zmiňovaných výše. Program pro přímý převod z MS-Wordu do LaTeXu je wd2latex pro MSDOS (v CTANwd2latex). Pavel Nygrýn (nygryn@fi.muni.cz) napsal program zohledňující české a slovenské znaky: http://www.fi.muni.cz/~nygryn/w2t/ Poslední verze programu mswordview umí taktéž export do LaTeXu, a to z velmi široké škály verzí Wordu.

Skupina na Ohio State University (USA) pracuje na společném dokumentovém formátu založeném na SGML s cílem, aby se libovolné formáty daly vzájemně převádět. ,,Vstupní filtry`` poskytuje FrameMaker s cílem překladu z cizího formátu (pravděpodobně včetně TeXu) do vlastního.

Další informace viz http://www.kfa-juelich.de/isr/1/texconv/texcnv.html


Konverze z TeXu/LaTeXu do holého ASCII

Zde je snahou emulovat unixový nroff, který formátuje text na obrazovce, jak jen to jde nejlépe, a to ze stejného vstupu jako unixový sázecí program troff.

Ralph Droms (droms@bucknell.edu) má stylový soubor a program, který způsobuje, že je LaTeX rovnocenný s nroff, ale neporadí si dobře s tabulkami a s matematikou. Software je dostupný v CTANtxtdist. Původní dvi2tty, který často poskytuje přijatelný výsledek, lze získat v CTANdvi2tty

Jinou možností je použít screen.sty (k nalezení na CTANu v adresáři CTANscreensty). Použijte některý z programů typu dvi2tty, můžete také zkusit CTANcrudetype. Dále je možné použít konverzní program z LaTeXu do ASCII, l2a (CTANl2a), ačkoliv je to skutečně hodně ,,odTeXovávací`` program.

Základní odTeXovávací program je detex (CTANdetex), který před zápisem na výstup smaže všechny komentáře a řídicí sekvence ze vstupu. Původním záměrem bylo připravit vstup pro jednoduchý korektor překlepů.


Převod z HTML či SGML do TeXu

Nathan Torkington (Nathan.Torkington@vuw.ac.nz) vyvinul z HTML ovladače v balíku Xmosaic od NCSA html2latex. Program načítá HTML soubor a generuje z něj soubor LaTeXový. Konverzní kód je předmětem omezení NCSA, ale kompletní zdrojový text lze získat na CTANhtml2latex

Peter Flynn vyvinul pcl program sgml2tex (pro PC). Je ovládán konfiguračním souborem a je přiložen příklad konfigurace pro překlad HTML souboru. Program je k dispozici v CTANsgml2tex


Konverze do HTML

Převod z TeXu do HTML není triviální. TeX není značkovací, ale sázecí systém, takže se koncepčně od HTML velmi liší. S LaTeXem máte víc naděje, ale ani zde není převod zadarmo. Je dobré poznamenat že a) chcete-li skutečně kvalitní Webový dokument, je lepší přepsat ho znovu, a b) HTML (i HTML3) má velmi chudé sázecí schopnosti a cokoliv netriviálního transformuje do grafiky.

LaTeX2HTML (CTANlatex2html) je balík (většinou perl dávky), který rozkládá LaTeXovský dokument na jednu či více komponent, které pak spojuje dohromady, takže se dají číst přes World-Wide Web jako hypertextový dokument. Definuje zobrazení mezi LaTeXovskými vnitřními odkazy a hyperodkazy a rozšiřuje referenční mechanismus LaTeXu, aby se zpřístupnily odkazy na jiné připojitelné dokumenty a další prostředky Internetu. Překládá akcentované a další znaky LaTeXu (jak jen to jde nejlépe) do formy, kterou dokáže zobrazit World-Wide Web prohlížeč, a zprostředkovává mechanismus, kterým se matematika a další věci, jež prohlížeč nezvládá, dají převést do obrázku, který může být začleněn do hypertextového dokumentu.

LaTeX2HTML vyžaduje Perl, PBM utility, dvips, GhostScript a jiné programy. Běží pod Unixem. V TUGboatu Vol 16(2) je publikován podrobný popis programu LaTeX2HTML a návod na jeho konfiguraci.


Vytváranie hypertextových dokumentov v TeXu

Ak chcete vytvoriť hypertextový dokument pomocou LaTeXu napríklad pre World-Wide Web, uvážte štyri technológie (prekrývajúce sa).

  1. Skúste priamu konverziu z LaTeXu do HTML (pozri Otázku Konverze do HTML);
  2. Prepíšte svoj dokument použijúc Texinfo (pozri Otázku Co je to Texinfo) a skonvertujte ho do HTML;
  3. Pozrite sa na Adobe Acrobat, elektronický systém na uchovávanie a prezeranie dokumentov. Tento systém môže zachovať úplne sadzbu Vášho dokumentu. (Pozri Otázku Vytváranie akrobatovských (PDF) dokumentov v TeXu.)
  4. Využite hyperTeX konvencie (štandardizované príkazy \special). Existujú makro-balíky, ktoré ich podporujú pre plain TeX a LaTeX.

Projekt HyperTeX má za cieľ rozšíriť funkčnosť všetkých odkazových príkazov pre LaTeX (vrátane obsahu) vytváraním príkazov \special, ktoré sú sledované DVI procesormi a vytvárajú hypertextovú štruktúru. Poskytujú všeobecné hypertextové spojenia, vrátene napojenia na vonkajšie dokumenty.

HyperTeXovská špecifikácia určuje, že príslušný prezerač/prekladač musí rozpoznávať nasledujúce príkazy \special:

  • href: html:<a href = "href_string">
  • name: html:<a name = "name_string">
  • end: html:</a>
  • image: html:<img scr = "href_string">
  • base_name: html:<base href = "href_string">

Príkazy href, nameend sa používajú na definovanie základných hypertextových operácií spojenia jednotlivých častí dokumentu.

Ďalšie detaily sú dostupné na http://xxx.lanl.gov/hypertext/. Existujú zatiaľ len dve všeobecne používané implementácie špecifikácií: modifikované xdvi a modifikované dvips. Výstup z modifikovaného dvips môže byť použitý modifikovaným programom GhostScript alebo programom Acrobat Distiller.


Vytváranie akrobatovských (PDF) dokumentov v TeXu

Existujú dve možnosti: (a) použiť program pdftex Han The Thanha pre priamy prevod z TeXu do PDF, alebo (b) previesť PostScript do PDF programom Distiller.

V prvom prípade preložíte zdrojový súbor programom pdftex. pdftex spracováva dokument rovnakým spôsobom ako TeX, ale výstup je do PDF. Informácie o tomto programe sú na ../pdftex

V druhom prípade použijete program dvips, t.j. program konvertujúci DVI súbor do PS, teda PostScriptového súboru. Výsledok necháte spracovať programom Adobe Acrobat Distiller alebo, ešte jednoduchšie, ak používate počítač Mac alebo Windows TeX, môžete inštalovať Acrobat Exchange. Vtedy môžete nadefinovať ,,vytvárač`` PDF súboru ako ďalšiu tlačiareň. V tomto prípade ale nemôžete nadefinovať ďalšie hypertextové spojenia a teda to nie je dobrá cesta, hodí sa iba na jednoduché dokumenty. Preto je treba použiť Adobe Distiller, ktorý podporuje špeciálne postscriptovské operátory, tzv. pdfmark, pre prechod informácií do PDF súboru.

Aby sme preložili všetky krížové odkazy v LaTeXu do Acrobatovských spojení, potrebujeme LaTeXovský balík, ktorý vhodne predefinuje vnútorné príkazy LaTeXu. Existujú dva takéto balíky pre LaTeX 2e, obidva založené na HyperTeXovských špecifikáciách (pozri Otázku Vytváranie hypertextových dokumentov v TeXu). Prvý je hyperref od Sebastiana Rahtza (dostupný z CTANhyperref a druhý je hyper od Michaela Mehlicha (CTANhyper). Potom použijete dvips (modifikovaný dvips) a preložíte DVI súbor do PostScriptu, ktorý je akceptovateľný pre program Distiller. Alternatívne, keď chcete použiť iba Acrobat, hyperref má v sebe tzv. ,,native PDF mode``, ktorý pracuje so štandardným dvips (a väčšinou iných prekladačov) a dáva všetky možnosti využitia pdfmark.

Bohužiaľ Distiller nie je voľne dostupný program. Pokiaľ nemáte Acobat Reader, tak GhostScript (verzia 3.51 a neskoršie) môže zobrazovať PDF súbory. Čoskoro sa dočkáme aj prekladača z DVI do PDF formátu.

Inou možnosťou je použiť


CSTUG
(c) 12.05.2000 18:52 Libor Škarvada, Tomáš Hudec, Aleš Vítek
Připomínky, opravy a zejména odpovědi na další časté otázky posílejte na adresu cstug-faq@cstug.cz
Připomínky k HTML verzi posílejte na adresu libor@fi.muni.cz nebo hudec@fi.muni.cz.