Projekt: Hesla Jednoty bratrské/2010
Projekt: Hesla Jednoty bratrské – příprava Hesel pro rok 2010
Spolupodílí se
editovat- Kychot: organizace celého projektu, editace, programování, databáze
- Friedrich Reinhardt V.: manuskript pro překlad
- Česká biblická společnost: Poskytnutí práv k použití českého ekumenického překladu (ČEP)
- Mirek: převod prvního pololetí; autorská korektura
- Jindra: převod druhého pololetí; autorská korektura
- Slávek: PHP interface pro editaci; sazba v TeXu; obálka
- Iny: závěrečná korektura
- tiskárna J+H (tisk)
- Jiří Vičík: zakomponování Hesel do konkordance ICASI bible
Pracovní adresáře
editovatPostup práce rozdělený na etapy (pracovní adresáře). Uvádím je důležitější soubory (milníky).
Do října roku 2008 probíhaly přípravy k tisku a tisk Hesel na rok 2009 a následně až do prosince probíhala jejich distribuce. Práce na Heslech pro rok 2010 začala letos se zpožděním až v únoru 2009.
w01-los-odt
editovat2009-02-06
editovatUleožení původního německého manuskriptu v ODT.
- Losungen2010.doc – manuskript i s předmluvou (vytvořený 2008-06-03, došel 2008-07-18), 144 stran formátu Letter (21.59 x 27.94 cm na výšku).
- Losungen2010.odt – pův. dokument načten OpenOffice.org Writer v. 2.4.1 a uložen ve formátu ODT
w02-los-txt
editovat2009-02-06
editovatExtrakce textového souboru z ODT.
- /los10odt-make, strip.pl, styles.pl – skriptíky, které z ODT extrahují text
- /los10-03.txt – výsledný soubor (ukázka); mezi číslem a názvem knihy letos jsou mezery, tj. např. "5. Mose"
Je otázka, jestli to má smysl a jestli nestačí ODT (či původní DOC) soubor normálně exportovat jako textový. Původní myšlenka byla, že skripty pro další konverzi by mohly nějak využít formátování dokumentu k tomu, aby podle něj mohly lépe odlišit obsah. Současné skripty však této možnosti příliš nevyužívají, jen občas (např. k vyrušení kurzívy, která by se stejně ale při konverzy do plain textu ztratila).
w03-los-pre
editovat2008-02-06, 2008-02-19, 2008-02-20
editovatKonverze do formátu PRE
- /herr.pl – odstraní zalomení řádek, způdobené přechodem na kurzívu v textu (hlavně u zvýrazněného slova Herr)
- los10pre.pl – skript (417 řádek) se snaží vstupní textový soubor konvertovat do formátu PRE (ještě s drobnými chybami)
- /los10make-pre – dělá menší meziúpravy a volá výše uvedené skripty
- Výše uvedený skript skončí a vyhodí chybu pokaždé, když dojde k nějaké nesrovnalosti. Proto je nutné neustále vstupní textový soubor podle chybových hlášek opravovat tak dlouho, až skript proběhne bez chyby. Což znamená řádově asi tak 100 editací.
- poslední verze los10-08.txt = los10-08g.txt je ta, ze které se už dá vygenerovat:
- los10-09.pre – výsledný soubor ve formátu PRE (ukázka) – od Adventu se projevuje chyba, že odkazy na Perikopu Pr> jsou tam dvakrát
w04-los-pre
editovat2008-02-21
editovatVygenerovaný soubor PRE ovšem obsahuje ještě množství dalších chyb, které je nutno opravit:
- /los10-10.pre – po ruční editaci ze souboru los10-09.pre
- /los10pre.pl – opravený skript
- los10-11.pre – jeho výstup
- los10-12.pre – ručně editovaný soubor
w05-los-hes
editovat2008-03-13 – 2008-03-14
editovatPřeklad německých Losungen do českých Hesel
- /hes10kni.tab – tabulka názvů biblických knih a zkratek v různých jazycích
- /los10hes.pl – skript (453 řádků), který překonvertuje odkazy z německého souboru los10-13.pre do češtiny hes10-13.pre. Přitom ještě nutno zase vychytávat chyby ve vstupním souboru, takže postupně vznikají různé verze.
- /mezerypryc.pl – skriptíček, který vyhodí mezery mezi číslem a názvem biblické knihy
- /predigt.pl – skriptíček, který hodí odkazy na perikopy do zvláštního řádku
- hes10-18.pre – prozatímní výsledek, jen české odkazy do bible bez veršů.
w06#old-hes-pre
editovat2008-03-14, 2008-03-19
editovatTento adresář obsahuje postup, kde adresáře s biblickými texty obsahovaly drobné chyby (zdvojení mezer v textech).
- /eku, /kra – adresáře s biblickými texty. Oproti loňsku je bylo nutné překonvertovat do utf-8
- /hes10bib.pl – skript, který k odkazům dohledá příslušné verše z kralické nebo ekumenické bible. Tak, jak postupně hlásí různí chyby, se opět musí editovat vstupní soubory:
- /hes10-20.pre – odkazy ještě bez veršů
- /hes10-21.pre – už doplněné biblické verše
- /hes10-22.pre – ruční editace v závislosti na chybách při cpaní do databáze (viz dále)
- /hes10stru.sql – struktura MySQL databáze
- comment – komentáře na koci dnů, výročí atd.
- day – zvláštní dny, neděle, svátky, důležité dny, týdny: 'sunday','holiday','important','week'
- dayname – názvy dnů v příslušných jazycích, jak se budou tisknout do hesel, např: 23. sobota
- drittetext – tzv. třetí text z německých losungen
- losung – biblické verše (hesla) spolu s odkazy do bible
- reading – biblická čtení
- song – sloky písní
- /hes10pre-sql.pl – skript (321 řádek), který to z .PRE nacpe do MySQL databáze
- los10-19.pre – dtto pro německé texty Losungen
- los10pre-sql.pl – dtto pro německé texty Losungen
- /make-bib+sql – dávkový soubor, který dobaví biblické verše a celé to nacpe do databáze
Tohle není teď potřeba, když to cpu do databáze:
- /strip-swap.pl – vyhodí vše, co se nebude psát do Hesel a přehodí odkazy ze svátků a nedělí za následující den a perikopy dá do zvláštního souboru.
- /hes10-21.pre – už prohozená biblická čtení na správné místo
w06-hes-pre
editovat2008-03-25, 2008-03-26
editovatDatabáze s biblemi byly opraveny pomocí postupné aplikace příkazů (abych měl přehled o výskytu těch dvojmezer v textu, hlavně byly na koncích řádků):
grep -l ' ' *
perl -i.bak -pe 's/ +$//;' *
grep -l ' ' *
rm *.bak
perl -i.bak -pe 's/ / /;' *
grep -l ' ' *
(Vyskytla se i jedna trojmezera, doopravená ručně)
Dále se zhruba opakoval postup dle původního adresáře w06:
- /eku, /kra – adresáře s biblickými texty – už vyházené ty opakované mezery
- /hes10bib.pl – skript, který k odkazům dohledá příslušné verše z kralické nebo ekumenické bible. Tak, jak postupně hlásí různí chyby, se opět musí editovat vstupní soubory:
- /hes10-20.pre – odkazy ještě bez veršů – zůstal stejný
- doplnění veršů:
perl -w hes10bib.pl hes10-20.pre > hes10-21.pre
- /hes10-21.pre – už doplněné biblické verše
- skript hes10bib.pl má chybičku – při doplnění dvou veršů mezi ně dává navíc mezeru
- Nyní je nutno udělat patch z proběhlých oprav ve starém adresáři:
cd ../w06#old-hes-pre
diff -C 2 hes10-21.pre hes10-22.pre > hes10patch-21-22.pre
cd ../w06-hes-pre
mv ../w06#old-hes-pre/hes10patch-21-22.pre .
patch -o hes10-22.pre hes10-21.pre hes10patch-21-22.pre
- /hes10-22.pre – výsledný přepatchovaný soubor
- /make-bib – dávkový soubor, který dobaví biblické verše
w07-sql
editovat2008-03-27
editovatNacpu PRE soubory do MySQL databáze:
- /hes10stru.sql – struktura MySQL databáze
- comment – komentáře na koci dnů, výročí atd.
- day – zvláštní dny, neděle, svátky, důležité dny, týdny: 'sunday','holiday','important','week'
- dayname – názvy dnů v příslušných jazycích, jak se budou tisknout do hesel, např: 23. sobota
- drittetext – tzv. třetí text z německých losungen
- losung – biblické verše (hesla) spolu s odkazy do bible
- reading – biblická čtení
- song – sloky písní
- /hes10pre-sql.pl – skript (321 řádek), který to z .PRE nacpe do MySQL databáze
- los10-19.pre – dtto pro německé texty Losungen
- los10pre-sql.pl – dtto pro německé texty Losungen
- /make-sql – dávkový soubor, který to celé to nacpe do databáze
w08-php
editovat2009-03-13, 2009-03-19, 2009-03-20
editovatPHP skripty pro editování záznamů v databázi:
- Projekt: Hesla Jednoty bratrské/index_php – hlavní skript
- Projekt: Hesla Jednoty bratrské/functions.php – funkce, které volá
- Projekt: Hesla Jednoty bratrské/styl.css – kaskádové styly
2009-03-27
editovatTestuji ta Hesla v té databáze na lokálním stroji. Vidím, že např. 2010-07-05 je heslo z 1.Královská 19,11-12 tak dlouhé, že se mi nevejde do pole varchar(255). Problém je v tom, že se obávám, že ta stará verze MySQL, kterou má Mirek, nemusí delší pole umět. Tak prozkoumávám Projekt: Hesla Jednoty bratrské/2009 a zjišťuji, že nakonec jsem to dělal na MySQL 5.0, se kterou už by problémy neměly být, takže to byla asi chyba.
Vracím se do adresáře w07:
w07-hes-sql
editovat2008-03-27
editovat– skoro celý den
- hes10stru.sql – opravená struktura databáze
- make-sql – batch soubor, který to tam nacpe voláním skriptů los10pre-sql.pl a hes10pre-sql.pl
- hes10-23.pre – ručně editovaný soubor, editovány výskyty uvozovek
- dále zjišťuji, že mám chyby v datech u hesel měsíců. Nechápu, jak to mohlo vloni projít. Takže ručně edituji soubory hes10-23.pre, los10-19.pre:
- hes10-24.pre, hes10-20.pre – opravené soubory (datum před heslo měsíce)
w09-test
editovatOtestuji si, jak mi to půjde z té MySQL databáze zase tahat ven:
- Odvyberu kralické překlady:
USE `hes10test`;
UPDATE `losung` SET `sel` = 0 WHERE `transl` = "kra";
- hes10sql-dump.pl – jednoduché vydupování databáze do texťáku, podobného PRE
- hes10sql-pre.pl – konverze do PRE
- hes10sql-rannichvilky.pl – generování ranních chvilek
- nakonec přehodím do XML - celkem to prošlo
w10-www
editovat2009-03-28
editovatUpload na WWW server:
Na WWW server byly poocí FTP nejdříve uploadovány PHP skripty. Pokud byla databáze ještě prázdná, hlásily chybu:
Heslo měsíce: Warning: mysql_num_rows(): supplied argument is not a valid MySQL result resource in /.../www/hesla-test/functions.php on line 54
Tu chybu by chtělo ošetřit.
Tabulky z lokální databáze vydumpovány (=exportovány) příkazem např:
mysqldump -uuživatel -pheslo hes10test > hes10test.sql
(velikost 663 KB) a poté importovány na WWW server s pomocí phpmyadmina:
Import byl úspěšně dokončen, bylo provedeno 88 dotazů. |
Tabulka | Záznamů | Typ | Porovnávání | Velikost | Navíc |
---|---|---|---|---|---|
comment | 16 | MyISAM | utf8_czech_ci | 3.2 KiB | - |
day | 156 | MyISAM | utf8_czech_ci | 11.6 KiB | - |
dayname | 730 | MyISAM | utf8_czech_ci | 32.1 KiB | - |
drittetext | 365 | MyISAM | utf8_czech_ci | 98.5 KiB | - |
losung | 2 421 | MyISAM | utf8_czech_ci | 424.1 KiB | - |
reading | 1 844 | MyISAM | utf8_czech_ci | 97.2 KiB | - |
song | 63 | MyISAM | utf8_czech_ci | 3.5 KiB | - |
Celem 7 tabulek | 5 595 | MyISAM | utf8_czech_ci | 670.2 KiB | 0 B |
w11-od_mirka
editovat2009-06-30
editovat- U Mirka jsem si vydumpoval databázi Hesel, která editoval, do souboru hes10mirek1.sql (678 kB).
2009-07-18
editovat- Vytvořil jsem databázi hes10mirek a importoval tam výše uvedený soubor. Po importu:
Tabulka | Záznamů | Typ | Porovnávání | Velikost | Navíc |
---|---|---|---|---|---|
comment | 16 | MyISAM | utf8_czech_ci | 3.2 KiB | - |
day | 156 | MyISAM | utf8_czech_ci | 11.6 KiB | - |
dayname | 730 | MyISAM | utf8_czech_ci | 32.1 KiB | - |
drittetext | 365 | MyISAM | utf8_czech_ci | 98.5 KiB | - |
losung | 2 428 | MyISAM | utf8_czech_ci | 324.9 KiB | - |
reading | 1 844 | MyISAM | utf8_czech_ci | 97.2 KiB | - |
song | 123 | MyISAM | utf8_czech_ci | 17.0 KiB | - |
Celem 7 tabulek | 5 662 | MyISAM | utf8_czech_ci | 654.6 KiB | 0 B |
- Lehce jsem databázi přehlédnul a zase exportoval do hes10mirek2.sql (celkem zbytečně, jen pro kontrolu)
- Kontrolní dump dat z databáze:
./hes10sql-dump.pl > hes10-01.dump
- generování souboru .PRE z databáze:
./hes10sql-pre.pl > hes10-01.pre
- ladění skriptu hes10sql-pre.pl:
- y>, m> (heslo roku a měsíce)
- $intro
- comment _>
- Zdroj "2.Thessalonicher 2,16-17" má délku 24 znaků a nevešel se do pole 20 znaků, proto změněno losung.source=varchar(25)
- nakonec:
./hes10sql-pre.pl > hes10-03.pre
- Hledání chyb v hes10-03.pre a podle toho se ladí skript a opravují data přes PHP rozhraní v databázi
./hes10sql-pre.pl > hes10-04.pre
- Zpěvníky:
- EZ
- EZD = Evangelický zpěvník Dodatek, Kalich 2007, ISBN: 978-80-7017-055-7
- Svítá
- ZCČSH = Zpěvník Církve československé husitské, Blahoslav v ÚCN Praha 1977
- 2010-08-15 EZD 631,3+5
./hes10sql-pre.pl > hes10-05.pre cp -p hes10-05.pre hes10-06.pre emacs -nw hes10-06.pre
Query replace: ' ' -> ' ' Replaced 206 occurrences Query replace: ' \n' -> '\n' Replaced 913 occurrences
- Příště: generovat názvy měsíců do .PRE
perl -ne 'print if /2010$/; next if /^\#/; print' < hes10-06.pre > hes10-06.txt oowriter hes10-06.txt
- tisk archů pro autorské korektury
- vysvětlivky hes10vys.txt
- export databáze do hes10mirek3.sql
w12-aut_korekt
editovat2009-08-03 pondělí
editovatcca 21:00 – 23:00 hod:
Dostal jsem od Mirka korektury Hesel (na papíře). Letos jsem autorské korektury editoval v textovém souboru, nikoli v databázi (což byla zásadní chyba, přílišná unáhlenost):
cp -p hes10-06.pre hes10-07.pre emacs -nw hes10-07.pre
Query replace: Kristus říká / Ježíš řekl (Replaced 11 occurrences) Query replace: Kristus řekl / Ježíš řekl (Replaced 2 occurrences)
Korektura leden - červen.
2009-08-04 úterý
editovatcca 10:00 – 10:45 – korektura červenec - prosinec
Poznámky:
- 04-05: 1.Paralipomenon 29,12 K – nevejde se odkaz?
- 09-12: dvě sloky – ošetřit rozdělovník
Další postup
- phpmyadmin: Database hes10mirek has been copied to hes10-07, structure only
- hes10pre-sql.pl
- CHYBA: nenačítají se datumy. Proč? CHYBY ve skriptu hes10sql-pre.pl
- při konverzi .pre ve fázi w11 za datumem není den v týdnu, ale tím to není
- chybí tagy před názvy dnů, to už je ten problém; Doplním skriptíkem tagy_dnu.pl:
- CHYBA: nenačítají se datumy. Proč? CHYBY ve skriptu hes10sql-pre.pl
#! /usr/bin/perl -w
while (<>) {
s/^\d{1,2}\. (Pondělí|Úterý|Středa|Čtvrtek|Pátek|Sobota)/x>$&/;.
s/^\d{1,2}\. Neděle/+>$&/;.
print;
}
./tagy_dnu.pl hes10-07.pre > hes10-08.pre
Další chyby i při:
diff -B -b hes10-09.pre hes10-10.pre > hes10-09-10.pre.diff
- názvy týdnů a nedělí jsou před sobotou – protože mají chybně uvedený o 1 den menší datum – protože se ta chyba táhne už od /w09-test
- tak jsem to opravil ručně na souboru hes10-09.pre
- SR, CR a písně se neukládají do databáze (při běhu skriptu hes10sql-pre.pl to hází warningy) – no jasně, předtím tam byly tagy 1-> 2-> a teď SR> CR>
- Ještě nejsou udělané písně!
Zkrátka ten skript hes10sql-pre.pl nefunguje obecně, jak jsem si původně naivně myslel.
ranni_chvilky
editovatPodadresář
los-xml
editovatAž se to bude dávat do XML:
- los10xml.pl – loňský skript na generováni XML z PRE, délka 779 řádků – nepřehledný macek a musí mít PRE rozdělené po měsících.
prozatímní výsledek
editovat- 2009-08-04 17:45 hes10-10.pre – poslední verse souboru PRE
w13-korekt_pro_inyse
editovat2009-09-18 pátek
editovat- Úkol:
- podle korektur od br. Vlasty Maláče opravit PRE
- generovat předběžnou sazbu celých Hesel 2010 pro záverečnou korekturu pro Inyše
11:00 – 12:40
editovat- Soubory:
- ranni-chvilky2010_B.doc – soubor s vyznačenými korekturami od Vlasty. I když má extenzi .doc, není to Wordovský dokument, ale textový v kódování UTF-8, akorát má konce řádků CR+LF. Chyby vyznačeny ???
- hes10-11.pre – editovaný soubor PRE
- hes10-11.pre.diff – rozdílový soubor (opravené chyby)
- Poznámky:
- Skript na ranní chvilky – pro příště opravit:
- význam nedělí – do závorek
- Skript na ranní chvilky – pro příště opravit:
12:40 – 18:30
editovat- /pre.ori
- hes10spl.pl – rozdělí soubor hes10-11.pre do měsíců
- /pre
- perl -i.ori -p evep.pl hes10??.pre – zkonvertuje odkazy na čtení (evangelium, epištola, žalm atd.) na 1., 2. a 3. odkaz
- perl -i.bak pr-del.pl hes10??.pre – deletuje řádky s tagem Pr>
- /pre.bak – záloha, protože /pre se bude ještě editovat
- /tex – konverze do formátu TeX pro sazbu kartáčových archů pro konečnou korekturu (během toho může dojít zase k opravám zdrojových souborů PRE)
- hes1001.tex – hes1012.tex – jednotlivé měsíce
- .tex – další soubory (titulní strana, předmluva, vysvětlivky atd. až nakonec tiráž)
- nakopírování loňských souborů /2009/w16-hinkovi-opr/vysazene/hes09adresy.tex .. hesla09.tex (kódování il2)
- recode ISO-8859-2 *.tex
- editace *.tex
- recode ..ISO-8859-2 *.tex
- pdfcsplain hesla10.tex
Mezitím instalace fontů a konfiguráků distribuce livetex do domácích adresářů:
- ~/.texmf-config
- ~/.texmf-var
- Pár chyb (nepárové uvozovky), opravil a přeložil Sláva.
- 271078 2009-09-18 16:10 hesla10.pdf
- 227186 2009-09-18 16:11 hesla10-4na1.pdf (4up = 4x A6 na straně A4)
w14-sazba
editovat2009-10-15 pondělí
editovatÚkol:
- Dostal jsem korektury od Jirky a od Inyše, tak je zapracovat do .pre a .tex souborů.
19:00 – 21:40
editovat- Začátek a konec Hesel:
- zkopíruji soubory *.tex
- recode ISO-8859-2 *.tex
- editace souborů adresíře, modl. stráže aj.
2009-10-16 úterý
editovat04:30 – 07:00
editovatÚkol:
- Korektury .pre souborů
- generování .tex souborů
Splněno.
18:00 – 20:15
editovatÚkol:
- vygenerovat soubor perikop
Postup:
- Nemám moc tušení, z čeho a jak jsem loni generoval ty perikopy. Tak zkouším:
./hes09strip-swap.pl /w13-korekt_pro_inyse/pre.ori/hes10-11.pre
- Tak to mi udělá perikopy, jakoby to byly všechny epištoly. Už vzpomínám, jak jsem to vloni plácal dohromady z epištol a evangelií.
- Aha, to bylo tím, že jsem tenkrát nějak zapomněl na tagy Pr>
- Letos jsem je vyhodil skriptem /w13-korekt_pro_inyse/pre/pr-del.pl už si vzpomínám, takže tam někde je musím ještě mít
- takže jen upravím hes09strip-swap.pl na hes10strip-swap.pl, budu hledat tagy Pr> a bude to jednoduché:
./hes10strip-swap.pl /w13-korekt_pro_inyse/pre.ori/hes10-11.pre
- vygenerovaný soubor peri
- takže konečný batch to řeší:
./hes10strip-swap.pl hes10-11.pre
./peri-txt-pre.pl peri > hes10per.pre
./hes10ptx.pl hes10per.pre
recode ..ISO-8859-2 *.tex hes10per.tex
- Úpravy hes10per.tex, aby se to vešlo vždy na jeden řádek; a přitom zjišťuji, že je ještě nutné:
- Dořešit problémy svátku+neděle v jednom dni:
- Den reformace
- Prosby za mír a ochr. života
- Sv. Štěpána
- To jsem řešil na souboru hes10per.tex, což bylo blbě, měl jsem na souboru peri, ale přišel jsem an to až pozdě, až když už jsem měl většinu zeditovanou.
w15-pisne
editovat2009-10-17 středa
editovatSláva zjistil na poslední chvíli průšvih, kterého jsme si nikdo před tím nevšimnul, že nám někde vypadly všechny písně.
- adresář /hesla/2010/w12-aut_korekt/
- 2009-08-04 14:19 hes10-09-blb.pre - tady písně ještě jsou
- 2009-08-04 15:05 hes10-10blb.pre - tady písně už chybí
- 2009-08-04 17:10 hes10-09.pre - tady písně ještě jsou
- 2009-08-04 17:45 hes10-10.pre - tady písně už chybí
- 2009-08-04 17:46 hes10-09-10.pre.diff - tady se ukazuje, že písně chybí
- toho jsem si tenkrát všimnul, jenže jsem to pak zapomněl dodělat :-(
w16-sazba+pisne
editovat2009-10-09
editovat- Dodělány písně do /pre
- Znova sazba do TeXu
w17-slava
editovat2009-10-10
editovat- Sjel znova sazbu na čisto
w18-html
editovat2010-01-20
editovat- Teprve dodělány HTML stránky na http://www.dulos.cz/cz/jb/hesla/hes10idx.htm
w19-xml
editovat2010-01-21
editovat- Teprve dodělávána XML verse:
- /pre ← /w16-sazba+pisne/pre
- /prf * ruční dolámání řádků
2010-01-31
editovat- xml-go skriptíček:
cd ../prg; ./hes10prfprg.pl ../prf/hes10??.prf; cd ../xml
./hes10xml.pl ../prg/hes10??.prg
#nsgmls -E2048 -wxml -fhes10-01.err xml.dcl hes10-01.xml
#less hes10-01.err
cstocs utf8 il2 < hes10-01.xml > hes10-01il.xml
sed -i '1 s/UTF-8/ISO-8859-2/' hes10-01il.xml
nsgmls -E2048 -wxml -fhes10-01il.err xml.dcl hes10-01il.xml
#less hes10-01il.err
- To nsgmls mi totiž v utf-8 nějak nefunguje. Příští tok to musím konečně celé nějak udělat jinak.
- Výsledek pověšen na http://www.dulos.cz/cz/jb/hesla/src2010/