čtvrtek 12. října 2023

Projekt Žalmy hebrejsky

Začínám se pouštět do projektu Žalmy hebrejsky.

Tento projekt bude ve spolupráci s LLM. LLM je Velký jazykový model, databáze ovládaná programem, která umí komunikovat s člověkem a rozumět jeho slovům, tak že dokáže vyhledávat co potřebuji nebo zpracovávat text. LLM mi slouží k vytváření tabulek z dat, které jsem zkopíroval z webových stránek s hebrejštinou a analýzou hebrejského textu. Poskytuje také překlad z anglického textu, případně překlad do češtiny, který bude kontextuální a měl by vycházet z moderních anglických překladů. 

Zatím jsem na tento projekt sám a popíšu vám jak používám LLM.

Aplikace kterou používám zdarma má nastavení instrukcí pro LLM, kde jsem popsal jak vypadá vstupní text A a vstupní tabulka B. LLM vytvoří z těchto dat novou tabulku a poskytne překlad.

Zpracování tabulek probíhá v několika fázích.

1. Získání hebrejského textu a transliterace pomocí sefaria.org a hebrew-transliterate.wz.cz což je webová aplikace, kterou jsem si vytvořil za účelem vytváření formátovaného transliterovaného textu. Hebrejština se tam přepíše do latinky.

2. Zkopíruji tento text Žalmu, jsou to dva texty. Předám LLM a on mi z toho vygeneruje text, který střídá hebrejštinu s transliterací

3. Překonfiguruju nastavení LLM. Zadám instrukce.

4. Pomocí doplňku nahradím znaky na stránce s analýzou hebrejského textu " | " za "+". Jsou to jen dvě kliknutí.

5. Zkopíruju hebrejský text prvního verše, transliteraci a tabulku s textovou analýzou prvního verše a pošlu to LLM. On mi vygeneruje tabulku.

6. Tabulka obsahuje chybu, LLM odstranil z transliterace hranaté závorky. Upozorním ho na tuto chybu a řeknu, že to nemá dělat.

7. Takto postupuje pro všechny verše Žalmu.

8. Zkopíruju výsledný text s tabulkama a vložím to na blog (tj. dočasná záloha).

9. Následně přejdu na html kód, zkopíruju ho a ve Wordu změním pomocí makra znaky tak, aby byly formátované (tučné, podtržení, italic). Dojde k odstranění hranatých závorek z transliterace. Také spustím makro na náhradu morfologických zkratek.

10. Vložím to na blog. Tím je hotov jeden žalm.

První pokus, který jsem ještě dělal bez použití doplňku na náhradu textu, obsahoval nedostatek, který způsobil chybu, takže tuto ukázku budu předělávat, ale vypadá to přibližně takto:

https://moudrost.blogspot.com/2023/09/zalm-82-kompletni-preklad-velke-pismo.html

Příklad tabulky, kterou LLM vytvořil, ještě před zpracováním makrem:

HebrejskyTransliteraceMorfologieAnglickyČesky
יֹשֵׁבjóšévV-Qal-Prtcpl-msHe who dwellsTen, kdo přebývá
בְּסֵתֶרbəséterPrep-b+N-mscin the secret placena skrytém místě
עֶלְיוֹןelj[ó]nAdj-msof the Most HighNejvyššího
בְּצֵלbə[tc]élPrep-b+N-mscunder the shadowpod stínem
שַׁדַּיšaddajN-proper-msof the AlmightyVšemohoucího
יִתְלוֹנָןjitl[ó]nánV-Hitpael-Imperf-3msshall abidebude přebývat

Ten anglický text je přitom jen "provizorní". Pro případ, že chci něco probrat s LLM tak zkopíruju tabulku a LLM má informace o celém verši. Takže kdybych například chtěl vyextrahovat - odvodit další data pomocí LLM, mohu použít tuto tabulku.

Žádné komentáře:

Okomentovat