Uživatel:Juandev/Blog/Komprese informací

(22. února 2023)

V jakém smyslu

Myšlenka komrese informací souvisí s ideou tvorby zápisků/výpisku při studiu. Někteří studenti, kteří mají hodně času si například vypracovávávají zkouškové otázky, to jest z přednášek, zápisků, skrypt nebo jiných zdrojů (což jsou full size i komprimované zdroje) vytváří nové komprimované dokumenty. Takže se buď dopouští komprese, pokud je původní zdroj full size, nebo i restrukturalizace informací, a nebo obojího. A ti co mají čas, pak pokračují další kompresí, že si z vypracovaných otázek dělají další stručnější výpisky, které mohou použít jako tahák, nebo jen studijní materiál.

Známé úrovně zestručnění a vizualizační způsoby

V tomto textu je tedy komprese chápána jako forma zestručnění dělaná člověkem, nicméně ukazujese, že ji již zvládají i AI modely typu chatbot (např. chatGPT3). Je jisté, že forma zestručnění by se dala vykreslit škálou a každý ji bude mít nějak jinou, ale jisté obecně definované formy zestručnění už právě známe. Jedná se třeba o přednášku či seminář, kde by mělo být stručnou formou prezentováno nějaké širší dílo (např. skrypto či určitá virtuální znalost určitého předmětu), a dále např. výpisky nebo zápisky, které de facto také zestručnují to, co bylo řečeno nebo napsáno. Tahák je pak jakousi třetí úrovní zestručnění.

Zestručení se ale nemusí dělat jen zápisem a přepisem, například zvýrazňování částí textu barevně v učebnici, je také určitou formou komprimace informace na určitou výraznou myšlenku například v odstavci. Podobně funguje zvýrazňování v poznámkách, tedy komprimovaném dokumentu druhého řádu, na třetí.

Přínos informačních technologií

A co přináší nová média? Laptopy přináší jen jinou formu komprimace. Na místo ručního zápisu si zapisujeme digitálně. To má jistě výhody v ulehčení, například vyhledávání informací (či jistý dataminig v zápiscích), ale může to mít negativní dopady na schopnosti učení, protože výzkumy ukazují, že k zapamatování dochází hlavně v procesu, kdy student musí vyvinout určité úsilí. Pokud je vše jednoduché a bez úsilí, nebo se to komplikuje třeba nutností ovládat techniku, pak výsledek efektivity studia opadá (podobný princip platil u starších studentů v případě zpracování semestrálek na Wikipedii, kde se spíš naučili pracovat se zdroji, textem a online editorem, nežli by se ponořili do znalosti samotného textu).

Technika nám dnes také umožňuje pořizovat audio, či videozáznami. Zde se ale nedá hovořit o zestručnění, nýbrž o kopírování přestavení např. přednášky. Kdyby pak videa umožňovala snadnou editaci, například kreslení do screencastingu, či vkládání určitých VR objektů, mohli bysme hovořit o jistém typu audiovizuálního zestručenění. Zatím jsou mi známi pouze nástroje kreslední do PDF například v prohlížeči Edge (které jsem ale osobně nezkoušel, protože zřejmě nativně fungují jen ve Windows, ale na Linux to nefungovalo). Do budoucna bude mít ale digitalizace spíše jen výhody – už dnes je zjevné, že dlouhé zápisky/výpisky v digitální podobě umožňují rychlejší vyhledávání myšlenek – tento vývoj však brzdí z mého pohledu pomalý vývoj nástrojů pro práci s textem (s textem digitálně de facto pracujem stejně 50 let a možná ještě déle, protože se ta práce moc od fyzické práce neliší).

Typy zdrojů jsou k zamyšlení

S principem zestručňování se vlastně setkáváme i u typů zdrojů: sekundární – terciální – (kvartální). Je zajímavé, že přechod od primárních k sekundárním, není zestručněním, ale spíše rozšířením. Několik krátkých studií, je přeloženo z vědeckého jazyka do nevědeckého a je to tvořeno jakousi opisnou formou, takže množství textu narůstá. Naopak při kompilaci terciálního zdroje (encyklopedie) ze zdrojů populárně naučných tradičně ke komprimaci docházelo, což ale v jistém smyslu nabourala Wikipedie, kdy lze informace kompilovat v poměru 1:1, nebo dokonce informace k tématu rozšiřovat. Nicméně obecná představa o encyklopedii je, že je to zkomprimovaná informace lidského vědění, takže by se o zestručnění mělo hovořit. A co jsou kvartální zdroje? Mohly by jím být data, ale jelikož datům nerozumíme, měla by to být metadata dat, nebo možná nějaká zjednodušení v podobě obrázků vzniklá analýzou a zobrazením dat z určitých zdrojů? Problémem je, že u dat už se dostáváme z pole jednoduše pochopitelného člověkem.

Kam až jde komprimovat

De facto do nuly, de facto do bodu, kdy informace přestává být informací a přestává mít pro člověka výpovědní hodnotu. Například u studentů může informace ztrácet hodnotu v momentě, kdy daný předmět umí. Stačí říct, sémantika a student si představí vše o sémantice. Maximální kompresí informací původně obsáhlých v 200stránkové učebnici, nebo 72 hodinách videa tak může být jedno slovo. I to slovo sémantika má samo o sobě určitý význam vědecké disciplíny sémantika, takže to není jen o kompresi pro jednoho konkrétního člověka.

A opak komprese?

Pokud lze komprimovat, mělo by jít i dekomprimovat. Jenže u běžných lidí nevznikne po kompresi stejnocený dekomprimovaný dokument. V obecném chápání by mělo ale jít zvětšovat objem dat (textu) o určitém předmětu také exponenciálně. Nicméně měli bysme se zde zamýšlet na určité formě maximální možné srozumitelné exprese. Protože k expresi může buďto docházet přidáváním dalších znalostí oboru – zde je asi vše v pořádku a porozumění je odvislé od struktury informací, či jejich zobrazení, ale také přidáváním balastního textu, který opticky působí zvětšení informací, ale vytváří nesrozumitelnost, nebo pustost a náročnost čtení či studia. De fakto se narušuje určitá struktura či systém a vzniká chaos, neboli pokročilejší struktura se kterou již může mít kdejaký člověk problémy.