Uživatel:Juandev/Blog/Komprese informací
(22. února 2023)
V jakém smyslu
editovatMyšlenka komrese informací souvisí s ideou tvorby zápisků/výpisku při studiu. Někteří studenti, kteří mají hodně času si například vypracovávávají zkouškové otázky, to jest z přednášek, zápisků, skrypt nebo jiných zdrojů (což jsou full size i komprimované zdroje) vytváří nové komprimované dokumenty. Takže se buď dopouští komprese, pokud je původní zdroj full size, nebo i restrukturalizace informací, a nebo obojího. A ti co mají čas, pak pokračují další kompresí, že si z vypracovaných otázek dělají další stručnější výpisky, které mohou použít jako tahák, nebo jen studijní materiál.
Známé úrovně zestručnění a vizualizační způsoby
editovatV tomto textu je tedy komprese chápána jako forma zestručnění dělaná člověkem, nicméně ukazujese, že ji již zvládají i AI modely typu chatbot (např. chatGPT3). Je jisté, že forma zestručnění by se dala vykreslit škálou a každý ji bude mít nějak jinou, ale jisté obecně definované formy zestručnění už právě známe. Jedná se třeba o přednášku či seminář, kde by mělo být stručnou formou prezentováno nějaké širší dílo (např. skrypto či určitá virtuální znalost určitého předmětu), a dále např. výpisky nebo zápisky, které de facto také zestručnují to, co bylo řečeno nebo napsáno. Tahák je pak jakousi třetí úrovní zestručnění.
Zestručení se ale nemusí dělat jen zápisem a přepisem, například zvýrazňování částí textu barevně v učebnici, je také určitou formou komprimace informace na určitou výraznou myšlenku například v odstavci. Podobně funguje zvýrazňování v poznámkách, tedy komprimovaném dokumentu druhého řádu, na třetí.
Přínos informačních technologií
editovatA co přináší nová média? Laptopy přináší jen jinou formu komprimace. Na místo ručního zápisu si zapisujeme digitálně. To má jistě výhody v ulehčení, například vyhledávání informací (či jistý dataminig v zápiscích), ale může to mít negativní dopady na schopnosti učení, protože výzkumy ukazují, že k zapamatování dochází hlavně v procesu, kdy student musí vyvinout určité úsilí. Pokud je vše jednoduché a bez úsilí, nebo se to komplikuje třeba nutností ovládat techniku, pak výsledek efektivity studia opadá (podobný princip platil u starších studentů v případě zpracování semestrálek na Wikipedii, kde se spíš naučili pracovat se zdroji, textem a online editorem, nežli by se ponořili do znalosti samotného textu).
Technika nám dnes také umožňuje pořizovat audio, či videozáznami. Zde se ale nedá hovořit o zestručnění, nýbrž o kopírování přestavení např. přednášky. Kdyby pak videa umožňovala snadnou editaci, například kreslení do screencastingu, či vkládání určitých VR objektů, mohli bysme hovořit o jistém typu audiovizuálního zestručenění. Zatím jsou mi známi pouze nástroje kreslední do PDF například v prohlížeči Edge (které jsem ale osobně nezkoušel, protože zřejmě nativně fungují jen ve Windows, ale na Linux to nefungovalo). Do budoucna bude mít ale digitalizace spíše jen výhody – už dnes je zjevné, že dlouhé zápisky/výpisky v digitální podobě umožňují rychlejší vyhledávání myšlenek – tento vývoj však brzdí z mého pohledu pomalý vývoj nástrojů pro práci s textem (s textem digitálně de facto pracujem stejně 50 let a možná ještě déle, protože se ta práce moc od fyzické práce neliší).
Typy zdrojů jsou k zamyšlení
editovatS principem zestručňování se vlastně setkáváme i u typů zdrojů: sekundární – terciální – (kvartální). Je zajímavé, že přechod od primárních k sekundárním, není zestručněním, ale spíše rozšířením. Několik krátkých studií, je přeloženo z vědeckého jazyka do nevědeckého a je to tvořeno jakousi opisnou formou, takže množství textu narůstá. Naopak při kompilaci terciálního zdroje (encyklopedie) ze zdrojů populárně naučných tradičně ke komprimaci docházelo, což ale v jistém smyslu nabourala Wikipedie, kdy lze informace kompilovat v poměru 1:1, nebo dokonce informace k tématu rozšiřovat. Nicméně obecná představa o encyklopedii je, že je to zkomprimovaná informace lidského vědění, takže by se o zestručnění mělo hovořit. A co jsou kvartální zdroje? Mohly by jím být data, ale jelikož datům nerozumíme, měla by to být metadata dat, nebo možná nějaká zjednodušení v podobě obrázků vzniklá analýzou a zobrazením dat z určitých zdrojů? Problémem je, že u dat už se dostáváme z pole jednoduše pochopitelného člověkem.
Kam až jde komprimovat
editovatDe facto do nuly, de facto do bodu, kdy informace přestává být informací a přestává mít pro člověka výpovědní hodnotu. Například u studentů může informace ztrácet hodnotu v momentě, kdy daný předmět umí. Stačí říct, sémantika a student si představí vše o sémantice. Maximální kompresí informací původně obsáhlých v 200stránkové učebnici, nebo 72 hodinách videa tak může být jedno slovo. I to slovo sémantika má samo o sobě určitý význam vědecké disciplíny sémantika, takže to není jen o kompresi pro jednoho konkrétního člověka.
A opak komprese?
editovatPokud lze komprimovat, mělo by jít i dekomprimovat. Jenže u běžných lidí nevznikne po kompresi stejnocený dekomprimovaný dokument. V obecném chápání by mělo ale jít zvětšovat objem dat (textu) o určitém předmětu také exponenciálně. Nicméně měli bysme se zde zamýšlet na určité formě maximální možné srozumitelné exprese. Protože k expresi může buďto docházet přidáváním dalších znalostí oboru – zde je asi vše v pořádku a porozumění je odvislé od struktury informací, či jejich zobrazení, ale také přidáváním balastního textu, který opticky působí zvětšení informací, ale vytváří nesrozumitelnost, nebo pustost a náročnost čtení či studia. De fakto se narušuje určitá struktura či systém a vzniká chaos, neboli pokročilejší struktura se kterou již může mít kdejaký člověk problémy.