Kompresia informácií. Kompresný pomer Príklady riešenia problémov

Osem epizód za sezónu je na takúto sériu stále málo, príbeh sa nestihol poriadne rozvinúť, no aj tak je zaujímavé, čo bude ďalej, čo je dobre. Najmä preto, že bola potvrdená druhá sezóna. Aj keď posledná epizóda bola dosť nudná.

Tím Pide Pipera využil Ehrlichove modriny počas prezentácie. Po prvé, vedenie konferencie, vystrašené z možného súdneho sporu (volal právnik-gitarista), ponúklo Pide Piperovi, aby išiel na ďalšie turné bez súťaže, a po druhé, Erlich im kúpil aj apartmán v hoteli.

Erlich, síce veľmi dusno, ale sú z toho benefity. V tíme by mal byť taký človek - arogantný ako traktor, priebojný, samoľúby optimista, ktorý má vždy pripravený idiotský nápad a dokáže udrieť aj škaredého malého chlapca. A nie každý má na to odvahu.

Všetko sa zdá byť v poriadku, no lídri startupu sa išli pozrieť na Belsonovu prezentáciu a predstavil nielen rozsiahly projekt s kopou rôznych funkcionalít, keďže Houli má množstvo služieb, ktoré sa dajú integrovať, ale aj istý Weissman koeficient, teda kompresný pomer, má rovnaký ako Pyde Piper. Weissmanov koeficient bol vytvorený špeciálne pre sériu dvoma konzultantmi zo Stanfordu Weissmanom a Misrou.

Vo všeobecnosti sa ukazuje, že odporní konkurenti napriek tomu zničili Richardov algoritmus pomocou reverzného inžinierstva. Pyde Piper zajtra nemá čo ukázať.

Erlich sa pokúsil trollovať Belsona, obvinil ho zo všetkých smrteľných hriechov od alkoholizmu po sexuálne obťažovanie, Jared sa zbláznil a Dinesh a Gilfoyle sa pokúsili nájsť si novú prácu.

Večer, keď Jareda prepustili od polície, sa všetci zhromaždili v hoteli a začali premýšľať, čo robiť. Nikto sa nechce zajtra vystavovať verejnej poprave, samozrejme okrem Erlicha, ktorý verí, že verejné popravy sú veľmi populárne a vo všeobecnosti je to všetko šoubiznis. Či tak alebo onak, vyhrá, aj keď osobne musí strhnúť každého frajera v miestnosti. Tento nápad bol prijatý s nadšením, pretože, ako som nedávno písal, programátorov môže uniesť akákoľvek úloha a je im jedno, či je zákerná alebo hlúpa. Kým počítali, za akých podmienok by Erlich všetkých v čo najkratšom čase strhol, Richard dostal nápad.

Nie, toto nie je Richardov nápad,

Toto je tím Pyde Pipera, ktorý rieši Erlichov problém.

Ako asi tušíte, všetko sa skončilo dobre a Pyde Piper dostal 50-tisíc dolárov. A Peter Gregory im povedal, že nie je naštvaný.

Najviac ma mrzí, že už neuvidíme Petra Gregoryho. Bola to najlepšia postava vôbec. Neviem, či sudca Pyde dokáže nájsť iného investora pre Piper, ktorý je rovnako šialený.

Kompresný pomer je hlavnou charakteristikou kompresného algoritmu. Je definovaný ako pomer objemu pôvodných nekomprimovaných údajov k objemu komprimovaných údajov, to znamená: , kde k- pomer kompresie, S o je množstvo počiatočných údajov a S c - objem komprimovaných súborov. Čím vyšší je kompresný pomer, tým efektívnejší je algoritmus. Treba poznamenať:

ak k= 1, potom algoritmus nevykonáva kompresiu, to znamená, že výstupná správa má rovnaký objem ako vstup;

ak k< 1, то алгоритм порождает сообщение большего размера, нежели несжатое, то есть, совершает «вредную» работу.

Situácia s k< 1 вполне возможна при сжатии. Принципиально невозможно получить алгоритм сжатия без потерь, который при любых данных образовывал бы на выходе данные меньшей или равной длины. Обоснование этого факта заключается в том, что поскольку число различных сообщений длинойn bit je presne 2 n, počet rôznych správ s dĺžkou menšou alebo rovnou n(ak existuje aspoň jedna správa menšej dĺžky) bude menšia ako 2 n. To znamená, že nie je možné jednoznačne mapovať všetky pôvodné správy na komprimovanú: buď niektoré pôvodné správy nebudú mať komprimovanú reprezentáciu, alebo niekoľko originálnych správ bude mať rovnakú komprimovanú reprezentáciu, čo znamená, že ich nemožno rozlíšiť. Avšak aj keď kompresný algoritmus zväčší veľkosť pôvodných údajov, je ľahké zabezpečiť, že ich veľkosť sa zaručene nezvýši o viac ako 1 bit. Potom, dokonca aj v najhoršom prípade, bude nerovnosť: Toto sa robí nasledovne: ak je množstvo komprimovaných údajov menšie ako množstvo originálu, vrátime komprimované údaje tak, že k nim pridáme „1“, inak vrátiť pôvodné údaje pridaním „0“ k nim). Príklad toho, ako je to implementované v pseudo-C++, je uvedené nižšie:

bin_data_t __compess(bin_data_t input) // bin_data_t je dátový typ znamenajúci ľubovoľnú sekvenciu bitov s premenlivou dĺžkou

bin_data_t vystup = arch(vstup); // funkcia bin_data_t arch(bin_data_t input) implementuje nejaký algoritmus kompresie údajov

if (output.size()

output.add_begin(1); // funkcia bin_data_t::add_begin(bool __bit__) pridá bit rovný __bit__ na začiatok sekvencie

návratový výstup; // vráti komprimovanú sekvenciu s pridanou "1".

else // inak (ak je množstvo komprimovaných údajov väčšie alebo rovnaké ako množstvo originálu)

input.add_begin(0); // pridajte "0" k pôvodnej sekvencii

návratový vstup; // vráti pôvodný súbor s pripojenou "0".

Kompresný pomer môže byť buď konštantný (niektoré algoritmy na kompresiu zvuku, obrázkov atď., ako napríklad A-law, μ-law, ADPCM, kódovanie skrátených blokov) alebo variabilný. V druhom prípade sa môže určiť buď pre každú konkrétnu správu, alebo vyhodnotiť podľa niektorých kritérií:

priemer (zvyčajne pre nejaký súbor testovacích údajov);

maximum (prípad najlepšej kompresie);

minimálne (najhoršie kompresné puzdro);

alebo akékoľvek iné. V tomto prípade stratový kompresný pomer silne závisí od prípustnej chyby kompresie resp kvalitu, ktorý zvyčajne funguje ako parameter algoritmu. Vo všeobecnom prípade iba stratové metódy kompresie údajov môžu poskytnúť konštantný kompresný pomer.

Hlavným kritériom na rozlíšenie medzi kompresnými algoritmami je prítomnosť alebo absencia strát opísaných vyššie. Vo všeobecnosti sú algoritmy bezstratovej kompresie univerzálne v tom zmysle, že ich použitie je určite možné pre dáta akéhokoľvek typu, pričom možnosť použitia stratovej kompresie musí byť opodstatnená. Pri niektorých typoch údajov nie sú skreslenia v zásade povolené. Medzi nimi

symbolické údaje, ktorých zmena nevyhnutne vedie k zmene ich sémantiky: programy a ich zdrojové texty, binárne polia atď.;

dôležité údaje, ktorých zmeny môžu viesť ku kritickým chybám: napríklad získané z lekárskych meracích zariadení alebo riadiacich zariadení lietadiel, kozmických lodí atď.;

prechodné dáta opakovane vystavené kompresii a obnove počas viacstupňového spracovania grafických, zvukových a obrazových dát.

Princípy kompresie informácií

Základom každej metódy kompresie informácií je model zdroja informácií, alebo presnejšie, model redundancie. Inými slovami, na komprimovanie informácií sa používajú niektoré informácie o tom, aký druh informácií sa komprimuje - bez toho, aby ste o nich mali nejaké informácie, nemôžete robiť žiadne predpoklady o tom, aká transformácia zníži veľkosť správy. Tieto informácie sa používajú v procese kompresie a dekompresie. Model redundancie môže byť tiež zostavený alebo parametrizovaný počas kroku kompresie. Metódy, ktoré umožňujú meniť model informačnej redundancie na základe vstupných údajov, sa nazývajú adaptívne. Neadaptívne sú zvyčajne vysoko špecifické algoritmy používané na prácu s dobre definovanými a nemennými charakteristikami. Prevažná väčšina dostatočne univerzálnych algoritmov je do určitej miery adaptívna.

Každá metóda kompresie informácií zahŕňa dve navzájom inverzné transformácie:

konverzia kompresie;
kompresná transformácia.

Kompresná transformácia poskytuje komprimovanú správu z originálu. Dekomprimácia na druhej strane zaisťuje, že pôvodná správa (alebo jej aproximácia) sa získa z komprimovanej správy.

Všetky metódy kompresie sú rozdelené do dvoch hlavných tried

bez straty
so stratami.

Zásadný rozdiel medzi nimi je v tom, že bezstratová kompresia poskytuje možnosť presnej obnovy pôvodnej správy. Stratová kompresia umožňuje získať len určitú aproximáciu pôvodnej správy, teda odlišnú od originálu, avšak v rámci určitých vopred určených chýb. Tieto chyby musí určiť iný model – model prijímača, ktorý určuje, aké údaje a s akou presnosťou sú prezentované sú pre prijímač dôležité a čo je prijateľné vyhodiť.

Charakteristika kompresných algoritmov a použiteľnosť

Pomer kompresie

Kompresný pomer je hlavnou charakteristikou kompresného algoritmu, ktorá vyjadruje kvalitu hlavnej aplikácie. Je definovaný ako pomer veľkosti nekomprimovaných údajov ku komprimovaným údajom, to znamená:

k = S o / S c ,

kde k- pomer kompresie, S o je veľkosť nekomprimovaných údajov a S c - stlačená veľkosť. Čím vyšší je kompresný pomer, tým lepší je algoritmus. Treba poznamenať:

ak k= 1, potom algoritmus nevykoná kompresiu, to znamená, že dostane výstupnú správu s veľkosťou rovnajúcou sa vstupu;
ak k < 1, то алгоритм порождает при сжатии сообщение большего размера, нежели несжатое, то есть, совершает «вредную» работу.

Situácia s k < 1 вполне возможна при сжатии. Невозможно получить алгоритм сжатия без потерь, который при любых данных образовывал бы на выходе данные меньшей или равной длины. Обоснование этого факта заключается в том, что количество различных сообщений длиной n Vzor:E:bit je presne 2 n. Potom počet rôznych správ s dĺžkou menšou alebo rovnou n(ak existuje aspoň jedna správa menšej dĺžky) bude menšia ako 2 n. To znamená, že nie je možné jednoznačne mapovať všetky pôvodné správy na komprimovanú: buď niektoré pôvodné správy nebudú mať komprimovanú reprezentáciu, alebo niekoľko originálnych správ bude mať rovnakú komprimovanú reprezentáciu, čo znamená, že ich nemožno rozlíšiť.

Kompresný pomer môže byť buď konštantný (niektoré algoritmy na kompresiu zvuku, obrázkov atď., ako napríklad A-law, μ-law, ADPCM) alebo variabilný. V druhom prípade môže byť definovaná buď pre konkrétnu správu, alebo vyhodnotená podľa niektorých kritérií:

priemer (zvyčajne cez nejaký súbor testovacích údajov);
maximum (prípad najlepšej kompresie);
minimálne (najhoršie kompresné puzdro);

alebo nejaký iný. V tomto prípade stratový kompresný pomer silne závisí od prípustnej chyby kompresie alebo jej kvalitu, ktorý zvyčajne funguje ako parameter algoritmu.

Prijatie strát

Hlavným kritériom na rozlíšenie medzi kompresnými algoritmami je prítomnosť alebo absencia strát opísaných vyššie. Vo všeobecnosti sú algoritmy bezstratovej kompresie univerzálne v tom zmysle, že ich možno použiť na akýkoľvek typ údajov, pričom použitie stratovej kompresie musí byť odôvodnené. Niektoré typy údajov nepripúšťajú žiadnu stratu:

symbolické údaje, ktorých zmena nevyhnutne vedie k zmene ich sémantiky: programy a ich zdrojové texty, binárne polia atď.;
dôležité údaje, ktorých zmeny môžu viesť ku kritickým chybám: napríklad získané z lekárskych meracích zariadení alebo riadiacich zariadení lietadiel, kozmických lodí atď.
údaje opakovane vystavené kompresii a dekompresii: pracovné grafické, zvukové, video súbory.

Stratová kompresia vám však umožňuje dosiahnuť oveľa vyššie kompresné pomery odstránením nepodstatných informácií, ktoré sú zle komprimované. Napríklad algoritmus bezstratovej kompresie zvuku FLAC vám vo väčšine prípadov umožňuje komprimovať zvuk 1,5 až 2,5-krát, zatiaľ čo stratový algoritmus Vorbis môže v závislosti od nastaveného parametra kvality komprimovať až 15-krát pri zachovaní prijateľného kvalitný zvuk.

Systémové požiadavky algoritmov

Rôzne algoritmy môžu vyžadovať rôzne množstvo prostriedkov výpočtového systému, na ktorých sa vykonávajú nasledovné:

RAM (pre prechodné dáta);
permanentná pamäť (pod programovým kódom a konštantami);
čas procesora.

Vo všeobecnosti tieto požiadavky závisia od zložitosti a „inteligentnosti“ algoritmu. Podľa všeobecného trendu, čím lepší a všestrannejší algoritmus, tým väčšie nároky na stroj kladie. V špecifických prípadoch však môžu jednoduché a kompaktné algoritmy fungovať lepšie. Systémové požiadavky určujú ich spotrebiteľské kvality: čím menej náročný algoritmus, tým jednoduchší, a teda kompaktnejší, spoľahlivejší a lacnejší systém môže fungovať.

Keďže kompresné a dekompresné algoritmy pracujú v pároch, záleží aj na pomere systémových požiadaviek k nim. Komplikovaním jedného algoritmu je možné často výrazne zjednodušiť ďalší. Môžeme teda mať tri možnosti:

Kompresný algoritmus je oveľa náročnejší na zdroje ako dekompresný algoritmus. Toto je najbežnejší pomer a je použiteľný hlavne v prípadoch, keď sa raz komprimované dáta budú používať opakovane. Príklady zahŕňajú digitálne audio a video prehrávače. Kompresné a dekompresné algoritmy majú približne rovnaké požiadavky. Najprijateľnejšia možnosť pre komunikačnú linku, keď dôjde k stlačeniu a expanzii raz na jej dvoch koncoch. Môže to byť napríklad telefonovanie. Kompresný algoritmus je podstatne menej náročný ako dekompresný algoritmus. Dosť exotické. Môže sa použiť v prípadoch, keď je vysielač ultraprenosné zariadenie, kde je množstvo dostupných zdrojov veľmi kritické, napríklad kozmická loď alebo veľká distribuovaná sieť senzorov, alebo to môžu byť dekompresné údaje, ktoré sú potrebné v veľmi malé percento prípadov, napríklad video monitorovacie kamery.

pozri tiež

Nadácia Wikimedia. 2010.

Pozrite si, čo je „Kompresia informácií“ v iných slovníkoch:

kompresiu informácií- zhutňovanie informácií - [L.G. Sumenko. Anglický ruský slovník informačných technológií. M .: GP TsNIIS, 2003.] Témy informačné technológie vo všeobecnosti Synonymá zhutňovanie informácií EN redukcia informácií ...

KOMPRESIA INFORMÁCIÍ- (kompresia údajov) reprezentácia informácie (údajov) s menším počtom bitov v porovnaní s originálom. Na základe odstránenia nadbytočnosti. Rozlišujte S. a. bez straty informácií a so stratou časti informácií, ktoré sú pre riešené úlohy nepodstatné. DO… … Encyklopedický slovník psychológie a pedagogiky

adaptívna bezstratová kompresia informácií-- [L.G. Sumenko. Anglický ruský slovník informačných technológií. M.: GP TsNIIS, 2003.] Témy informačné technológie vo všeobecnosti EN adaptívna bezstratová kompresia dátALDC ... Technická príručka prekladateľa

kompresia/komprimácia informácií-- [L.G. Sumenko. Anglický ruský slovník informačných technológií. M .: GP TsNIIS, 2003.] Témy informačné technológie vo všeobecnosti EN zhutňovanie ... Technická príručka prekladateľa

digitálna kompresia informácií-- [L.G. Sumenko. Anglický ruský slovník informačných technológií. M.: GP TsNIIS, 2003.] Témy informačné technológie vo všeobecnosti EN kompresia ... Technická príručka prekladateľa

Zvuk je jednoduchá vlna a digitálny signál je reprezentáciou tejto vlny. To sa dosiahne uložením amplitúdy analógového signálu mnohokrát do jednej sekundy. Napríklad na obyčajnom CD je signál uložený 44100-krát v ... ... Wikipédii

Proces, ktorý znižuje objem údajov znížením redundancie údajov. Kompresia dát súvisí s kompaktným usporiadaním dátových blokov štandardnej veľkosti. Existujú kompresie so stratou a bez straty informácií. V angličtine: Údaje… … Finančná slovná zásoba

kompresia digitálnych kartografických informácií- Spracovanie digitálnych kartografických informácií za účelom zníženia ich objemu vrátane odstránenia nadbytočnosti v rámci požadovanej presnosti ich prezentácie. [GOST 28441 99] Témy digitálna kartografia Zovšeobecňujúce pojmy metódy a technológie ... ... Technická príručka prekladateľa

Akákoľvek látka pod vplyvom vonkajšieho tlaku môže byť stlačená, to znamená, že zmení svoj objem do jedného alebo druhého stupňa. Takže plyny so zvyšujúcim sa tlakom môžu veľmi výrazne znížiť svoj objem. Kvapalina podlieha zmenám objemu so zmenou vonkajšieho tlaku v menšom rozsahu. Stlačiteľnosť pevných látok je ešte menšia. Stlačiteľnosť odráža závislosť fyzikálnych vlastností látky od vzdialeností medzi jej molekulami (atómami). Stlačiteľnosť je charakterizovaná kompresným pomerom (Rovnaký: kompresný pomer, všestranný kompresný pomer, objemový elastický pomer expanzie).

DEFINÍCIA

Pomer kompresie je fyzikálna veličina rovnajúca sa relatívnej zmene objemu vydelenej zmenou tlaku, ktorá spôsobuje zmenu objemu látky.

Pre kompresný pomer existujú rôzne označenia, najčastejšie sú to písmená resp. Vo forme vzorca zapíšeme kompresný pomer ako:

kde znamienko mínus odráža skutočnosť, že zvýšenie tlaku vedie k zníženiu objemu a naopak. V diferenciálnej forme je koeficient definovaný ako:

Objem súvisí s hustotou látky, preto pre procesy zmeny tlaku pri konštantnej hmotnosti môžeme písať:

Hodnota kompresného pomeru závisí od charakteru látky, jej teploty a tlaku. Okrem všetkého vyššie uvedeného závisí kompresný pomer od typu procesu, v ktorom dochádza k zmene tlaku. Takže v izotermickom procese sa kompresný pomer líši od kompresného pomeru v adiabatickom procese. Izotermický kompresný pomer je definovaný ako:

kde je parciálna derivácia v T=konšt.

Adiabatický kompresný pomer možno nájsť ako:

kde je parciálna derivácia pri konštantnej entropii (S). Pre tuhé látky sa koeficienty izotermickej a adiabatické stlačiteľnosti líšia veľmi málo a tento rozdiel sa často zanedbáva.

Existuje vzťah medzi adiabatickým a izotermickým koeficientom stlačiteľnosti, ktorý sa odráža v rovnici:

kde a sú tepelné kapacity pri konštantnom objeme a tlaku.

Jednotky pomeru strán

Základnou mernou jednotkou pre faktor stlačiteľnosti v sústave SI je:

Príklady riešenia problémov

PRÍKLAD 1

KULTÚRA

Cvičenie

Nechajte kocku pevnej hmoty s rovnakou stranou zažiť všestranný tlak. Strana kocky je zmenšená o . Vyjadrite súčiniteľ stlačenia kocky, ak sa na ňu vyvíjaný tlak zmení vzhľadom na počiatočný o

rozhodnutie

Urobme si kresbu.

V súlade s definíciou kompresného pomeru píšeme:

Pretože zmena strany kocky spôsobená tlakom je , potom objem kocky po stlačení () môže byť vyjadrený ako:

Preto relatívnu zmenu objemu zapíšeme ako:

je malý, takže predpokladáme sa rovnajú nule, potom môžeme predpokladať, že:

Relatívnu zmenu objemu z (1.4) dosadíme do vzorca (1.1), máme:

Odpoveď

Kompresia informácií. Kompresný pomer Príklady riešenia problémov

Princípy kompresie informácií