Mi a működési elve archivers archiváló

Mi Fájltömörítés? A működési elve archiváló.

Archivers - a program létrehozására archívumokat. Archives tervezték adattároló egy kényelmes kompakt formában. Mivel ezek általában a fájlokat és mappákat. Jellemzően, az adatok a korábban nyomásnak vetjük alá, vagy csomagolási eljárás. Ezért szinte minden archív is egy programot tömörítés. Másrészt, bármilyen program az adatok tömörítése lehet tekinteni, mint egy archiváló. A tömörítés hatékonysága fontos jellemzője archívumokat. Ez befolyásolja a méret a generált fájlok. Minél kisebb a fájl, annál kevesebb hely szükséges a tároláshoz. Átvinni igényel kevesebb sávszélességet az átviteli csatorna vagy kevesebb időt töltöttek. Előnyök archívum nyilvánvaló, ha figyelembe vesszük, hogy ezek a csökkentett méretű és 2-szer és 5-ször.

Adat tömörítés széles körben használják. Elmondhatjuk, szinte mindenhol. Például a PDF dokumentumokat. Általános szabály, hogy tartalmaz tömör tájékoztatást. Elég sok futtatható EXE tömörített fájlok speciális konzervgyárak. Mindenféle multimédia fájlok (GIF. JPG. MP 3, MPG) egyfajta levéltár.

A fő hátránya az, hogy nem archiválja közvetlen hozzáférést biztosít az adatokhoz. Ők először be kell kivonni a levéltári és kicsomagolni. Működés kicsomagolás azonban, mint a csomagolás, igényel némi rendszer erőforrásait. Ez nem egy pillanatnyi működését. Ezért a fájlokat elsősorban viszonylag ritkán használt adatokat. Például biztonsági mentés vagy telepítheti.

Abban a pillanatban, sok levéltár. Ők különböző előfordulási és hatékonyságát. Néhány érdekes archiváló nem ismert, hogy számos potenciális felhasználók. Különösen érdekesek azok értékelésére és összehasonlítására hatékonyságának tömörítési népszerű archivers.

Archiváló tömörítési módszerek.

Fejlődött számos különböző módszer, azok módosítását és alfaj adatkompresszióra. Modern archiváló hajlamosak, hogy egyszerre több módszerrel egyidejűleg. Akkor kiemelni a kulcsot.

Run Length Encoding (RLE - csökkentése távon - hossz kódolás - hossz kódolás).

Egy nagyon egyszerű módszer. Egymást követő sorozata azonos adatelemek helyébe két szimbólum: az elem és a számát az ismétlés. Széles körben használják, mint egy további, közbenső és a módszer. Mint független eljárást alkalmazunk, például egy grafikus formátumban BMP.

A leggyakoribb módszer. Ez használ egy szótár, amely a szavak és adatsorok. Amikor összenyomjuk ezek a szavak felváltja a kódokat a szótárban. A leggyakoribb kiviteli alakban a szolgál a szótárban is a forrás adatblokk.

A fő paraméterei a szókincs az eljárás akkora, mint egy szótárban. Minél nagyobb a szókincse, annál nagyobb a hatékonysága. Azonban az inhomogén túlságosan nagy méretű adatok káros lehet, mert a hirtelen változás az adatok típusát szótár tele lesz irreleváns szavakat. A hatékony működés a módszer a tömörítés igényel további memóriát. Körülbelül egy nagyságrenddel nagyobb, mint amire szükség van a kezdeti adatokat szótárban. Jelentős előnye a szótárban módszer egyszerű és gyors kicsomagolás eljárást. További memória nem szükséges. Ez a funkció különösen akkor fontos, ha szüksége van gyors hozzáférést az adatokhoz.

Entrópia módszer (Huffman - Huffman, aritmetikai kódolás - aritmetikai kódolás)

Ebben az eljárásban adatelemeket gyakrabban fordulnak elő, kódoljuk rövidebb kód tömörítés, és ritkább elemek kódolt adatok hosszú kódot. Tekintettel arra, hogy sokkal több a rövid kódok teljes mérete kisebb, mint az eredeti kapunk.

Széles körben használják, mint egy további módszert. Mint független eljárást alkalmazunk, például egy grafikus formátumban JPG.

összefüggésben modellezési módszer (CM - rövid kontextus modellezés - modellezése összefüggésben)

Ebben az eljárásban a modell eredeti adatokat. Összenyomja a következő adatelem, ez a modell adja a becslés vagy valószínűség. E szerint a valószínűsége adatelemet kódolt entrópia módszer. Minél pontosabb a modell megfeleljen az eredeti adatokat, annál pontosabb lesz kiadni becslés lesz, és a rövidebb kódolt adatokat elemekkel.

Építeni egy hatékony modell sok memóriát igényel. Kicsomagolásakor kell építeni pontosan ugyanazt a modellt. Ezért a memória mennyiségét és sebességét követelmények a csomagolás és kicsomagolás majdnem azonosak. Abban a pillanatban, az összefüggésben modellezési módszerek, így a legjobb tömörítési arány, de jellemzi egy nagyon alacsony arány.

PPM (PPM - Előrejelzés szerint Részleges egyezés - Jóslás részleges Matching).

Ez egy speciális alfaja kontextus modellezés. A becslés lefut alapján egy bizonyos számú korábbi adatelemeket. A fő paraméter a modellt annak érdekében, amely meghatározza az elemek száma. A magasabb rendű modell, a nagyobb a tömörítési arány, de több memóriát igényel, hogy tárolja a minta adatai. Ha kevés a memória, mint egy modell, egy nagy rendelést rossz eredmények. A módszer különösen hatékony a PPM tömörítés szöveges adatokat.

Előzetes átalakítás vagy szűrés.

Ezek a módszerek nem a tömörítés, és hogy az információkat megfelelő formában további tömörítést. Például tömörítetlen multimédiás adatok jellemzi sima jelszint változásaira. Ezért delta átalakítás alkalmazzák őket, amikor az abszolút érték helyett egy rokon. Vannak szűrők szöveg, végrehajtható fájlok, adatbázisok és mások.

Ez a különleges fajta vagy csoport átalakítás, amelyek alapján válogatás. Az ilyen transzformációt lehet alávetni szinte semmilyen adatot. Válogató végzünk blokkokat úgy, hogy az adatok a korábban részekre osztani. A fő paraméter a méret a blokk, amelyre a válogatás. Csomagoljuk ki a szükséges adatokat tenni szinte ugyanazokat a lépéseket, mint a csomagolás. Ezért a sebesség és memória igénye közel azonos. Archivators hogy használja ezt a módszert tipikusan magas aránya és a kompresszió a szöveges adatokat.

Folyamatos blokkok vagy folyamatos üzemmódban (Solid üzemmód - folyamatos üzemmód).

Számos módszer a tömörítés az eredeti adat vagy fájl kódolt rossz. Például, az eljárás a szókincs szótár üres. Az eljárás keretében modellezés modell nem épül. Ha a szám a nagy fájlok, és a kis méret, a teljes tömörítési arány jelentősen romlik miatt ezeket a kezdeti oldalakon. Ahhoz, hogy ez ne történhessen meg az átmenetet a következő fájl, a kapott információk alapján a korábbi fájlokat. Hasonló hatást lehet elérni egy egyszerű ábrázolása a forrás fájlokat egyetlen folyamatos fájlt.

Ezt a technikát használják számos archivers, és jelentős hátránya. Kicsomagolni egy tetszőleges fájlt, csomagolja ki és fájlok, amelyek az elején az archívumban. Szükséges, hogy a helyes megtöltését a szótárba, vagy a modell építését. Van is egy köztes lehetőség, ha használják a folyamatos blokkok egy fix méretű. veszteség elért tömörítés a minimum, de a kivonat egy fájl található, amely a végén egy nagy fájlt, akkor kell kicsomagolni egyetlen folyamatos blokk, és nem a teljes fájlt.

Az összes módszer tömörítés, amikor az adatok típusát az aktuális átmeneti maga kódolt nagyon rossz. Szótár válik relevánssá, egyedi modell egyéb adatokat. Ezekben az esetekben a szegmentálás. Ez egy előzetes lebontása homogén részein. Aztán ezek a részek vannak kódolva egyénileg vagy csoportosan.

Szeretném hangsúlyozni, hogy van egy nagy számú kompressziós módszerekkel. Mindegyik módszer általában középpontjában az egyik típusú vagy valós adatok csoportban. Jó eredmények azt mutatják, komplex módszerek alkalmazása.

Számos adattípusok már tömörített. Használata archiváló nyújt szerény méret csökkentését. Azonban még az ilyen esetekben, a hatékony tömörítési elméletileg lehetséges. Ez azért van, mert a leggyakoribb formátumok használatát tömörítés nem a leghatékonyabb módszer. Például, a JPG formátumban alapul entrópia tömörítés, amely után használható a Fourier-transzformáció. Adatblokk van kódolva szuboptimális miatt a vágy, hogy formátum JPG ellenáll a károkat és a lehetőséget a részinformációk kitermelés. Rekódolt JPG fájlok rendkívül hatékony módszer, tudjuk elérni a tömörítés 75% -a az eredeti fájl (archív StuffIt). Valójában az eredeti JPG fájl archiváló hagyományos sűrített csak legfeljebb 96%. Azonban az ilyen manipuláció a JPG tette lehetővé csak a közelmúltban, és még nem terjedt el széles körben. A legtöbb esetben, borogatás már tömörített adatok használhatatlan.

Mik az archiváló és miben térnek?

Meg kell különböztetni a megfelelő archiváló archív és tömörítési technikákat. Még egy és ugyanazon tömörítési eljárás lehet kiviteli alakok. Például, több mint egy tucat archiváló program, amely képes létrehozni fájlokat ZIP formátumban. adatok ZIP formátumú úgy állíthatjuk tömörített különböző módszerekkel: Deflate, deflate64 bzip2. Deflate eljárásnak több megvalósítások a különböző sebességű és tömörítési arány (a különbség a sorrendben 5%). Ezzel a módszerrel, a 7-zip archiváló lehetővé teszi, hogy fájlokat ZIP formátumban és 7Z.

Általában archiváló létrehozhatják levéltár saját kizárólagos formátum az eredeti módszerekkel. Például RAR archiváló lehetővé teszi, hogy a RAR archívumokat. A fájlformátum és tömörítési eljárások a fő előnye a archiváló.

A legegyszerűbb esetben a archiváló lehetővé teszi, hogy csak a csomagolás vagy kicsomagolni egy fájlt. Amellett, hogy a tényleges tömörítés, modern archivers néhány további funkciókat. Számos alapvető:

Bizonyos fájlok tömörítése és teljes könyvtárak;

létrehozása önkicsomagoló (SFX) archívumok. Ez kicsomagolni az archívum a program-archiváló nem szükséges;

archív tartalom változása;

titkosítani fájl tartalmát;

Információ helyreállítani egy biztonsági esetén részleges kárt, és a képesség, hogy visszaszerezze sérült levéltári

osztott fájlt több részre vagy térfogat;

A konzolos verziója a program dolgozni a parancssorból;

grafikus (GUI) változata a program.

Meg kell jegyezni, hogy annak ellenére, hogy a hivatalos, a végrehajtás minden további funkciók is el lehet végezni egy teljesen más szinten.

Amellett, hogy a különbségek a funkcionalitás, lehet két csoportra oszthatók archiváló: aszimmetrikus és szimmetrikus. Aszimmetrikus arkhivatory igényel kicsomagolás művelet sokkal kevesebb időt és memóriát igényel, mint a csomagolási művelet. Ez lehetővé teszi, hogy gyorsan kap a az archív fájl tartalmát az alacsony fogyasztású számítógépek. Szimmetrikus archiváló kereslet és kicsomagolás műveletek ugyanabban az időben és a RAM mennyisége. Az ilyen archívumok széles park számítógépek vagy gyors hozzáférést biztosít a tartalmát az archív korlátozott. Ismert archiváló RAR, mint a fő Szójegyzék használ aszimmetrikus tömörítési eljárás, és használhat egy szimmetrikus PPM-módszer szövegek. Így, RAR kicsomagolás kihúzására összenyomjuk egy maximális tömörítési arány nem lehet, hogy a számítógépek korlátozott memória. Minden, vagy majdnem az összes fejlett fájl archiváló magas tömörítési szimmetrikusak.

Pontos statisztikák prevalenciája archivers én nem. Fogom kifejezni szubjektív szempontból személyes tapasztalatain alapul. Kétségtelen, hogy a leggyakrabban a ZIP archiváló és annak módosításai. A prevalenciája lényegesen nagyobb, mint a legközelebbi versenytárs. Őket követi RAR és ACE. Az utóbbi években találkozik 7-zip archiváló. Egyéb archiváló és archív személyesen nem találkoztunk. A kivétel az egykor népszerű ARJ és LHA. Abban a pillanatban, hogy nem releváns, mivel a nagyon alacsony fokú tömörítés.

Tesztelés maximalizálja tömörítés archívumokat.

Ebben a tesztelés, a fő cél az volt, hogy meghatározzák a legjobb szintű archív tömörítés. Az összehúzódási sebessége másodlagos volt.

Sokoldalú vizsgálat és azonosítsa erősségeit és gyengeségeit használják számos adathalmazok, amelyek a különböző megközelítéseket és technikákat a jó tömörítés. Méretük választjuk elég nagy Archiválo egy nagyobb szókincs és hatékonyabban használja RAM mutathat az előnye. A tömörített ZIP, mert elfoglalják a mérete körülbelül 15 MB.

Minden adatsor, akkor általában a legoptimálisabb tömörítési beállítások. Azonban ebben a vizsgálatban, az összes adathalmaz közös paraméterek és módszerek, amelyek átlagosan a legjobb eredményeket alapul jelenlétében 512 MB RAM-mal. Ez a megközelítés egy kompromisszum. Egyrészt lehetséges, hogy értékelje a hatékonyságát a különböző típusú adatok, bár néhány archivers és nem mutatja a legnagyobb fokú tömörítés. Másrészt, a valóságban meg kell tömöríteni a teljes mappákat a különböző adatok és fajlagos értékeket a paraméterek befolyásolhatják mind pozitív, mind negatív tömörítés általában. Ezen kívül, a kiválasztás optimális paramétereket nem olyan egyszerű, időt vesz igénybe, és a való életben ritkán teljesül.

Hangsúlyozni kell, hogy a választás a bemeneti adatok nagyban befolyásolja a teszt eredményét. Például, ha a szöveg (TXT, HTML, DOC, LOG) és multimédiás (WAV) adatgyűjtő 7-zip (LZMA) azt mutatja, rosszabb eredményt, mint RAR, ami különleges eljárásokat az ilyen típusú adatok. A nem-összenyomható adatok (JPG, PDF) közötti különbséget mutatja nyomorúságos archiváló egy rossz és egy jó fokú tömörítés. By the way, sok a fájlok tartalmazhatnak olyan információkat, mind összenyomható és összenyomhatatlan. Beleértve a fájlokat DOC és PDF formátumban.

És erősen befolyásolja a választás a optimális tömörítés paramétereit. Például, szerinti www.maximumcompression.com, ispolzueschego optimális tömörítés paraméterek minden adatkészlet, a különbség a 7-zip és RAR mintegy 3%, lényegesen kisebb, mint a különbség kapott ebben a tesztben.

A tesztelés a rendszer: CPU - Athlon XP 2800+, RAM - 512 MB.