Souborový systém. Počítačové souborové systémy - popis a charakteristika Souborový systém PC

Soubor- pojmenovaná sada dat prezentovaná na počítačovém paměťovém médiu. Pojem soubor se vztahuje především na data uložená na discích, a proto jsou soubory obvykle identifikovány s oblastmi diskového úložiště na těchto médiích.

Souborový systém obsahuje pravidla pro tvorbu názvů souborů a způsoby přístupu k nim, systém obsahu souborů a strukturu pro ukládání souborů na disky.

Soubor má název a atributy(archivovaný, jen pro čtení, skrytý, systémový), charakterizovaný velikostí v bajtech, datem a časem vytvoření nebo poslední změny.

Název souboru se skládá ze dvou částí: skutečného názvu a přípony (typu). Typ může chybět. Název je od typu oddělen tečkou. V systému Windows můžete pojmenovat soubory dlouhé až 255 znaků. Typ označuje typ a účel souboru, některé z nich jsou standardní, například:

· .COM a .EXE - spustitelné soubory;

· .BAT - dávkový soubor příkazů;

· .TXT - textový soubor libovolného typu;

· .MDB - soubor databáze Access;

· .XLS – tabulka Excel;

· .DOC - textový soubor editoru Microsoft Word;

· .ZIP - zabalený soubor archivátoru Winzip/PkZip.

Použití standardních rozšíření umožňuje jejich nespecifikování při spouštění systémových programů a balíků aplikací a je použit výchozí princip.

Adresář (složka, adresář) - pojmenovaná sada souborů kombinovaných na základě příslušnosti ke stejnému softwarovému produktu nebo z jiných důvodů. Výraz „soubor je obsažen v adresáři“ nebo „soubor je obsažen v adresáři“ znamená, že informace o tomto souboru jsou zaznamenány v oblasti disku související s tímto adresářem. Názvy adresářů se řídí stejnými pravidly jako názvy souborů. Adresáře obvykle nemají příponu, i když ji lze přiřadit.

Na každém fyzickém nebo logickém disku je vykořenit(head) adresář, který nelze vytvořit, odstranit nebo přejmenovat uživatelskými prostředky. Označuje se znakem '\' (v některých operačních systémech můžete také použít '/'). Další adresáře a soubory mohou být registrovány v hlavním adresáři. Podadresáře mohou naopak obsahovat adresáře nižší úrovně. Tato struktura se nazývá hierarchický systém nebo strom adresáře, ve kterých hlavní adresář tvoří kořen stromu a zbývající adresáře jsou jako větve.

Seskupování souborů do adresářů neznamená, že jsou nějakým způsobem seskupeny na jednom místě na disku. Navíc tentýž soubor může být „rozsypán“ (fragmentován) po celém disku. Soubory se stejnými názvy mohou být umístěny v několika adresářích na disku, ale několik souborů stejného jména nemůže být umístěno ve stejném adresáři.

Aby měl operační systém přístup k souboru, musíte zadat:

· cesta podél stromu adresářů;

· celý název souboru.

Tato informace je uvedena v specifikace souboru, který má následující formát:

[jednotka:][cesta]název souboru[.typ]

Hranaté závorky označují, že odpovídající část specifikace může být vynechána. V tomto případě se použije hodnota výchozí.

Pokud není zadán žádný disk, použije se aktuální disk. Aktuální disk je disk, na kterém aktuálně běží operační systém.

Cesta-pořadí složek, které je třeba přejít k požadovanému souboru. Jména v cestě jsou psána v sestupném pořadí podle priority a jsou oddělena znakem "\". Zavolá se adresář, který obsahuje aktuální adresář rodičovský.

Poměrně často je potřeba zpracovat několik souborů najednou jedním příkazem. Například odstraňte všechny záložní soubory s příponou BAK nebo přepište několik souborů dokumentů s názvy doc1.txt, doc2.txt atd. V těchto případech použijte speciální znaky - masky, což vám umožní popsat skupinu souborů jedním jménem. Masky jsou jen dvě:

· symbol * v názvu souboru nebo příponě nahrazuje libovolný povolený počet znaků;

· symbol? nahradí jakýkoli znak nebo chybějící znak v názvu souboru nebo přípony.

Naše příklady budou odpovídat maskám *.bak (všechny soubory s příponou bak) a doc?.txt (všechny soubory s příponou txt a 4znakovým názvem začínajícím na doc).

Otázky k tématu zaslané k testování:

1. Definice OS. Základní koncepty OS Windows (multitasking, grafické uživatelské rozhraní, vkládání a datová vazba).

2. Grafické uživatelské rozhraní, jeho hlavní součásti (okna, dialogové nástroje, standardní správa oken a dialogové nástroje).

3. Práce s klávesnicí a myší ve Windows. Standardní kombinace kláves a operace myši.

4. Práce se soubory a složkami ve Windows - základní operace a možnosti. Programy „Tento počítač“ a „Průzkumník“.

5. Vyhledávání informací ve Windows.

6. Vytvořte zástupce aplikací a dokumentů.

7. Ovládací panel a jeho hlavní součásti.

8. Řešení poruch ve Windows.

9. Nastavení aplikací DOS pro Windows.

a umístění banneru je POVINNÉ!!!

Plán lekce č. 5

V disciplíně INFORMAČNÍ VĚDA

Oddíl 2. Informační technologie Souborový systém osobního počítače. Správce souborů Norton Commander

cíle:

didaktický: zopakujte si koncept souborového systému osobního počítače, naučte studenty používat správce souborů Norton Commander.

rozvíjející se: rozvíjet informační myšlení žáků.

vzdělávací: vychovat ze studentů moderní odborníky, kteří dokážou aplikovat nové pokročilé technologie v praktických činnostech.

Typ lekce (typ lekce): přednáška

Organizační formy školení: přednáška-rozhovor

Vyučovací metody: konverzace

Vzdělávací prostředky

Typ a formy kontroly znalostí: frontální průzkum

Řízení

Vnitropředmětové vazby

Mezioborové vazby

Typy samostatné práce studentů

Domácí práce: opakovat poznámky z přednášek

Průběh lekce

Souborový systém osobního počítače

Složky a soubory (typ souboru, název souboru). Souborový systém. Základní operace se soubory v operačním systému

Soubor. Všechny programy a data jsou uložena v dlouhodobé (externí) paměti počítače ve formě souborů. Soubor je určité množství informací (program nebo data), které má jméno a je uloženo v dlouhodobé (externí) paměti.

Název souboru se skládá ze dvou částí oddělených tečkou: skutečný název souboru A rozšíření, definující jeho typ (program, data atd.). Skutečný název souboru je dán uživatelem a typ souboru je obvykle nastaven automaticky programem při jeho vytvoření.

Různé operační systémy mají různé formáty souborů. V operačním systému MS-DOS nesmí samotný název souboru obsahovat více než osm písmen latinské abecedy a číslic a přípona se skládá ze tří latinských písmen, například: proba.txt

V operačním systému Windows může mít název souboru až 255 znaků a lze použít ruskou abecedu, například: Jednotky informací.doc

Souborový systém. Každé paměťové médium (disketa, pevný nebo laserový disk) může uložit velké množství souborů. Pořadí, ve kterém jsou soubory uloženy na disku, je určeno nainstalovaným systémem souborů.

Pro disky s malým počtem souborů (do několika desítek) je vhodné použít jednoúrovňový souborový systém, kdy adresář (obsah disku) je lineární posloupnost názvů souborů.

Pokud jsou na disku uloženy stovky a tisíce souborů, pak jsou pro snadné vyhledávání soubory uspořádány do víceúrovňového hierarchického systému souborů, který má „stromovou“ strukturu.

Základní, vykořenit, adresář obsahuje vnořené adresáře 1. úrovně, zase každý z nich obsahuje vnořené adresáře 2. úrovně atd. Je třeba poznamenat, že soubory lze ukládat do adresářů na všech úrovních.

Operace se soubory. Při práci se soubory na počítači se nejčastěji provádějí následující operace:

* kopírování– kopie souboru je umístěna v jiném adresáři;

* pohybující se– samotný soubor se přesune do jiného adresáře;

* vymazání– záznam souboru je smazán z adresáře;

* přejmenování– název souboru se změní.

Grafické znázornění souboru systémy. Hierarchický souborový systém MS-DOS, obsahující adresáře a soubory, je v operačním systému Windows prezentován pomocí grafického rozhraní a formou hierarchického systému složek a dokumentů. Složka v Okna je analogický adresáři MS-DOS.

Hierarchické struktury těchto systémů jsou však poněkud odlišné. V hierarchickém souborovém systému MS-DOS je vrcholem hierarchie objektů kořenový adresář disku, který lze přirovnat ke kmeni stromu - na něm rostou větve (podadresáře) a listy (soubory) jsou umístěny na větví.

Ve Windows je v horní části hierarchie složek složka Plocha (obrázek 1).

plocha počítače

Koš mého počítače Network Neighborhood

A B C B E PC1 PC2 PC3 PC4

Rýže. 1. Hierarchická struktura složek

Další úroveň představují složky Tento počítač, Koš a Okolní počítače (pokud je počítač připojen k místní síti).

Správce souborů Norton Commander

Úvod

Operační shell Norton Commander (NC) je navržen tak, aby usnadnil používání osobního počítače při každodenní práci v operačních systémech MS-DOS a Windows. Norton Commander umožňuje jednoduchou a pohodlnou formou provádět často používané operace se soubory, adresáři a disky, jako je kopírování a mazání souborů, procházení adresářů, vyhledávání souborů a mnoho dalších.

Hlavní soubor se jmenuje nc.exe. Norton je obvykle nainstalován na jednotce C: v adresáři NC. Chcete-li jej spustit na příkazovém řádku, musíte zadat:

C:\>C:\NC\NC

C:\>NC\NC

Když spustíte Norton Commander, objeví se na obrazovce dvě modrá okna nazývaná panely, podobná těm na obrázku.

NC obrazovka lze rozdělit na čtyři části. Pojďme si je uvést shora dolů:

* Rozbalovací nabídky;

* Informační panely – levý a pravý;

* Příkazový řádek;

* Funkční klávesy.

Rozbalovací nabídky umožňují provádět téměř všechny NC funkce. Lze k němu přistupovat z klávesnice pomocí klávesy .

Panely- jedná se o hlavní okna pro zobrazení informací o struktuře souborového systému vašeho PC, tzn. o umístění souborů a adresářů. Každý panel může obsahovat následující informace:

* názvy souborů v plném tvaru (s uvedením velikosti, data a času poslední úpravy) a krátkém (pouze název) v různých způsobech řazení;

* hierarchický strom souborů (umístění souborů a podadresářů do adresářů);

* informace o tomto adresáři nebo disku.

Příkazový řádek- prostor pro uživatele přímo psát příkazy MS DOS a vydávat zprávy. Zde se nachází kurzor příkazového řádku systému DOS.

Funkční klávesy se používají speciálně pro rychlé provedení požadovaného příkazu. K těmto tlačítkům má přístup manipulátor Myš.

Pokud se podíváte pozorně, v jednom z panelů najdete šedozelený obdélník zvýrazňující konkrétní pozici. Toto je kurzor panelu Norton Commander. Pohybuje se pomocí stejných kláves jako běžný, a to kurzorových kláves. Kurzor lze mezi panely přesouvat stisknutím klávesy nebo . Tyto operace lze provádět také pomocí myši. Udělejme si výhradu, že slovem „kurzor“ musíme rozumět právě tomuto výběru pozadí zvolené pozice. S jeho pomocí se můžeme pohybovat v souborech, adresářích a počítačových discích. Všimněte si, že v levém horním rohu panelu otevřeného (aktuálního, nikoli kořenového) adresáře jsou symboly „..“ (dvě tečky, nezaměňovat s dvojtečkou „:“). Tato pozice je určena k odchodu z tohoto adresáře do adresáře vyšší úrovně. Panel, ve kterém se nachází kurzor, se nazývá aktivní panel.

Operace s vybraným souborem lze provádět stisknutím klávesy . Pokud má vybraný soubor příponu „com“, „exe“ nebo „bat“, pak se spustí. Jinak se nic nestane.

Některé operace (kopírování, přesouvání, mazání atd.) lze provádět nikoli na jednom objektu, ale na skupinách vybraných souborů najednou. Chcete-li vybrat soubory, přesuňte kurzor na požadovaný soubor a stiskněte klávesu, název souboru se zvýrazní žlutě, poté stejným způsobem vyberte další soubor atd. Soubory lze také vybrat stisknutím klávesy [+]. Poté do zobrazeného panelu zadejte vzor souborů, které chcete vybrat (například „*. com“ – všechny soubory s příponou „com“) a klikněte. Některé soubory můžete ze skupiny vybraných souborů vyloučit stisknutím nebo stisknutím [-], zadáním šablony souboru a stisknutím .

Funkční klávesy

Jak již bylo zmíněno, v úplném spodním řádku obrazovky jsou uvedeny příkazy dostupné pro funkční klávesy. Pojďme se na ně podívat blíže.

Klíč - "Nápověda" - "Nápověda"

Po stisknutí této klávesy se na obrazovce zobrazí část „Nápověda“ popisující účel kláves a příkazů pro prováděnou operaci. Pokud právě neprobíhají žádné operace, klávesa vyvolá obsah všech sekcí systému nápovědy.

V nápovědě můžete procházet stisknutím příslušných kláves.

Klíč - "Volat" - "Uživatel"

Pomocí klávesy může uživatel vyvolat další nabídku jím vytvořených příkazů (pokud jsou vytvořeny), provedených při stisknutí libovolné klávesy. Tato nabídka může obsahovat příkazy a programy, které se při práci nejčastěji používají.

Klíč - "Čtení" - "Zobrazit"

Tento příkaz vám umožňuje zobrazit obsah souborů na obrazovce, aniž byste je měnili. Výhodou příkazu zobrazení souboru oproti textovým editorům je, že vám umožňuje prohlížet soubory libovolné délky a to velmi rychle.

Klíč - "Upravit" - "Upravit"

Pomocí tohoto příkazu se vybraný soubor načte do vestavěného editoru Norton Commander (mimochodem, můžete připojit jakýkoli jiný externí editor).

Vyberte soubor a klikněte na .

Klíč - "Kopírovat" - "Kopírovat"

Tento příkaz umožňuje kopírování.

Klíč - "Nové jméno" - "RenMov"

Pomocí tohoto příkazu můžete přejmenovat a přesunout soubory nebo adresáře.

Klíč - "NovKat" - "Mkdir"

Klíč umožňuje v aktivním panelu vytvořit nový adresář, který bude podadresářem aktuálního.

Připomeňme, že názvy adresářů mohou mít maximálně osm znaků a mít příponu až tři znaky, což je v zásadě nepovinné.

Klávesa - "Delete" - "Delete"

Pomocí příkazu dostupného přes tento klíč můžete mazat soubory a adresáře.

Před odstraněním skupiny souborů jste dotázáni, zda jste si touto operací jisti (červený rámeček se slovy „OK“ a „Zrušit“), pokud jste si jisti, klikněte na , pokud ne, klikněte na .

Klávesa - "Menu" - "Menu"

Tento příkaz otevře přístup k rozevírací nabídce na úplně horním řádku obrazovky. Jeho příkazy a jejich funkce budou popsány v odpovídající části této příručky.

Klávesa - "Exit" - "Quit"

Stisknutím klávesy ukončíte Norton Commander. Také se vás zeptá, zda jste si touto operací jisti (šedý rámeček se slovy „Ano“ a „Ne“), pokud jste si jisti, stiskněte , pokud si nejste jisti, stiskněte .

Změnit pohon - pohon

Tato položka nabídky umožňuje rychle změnit pracovní disk v levém a pravém panelu. Po zvolení tohoto příkazu se zobrazí seznam připojených úložných zařízení (disků), ze kterého vyberte to, které potřebujete, a klikněte na . Tento příkaz se také provede, když stisknete kombinaci kláves - pro levý panel a - pro pravý panel.

Práce s myší

Manipulátor Myš značně usnadňuje práci s Norton Commanderem. Při jeho používání můžete libovolně pohybovat červeným kurzorem „myši“ po obrazovce a provádět různé akce.

* Chcete-li vybrat soubor, přesuňte červený kurzor myši na soubor a stiskněte levé tlačítko myši.

* Chcete-li spustit soubor ke spuštění, rychle na něj dvakrát klikněte levým tlačítkem - program se spustí.

* Chcete-li zahrnout soubor do skupiny, stiskněte pravé tlačítko myši (podobně jako stisknutí klávesy).

* Chcete-li vybrat pozici z libovolné nabídky, přesuňte kurzor na požadovanou pozici pomocí myši a stiskněte levé tlačítko myši.

Chcete-li například zkopírovat vybraný soubor, přesuňte červený kurzor myši na soubor, stiskněte levé tlačítko myši, poté vyberte slovo „Kopírovat“ ve spodním řádku a znovu stiskněte levé tlačítko myši. Pokud jste spokojeni s účelem kopírování, stiskněte pravou klávesu - kopírování se provede, kopírování zrušte - klávesa na klávesnici.

Použití myši nevylučuje možnost psaní příkazů z klávesnice.

Provádění příkazů DOS

Příkazy lze zadávat přímo do příkazového řádku DOSu. Chcete-li to provést, jednoduše zadejte příkaz na klávesnici a stiskněte. Pokud příkaz vyžaduje název souboru a jeho příponu, vyberte soubor, zadejte název příkazu a poté (stiskněte a podržte).

Plán lekce č. 5

Souborový systém osobního počítače. Správce souborů Norton Commander

Líbí se? Prosím, poděkujte nám! Je to pro vás zdarma a je to pro nás velká pomoc! Přidejte si náš web do své sociální sítě:

Všeobecné. V teorii informatiky jsou definovány následující tři hlavní typy datových struktur: lineární, tabulkové, hierarchické. Ukázka knihy: sekvence listů - lineární struktura. Části, oddíly, kapitoly, odstavce - hierarchie. Obsah – tabulka – spojuje – hierarchické s lineárním. Strukturovaná data mají nový atribut - Adresa. Tak:

      Lineární struktury (seznamy, vektory). Pravidelné seznamy. Adresa každého prvku je jednoznačně určena jeho číslem. Pokud mají všechny prvky seznamu stejnou délku – datové vektory.

      Tabulkové struktury (tabulky, matice). Rozdíl mezi tabulkou a seznamem - každý prvek - je určen adresou, která se skládá nikoli z jednoho, ale z několika parametrů. Nejběžnějším příkladem je matice - adresa - dva parametry - číslo řádku a číslo sloupce. Vícerozměrné tabulky.

      Hierarchické struktury. Používá se k prezentaci nepravidelných dat. Adresa je určena trasou - z vrcholu stromu. Souborový systém - počítač. (Trasa může přesáhnout datovou velikost, dichotomie - vždy jsou dvě větve - levá a pravá).

Uspořádání datových struktur. Hlavní metodou je třídění. ! Při přidávání nového prvku do objednané struktury je možné změnit adresu stávajících. U hierarchických struktur – indexování – má každý prvek jedinečné číslo – které se pak používá při řazení a vyhledávání.

    Základní prvky souborového systému

Historicky prvním krokem v ukládání a správě dat bylo použití systémů pro správu souborů.

Soubor je pojmenovaná oblast externí paměti, do které lze zapisovat a z ní číst. Tři parametry:

    sekvence libovolného počtu bajtů,

    jedinečné vlastní jméno (ve skutečnosti adresa).

    data stejného typu – typ souboru.

Pravidla pro pojmenování souborů, způsob přístupu k datům uloženým v souboru a struktura těchto dat závisí na konkrétním systému správy souborů a případně na typu souboru.

První, v moderním smyslu, vyvinutý souborový systém byl vyvinut společností IBM pro svou řadu 360 (1965-1966). Ale v současných systémech se prakticky nepoužívá. Použité datové struktury seznamu (EC-svazek, sekce, soubor).

Většina z vás zná souborové systémy moderních operačních systémů. Jedná se především o MS DOS, Windows a některé s konstrukcí souborového systému pro různé varianty UNIXu.

Struktura souboru. Soubor představuje kolekci datových bloků umístěných na externím médiu. Pro výměnu s magnetickým diskem na úrovni hardwaru je třeba zadat číslo válce, číslo povrchu, číslo bloku na odpovídající stopě a počet bajtů, které je třeba zapsat nebo přečíst od začátku tohoto bloku. Všechny souborové systémy proto explicitně nebo implicitně alokují nějakou základní úroveň, která zajišťuje práci se soubory, které představují sadu přímo adresovatelných bloků v adresním prostoru.

Pojmenování souborů. Všechny moderní souborové systémy podporují víceúrovňové pojmenování souborů udržováním dalších souborů se speciální strukturou – adresáři – v externí paměti. Každý adresář obsahuje názvy adresářů a/nebo souborů obsažených v tomto adresáři. Úplný název souboru se tedy skládá ze seznamu názvů adresářů plus názvu souboru v adresáři, který soubor bezprostředně obsahuje. Rozdíl mezi tím, jak jsou soubory pojmenovávány v různých souborových systémech, spočívá v tom, kde začíná řetězec jmen. (Unix, DOS-Windows)

Ochrana souborů. Systémy správy souborů musí poskytovat oprávnění pro přístup k souborům. Obecně se postupuje tak, že ve vztahu ke každému registrovanému uživateli daného počítačového systému jsou u každého existujícího souboru uvedeny akce, které jsou pro tohoto uživatele povolené nebo zakázané. Byly pokusy tento přístup implementovat v plném rozsahu. To však způsobilo příliš mnoho režie jak při ukládání nadbytečných informací, tak při používání těchto informací ke kontrole způsobilosti přístupu. Proto většina moderních systémů správy souborů používá přístup ochrany souborů poprvé implementovaný v UNIXu (1974). V tomto systému je každému registrovanému uživateli přiřazena dvojice celočíselných identifikátorů: identifikátor skupiny, do které tento uživatel patří, a jeho vlastní identifikátor ve skupině. V souladu s tím je pro každý soubor uložen úplný identifikátor uživatele, který tento soubor vytvořil, a je uvedeno, jaké akce může se souborem provádět on sám, jaké akce se souborem jsou dostupné ostatním uživatelům stejné skupiny a jaké uživatelé jiných skupin mohou se souborem pracovat. Tyto informace jsou velmi kompaktní, vyžadují několik kroků při ověřování a tento způsob řízení přístupu je ve většině případů uspokojivý.

Režim přístupu pro více uživatelů. Pokud operační systém podporuje režim pro více uživatelů, je docela možné, že se dva nebo více uživatelů současně pokusí pracovat se stejným souborem. Pokud budou všichni tito uživatelé soubor pouze číst, nestane se nic špatného. Pokud ale alespoň jeden z nich změní soubor, je pro správnou funkci této skupiny nutná vzájemná synchronizace. Historicky souborové systémy zvolily následující přístup. V operaci otevření souboru (první a povinná operace, kterou by měla začít relace práce se souborem), byl kromě jiných parametrů uveden provozní režim (čtení nebo změna). + existují speciální postupy pro synchronizaci uživatelských akcí. Záznamy nepovoleny!

    Žurnálování v souborových systémech. Obecné zásady.

Spuštění kontroly systému (fsck) na velkých souborových systémech může trvat dlouho, což je vzhledem k dnešním vysokorychlostním systémům nešťastné. Důvodem, proč neexistuje integrita v systému souborů, může být nesprávné odpojení, například, že se na disk v době ukončení zapisovalo. Aplikace mohou aktualizovat data obsažená v souborech a systém může aktualizovat metadata souborového systému, což jsou „data o datech souborového systému“, jinými slovy informace o tom, které bloky jsou přidruženy ke kterým souborům, které soubory jsou umístěny ve kterých adresářích, a podobně. . Chyby (nedostatek integrity) v datových souborech jsou špatné, ale mnohem horší jsou chyby v metadatech souborového systému, které mohou vést ke ztrátě souborů a dalším vážným problémům.

Aby se minimalizovaly problémy s integritou a minimalizovala se doba restartování systému, žurnálovaný souborový systém udržuje seznam změn, které provede v systému souborů, než změny skutečně zapíše. Tyto záznamy jsou uloženy v samostatné části souborového systému nazývané „žurnál“ nebo „protokol“. Jakmile jsou tyto záznamy žurnálu (protokolu) bezpečně zapsány, systém souborů žurnálování provede tyto změny v systému souborů a poté tyto záznamy z „protokolu“ (protokolu) odstraní. Záznamy protokolu jsou uspořádány do sad souvisejících změn systému souborů, podobně jako jsou změny přidané do databáze organizovány do transakcí.

Žurnálovaný souborový systém zvyšuje pravděpodobnost integrity, protože záznamy souboru protokolu jsou prováděny před provedením změn v systému souborů a protože systém souborů uchovává tyto záznamy, dokud nejsou plně a bezpečně aplikovány na systém souborů. Když restartujete počítač, který používá žurnálovaný systém souborů, může program mount zajistit integritu systému souborů tím, že jednoduše zkontroluje v souboru protokolu změny, které byly očekávány, ale nebyly provedeny, a zapíše je do systému souborů. Ve většině případů systém nemusí kontrolovat integritu souborového systému, což znamená, že počítač používající žurnálovaný souborový systém bude k dispozici pro použití téměř okamžitě po restartu. V souladu s tím je výrazně snížena šance na ztrátu dat v důsledku problémů v systému souborů.

Klasickou formou žurnálovaného souborového systému je ukládat změny v metadatech souborového systému do žurnálu (logu) a ukládat změny všech dat souborového systému, včetně změn v souborech samotných.

    Souborový systém MS-DOS (FAT)

Souborový systém MS-DOS je stromový souborový systém pro malé disky a jednoduché adresářové struktury, přičemž kořenem je kořenový adresář a listy jsou soubory a další adresáře, případně prázdné. Soubory spravované tímto souborovým systémem jsou umístěny ve shlucích, jejichž velikost se může pohybovat od 4 kB do 64 kB v násobcích 4, bez použití vlastnosti sousedství smíšeným způsobem k alokaci diskové paměti. Na obrázku jsou například tři soubory. Soubor File1.txt je poměrně velký: obsahuje tři po sobě jdoucí bloky. Malý soubor File3.txt využívá prostor pouze jednoho přiděleného bloku. Třetí soubor je File2.txt. je velký fragmentovaný soubor. V každém případě vstupní bod ukazuje na první alokovatelný blok vlastněný souborem. Pokud soubor používá více alokovaných bloků, předchozí blok ukazuje na následující v řetězci. Hodnota FFF je označena koncem sekvence.

FAT oddíl disku

Pro efektivní přístup k souborům použijte alokační tabulka souborů– File Allocation Table, která se nachází na začátku oddílu (nebo logické jednotky). Název tohoto souborového systému – FAT – pochází z názvu alokační tabulky. Pro ochranu oddílu jsou na něm uloženy dvě kopie FAT pro případ, že by se jedna z nich poškodila. Kromě toho musí být alokační tabulky souborů umístěny na přísně pevných adresách, aby byly správně umístěny soubory potřebné ke spuštění systému.

Alokační tabulka souborů se skládá z 16bitových prvků a obsahuje následující informace o každém clusteru logických disků:

    cluster se nepoužívá;

    cluster je používán souborem;

    špatný shluk;

    poslední souborový cluster;.

Protože každému clusteru musí být přiřazeno jedinečné 16bitové číslo, podporuje FAT maximálně 216 nebo 65 536 clusterů na jednom logickém disku (a také si některé clustery vyhrazuje pro vlastní potřeby). Dostaneme tak maximální velikost disku obsluhovaného MS-DOSem na 4 GB. Velikost clusteru lze zvětšit nebo zmenšit v závislosti na velikosti disku. Když však velikost disku překročí určitou hodnotu, clustery se příliš zvětší, což vede k vnitřní defragmentaci disku. Kromě informací o souborech může alokační tabulka souborů obsahovat také informace o adresářích. To považuje adresáře za speciální soubory s 32bajtovými položkami pro každý soubor obsažený v tomto adresáři. Kořenový adresář má pevnou velikost – 512 záznamů pro pevný disk a u disket je tato velikost určena velikostí diskety. Kromě toho je kořenový adresář umístěn bezprostředně po druhé kopii FAT, protože obsahuje soubory potřebné pro zavaděč systému MS-DOS.

Při hledání souboru na disku je systém MS-DOS nucen prohledávat adresářovou strukturu, aby jej našel. Chcete-li například spustit spustitelný soubor, C:\Program\NC4\nc.exe najde spustitelný soubor takto:

    čte kořenový adresář jednotky C: a hledá v něm adresář Program;

    čte počáteční program clusteru a hledá v tomto adresáři záznam o podadresáři NC4;

    čte počáteční cluster podadresáře NC4 a hledá v něm položku pro soubor nc.exe;

    přečte všechny clustery souboru nc.exe.

Tato metoda vyhledávání není nejrychlejší mezi současnými systémy souborů. Navíc, čím větší hloubka adresářů, tím pomalejší bude vyhledávání. Pro urychlení operace vyhledávání byste měli udržovat vyváženou strukturu souborů.

Výhody FAT

    Je to nejlepší volba pro malé logické disky, protože... začíná s minimální režií. Na discích, jejichž velikost nepřesahuje 500 MB, pracuje s přijatelným výkonem.

Nevýhody FAT

    Vzhledem k tomu, že velikost položky souboru je omezena na 32 bajtů a informace musí zahrnovat velikost souboru, datum, atributy atd., velikost názvu souboru je také omezena a nesmí překročit 8+3 znaky pro každý soubor. Použití takzvaných krátkých názvů souborů činí FAT méně atraktivním pro použití než jiné systémy souborů.

    Používání FAT na discích větších než 500 MB je iracionální kvůli defragmentaci disku.

    Systém souborů FAT nemá žádné bezpečnostní funkce a podporuje minimální možnosti zabezpečení informací.

    Rychlost operací ve FAT je nepřímo úměrná hloubce vnoření adresářů a místu na disku.

    Souborový systém UNIX – systémy (ext3)

Moderní, výkonný a bezplatný operační systém Linux poskytuje širokou oblast pro vývoj moderních systémů a zakázkového softwaru. Některé z nejzajímavějších novinek v nedávných linuxových jádrech jsou nové, vysoce výkonné technologie pro správu ukládání, umístění a aktualizace dat na disku. Jedním z nejzajímavějších mechanismů je souborový systém ext3, který je integrován do linuxového jádra od verze 2.4.16 a je již standardně dostupný v linuxových distribucích od Red Hat a SuSE.

Souborový systém ext3 je žurnálovací souborový systém, 100% kompatibilní se všemi nástroji vytvořenými k vytváření, správě a dolaďování souborového systému ext2, který se na systémech Linux používá již několik let. Než podrobně popíšeme rozdíly mezi souborovými systémy ext2 a ext3, ujasněme si terminologii souborových systémů a ukládání souborů.

Na systémové úrovni všechna data v počítači existují jako bloky dat na nějakém úložném zařízení, organizované pomocí speciálních datových struktur do oddílů (logických sad na úložném zařízení), které jsou zase organizovány do souborů, adresářů a nepoužívané (volné) prostor.

Souborové systémy jsou vytvářeny na diskových oddílech, aby se zjednodušilo ukládání a organizace dat ve formě souborů a adresářů. Linux, stejně jako systém Unix, používá hierarchický souborový systém složený ze souborů a adresářů, které obsahují buď soubory, nebo adresáře. Soubory a adresáře v souborovém systému Linux jsou uživateli zpřístupněny jejich připojením (příkaz „mount“), což je obvykle součástí procesu spouštění systému. Seznam systémů souborů dostupných k použití je uložen v souboru /etc/fstab (FileSystem TABle). Seznam souborových systémů, které nejsou aktuálně připojeny systémem, je uložen v souboru /etc/mtab (Mount TABle).

Když je souborový systém připojen během bootování, vymaže se bit v záhlaví („čistý bit“), což znamená, že se souborový systém používá a že datové struktury používané k řízení umístění a organizace souborů a adresářů v rámci tohoto souborového systému může být změněno.

Systém souborů je považován za úplný, pokud jsou všechny datové bloky v něm buď používány, nebo jsou volné; každý alokovaný datový blok je obsazen pouze jedním souborem nebo adresářem; všechny soubory a adresáře jsou přístupné po zpracování řady dalších adresářů v systému souborů. Když je linuxový systém úmyslně vypnut pomocí příkazů operátora, všechny souborové systémy jsou odpojeny. Odpojení systému souborů během vypínání nastaví v hlavičce systému souborů „čistý bit“, což znamená, že systém souborů byl správně odpojen a lze jej tedy považovat za nedotčený.

Roky ladění a přepracování souborového systému a používání vylepšených algoritmů pro zápis dat na disk výrazně snížilo poškození dat způsobené aplikacemi nebo samotným linuxovým jádrem, ale eliminace poškození a ztráty dat v důsledku výpadků napájení a dalších systémových problémů je stále výzvou. . V případě havárie nebo prostého vypnutí linuxového systému bez použití standardních vypínacích procedur se „čistý bit“ v hlavičce souborového systému nenastaví. Při příštím spuštění systému proces připojení zjistí, že systém není označen jako „čistý“ a fyzicky zkontroluje jeho integritu pomocí nástroje pro kontrolu systému souborů Linux/Unix „fsck“ (File System CheckK).

Pro Linux je k dispozici několik žurnálovacích souborových systémů. Nejznámější z nich jsou: XFS, žurnálovací souborový systém vyvinutý společností Silicon Graphics, ale nyní vydaný jako open source; RaiserFS, žurnálovací souborový systém navržený speciálně pro Linux; JFS, žurnálovací souborový systém původně vyvinutý IBM, ale nyní vydaný jako open source; ext3 je souborový systém vyvinutý Dr. Stephanem Tweediem ze společnosti Red Hat a několika dalšími systémy.

Systém souborů ext3 je žurnálovaná verze systému souborů ext2 pro Linux. Souborový systém ext3 má oproti jiným žurnálovacím souborovým systémům jednu významnou výhodu – je plně kompatibilní se souborovým systémem ext2. To umožňuje používat všechny existující aplikace určené k manipulaci a přizpůsobení souborového systému ext2.

Souborový systém ext3 je podporován linuxovými jádry verze 2.4.16 a novější a musí být povolen pomocí dialogu Konfigurace souborového systému při sestavování jádra. Linuxové distribuce jako Red Hat 7.2 a SuSE 7.3 již obsahují nativní podporu pro souborový systém ext3. Souborový systém ext3 můžete používat pouze tehdy, pokud je podpora ext3 zabudována do vašeho jádra a máte nejnovější verze utilit „mount“ a „e2fsprogs“.

Ve většině případů převod systémů souborů z jednoho formátu na jiný vyžaduje zálohování všech obsažených dat, přeformátování oddílů nebo logických svazků obsahujících systém souborů a poté obnovení všech dat do tohoto systému souborů. Vzhledem ke kompatibilitě souborových systémů ext2 a ext3 není nutné všechny tyto kroky provádět a překlad lze provést pomocí jediného příkazu (spustit s právy root):

# /sbin/tune2fs -j<имя-раздела >

Například převod souborového systému ext2 umístěného na oddílu /dev/hda5 na souborový systém ext3 lze provést pomocí následujícího příkazu:

# /sbin/tune2fs -j /dev/hda5

Volba "-j" příkazu "tune2fs" vytvoří žurnál ext3 na existujícím souborovém systému ext2. Po převodu souborového systému ext2 na ext3 musíte také provést změny v položkách souboru /etc/fstab, abyste označili, že oddíl je nyní souborovým systémem "ext3". Můžete také použít automatickou detekci typu diskového oddílu (volba „auto“), ale přesto se doporučuje explicitně specifikovat typ systému souborů. Následující příklad souboru /etc/fstab ukazuje změny před a po přenosu systému souborů pro oddíl /dev/hda5:

/dev/ hda5 /opt ext2 výchozí 1 2

/dev/ hda5 /opt ext3 výchozí 1 0

Poslední pole v /etc/fstab určuje krok v procesu zavádění, během kterého by měla být kontrolována integrita souborového systému pomocí nástroje "fsck". Při použití souborového systému ext3 můžete tuto hodnotu nastavit na "0", jak je ukázáno v předchozím příkladu. To znamená, že program "fsck" nikdy nebude kontrolovat integritu souborového systému, protože integrita souborového systému je zaručena vrácením žurnálu.

Převod kořenového souborového systému na ext3 vyžaduje speciální přístup a nejlépe se provádí v režimu jednoho uživatele po vytvoření RAM disku, který podporuje souborový systém ext3.

Kromě kompatibility s nástroji souborového systému ext2 a snadného překladu souborového systému z ext2 na ext3 nabízí souborový systém ext3 také několik různých typů žurnálování.

Systém souborů ext3 podporuje tři různé režimy žurnálování, které lze aktivovat ze souboru /etc/fstab. Tyto režimy protokolování jsou následující:

    Žurnál/žurnál – zaznamenává všechny změny dat a metadat souborového systému. Nejpomalejší ze všech tří režimů protokolování. Tento režim minimalizuje možnost ztráty změn souborů, které provedete v systému souborů.

    Sekvenční/uspořádané – Zapisuje změny pouze do metadat souborového systému, ale zapisuje aktualizace dat souborů na disk před změnami souvisejících metadat souborového systému. Tento režim protokolování ext3 je nainstalován ve výchozím nastavení.

    Zpětný zápis – zapisují se pouze změny metadat systému souborů na základě standardního procesu zápisu změn do dat souboru. Toto je nejrychlejší způsob protokolování.

Rozdíly mezi těmito režimy protokolování jsou jemné a hluboké. Použití režimu žurnálu vyžaduje, aby souborový systém ext3 zapsal každou změnu do systému souborů dvakrát – nejprve do žurnálu a poté do samotného systému souborů. To může snížit celkový výkon vašeho souborového systému, ale tento režim je mezi uživateli nejoblíbenější, protože minimalizuje možnost ztráty datových změn ve vašich souborech, protože jak změny metadat, tak změny dat souborů se zapisují do protokolu ext3 a lze je opakovat při restartu systému.

Při použití „sekvenčního“ režimu se zaznamenávají pouze změny metadat souborového systému, což snižuje redundanci mezi zápisem do souborového systému a do žurnálu, a proto je tato metoda rychlejší. Ačkoli se změny dat souboru nezapisují do žurnálu, musí být provedeny předtím, než žurnálovací démon ext3 provede změny souvisejících metadat souborového systému, což může mírně snížit výkon vašeho systému. Použití této metody žurnálování zajistí, že soubory v systému souborů nebudou nikdy nesynchronizované s přidruženými metadaty systému souborů.

Metoda zpětného zápisu je rychlejší než ostatní dvě metody žurnálování, protože ukládá pouze změny metadat systému souborů a nečeká, až se při zápisu změní související data souboru (před aktualizací věcí, jako je velikost souboru a informace o adresáři). Vzhledem k tomu, že data souboru jsou aktualizována asynchronně s ohledem na žurnálované změny metadat systému souborů, mohou soubory v systému souborů vykazovat chyby v metadatech, například chybu v označení vlastníka datových bloků (jejichž aktualizace nebyla dokončena v čas, kdy byl systém restartován). To není fatální, ale může to narušit uživatelskou zkušenost.

Zadání režimu žurnálování používaného na souborovém systému ext3 se provádí v souboru /etc/fstab pro tento souborový systém. "Sekvenční" režim je výchozí, ale můžete určit různé režimy protokolování změnou voleb pro požadovaný oddíl v souboru /etc/fstab. Například záznam v /etc/fstab označující použití režimu protokolování zpětného zápisu by vypadal takto:

/dev/hda5 /opt ext3 data=writeback 1 0

    Windows NT Family File System (NTFS)

      Fyzická struktura NTFS

Začněme obecnými fakty. Oddíl NTFS může mít teoreticky téměř jakoukoli velikost. Samozřejmě existuje limit, ale nebudu to ani naznačovat, protože to bude stačit na dalších sto let vývoje výpočetní techniky - při jakémkoli tempu růstu. Jak to funguje v praxi? Skoro stejné. Maximální velikost oddílu NTFS je v současnosti omezena pouze velikostí pevných disků. NT4 však bude mít problémy při pokusu o instalaci na oddíl, pokud je jeho část větší než 8 GB od fyzického začátku disku, ale tento problém se týká pouze spouštěcího oddílu.

Lyrická odbočka. Způsob instalace NT4.0 na prázdný disk je zcela originální a může vést k mylným úvahám o možnostech NTFS. Pokud instalačnímu programu sdělíte, že chcete disk naformátovat na NTFS, maximální velikost, kterou vám nabídne, jsou pouze 4 GB. Proč tak malý, když velikost oddílu NTFS je ve skutečnosti prakticky neomezená? Faktem je, že instalační sekce tento souborový systém prostě nezná :) Instalační program naformátuje tento disk na běžný FAT, jehož maximální velikost v NT je 4 GB (při použití ne zcela standardního obrovského 64 KB clusteru), a NT se nainstaluje na tento FAT. Ale již při prvním spuštění samotného operačního systému (ještě ve fázi instalace) je oddíl rychle převeden na NTFS; takže uživatel si během instalace nevšimne ničeho kromě podivného „omezení“ velikosti NTFS. :)

      Struktura řezu - celkový pohled

Jako každý jiný systém rozděluje NTFS veškerý užitečný prostor do clusterů – bloků dat používaných najednou. NTFS podporuje téměř libovolnou velikost clusteru – od 512 bajtů do 64 KB, přičemž za určitý standard je považován cluster o velikosti 4 KB. NTFS nemá žádné anomálie v clusterové struktuře, takže k tomuto, obecně, dost banálnímu tématu, není moc co říct.

Disk NTFS je konvenčně rozdělen na dvě části. Prvních 12 % disku je alokováno do tzv. MFT zóny – prostoru, do kterého roste metasoubor MFT (více níže). Do této oblasti není možné zapisovat žádná data. Zóna MFT je vždy udržována prázdná – to se děje tak, aby se soubor nejdůležitějších služeb (MFT) při růstu nefragmentoval. Zbývajících 88 % disku je normální úložný prostor pro soubory.

Volné místo na disku však zahrnuje veškeré fyzicky volné místo – jsou tam zahrnuty i nezaplněné kusy MFT zóny. Mechanismus použití zóny MFT je následující: když již nelze zapisovat soubory do běžného prostoru, zóna MFT se jednoduše zmenší (v současných verzích operačních systémů přesně na polovinu), čímž se uvolní místo pro zápis souborů. Když se uvolní místo v běžné oblasti MFT, oblast se může znovu rozšířit. Zároveň je možné, že v této zóně zůstanou běžné soubory: žádná anomálie zde není. No, systém se ji snažil udržet na svobodě, ale nic nefungovalo. Život jde dál... Metasoubor MFT se může stále fragmentovat, i když by to bylo nežádoucí.

      MFT a jeho struktura

Souborový systém NTFS je vynikajícím úspěchem strukturování: každý prvek systému je soubor – dokonce i servisní informace. Nejdůležitější soubor na NTFS se nazývá MFT, neboli Master File Table – obecná tabulka souborů. Nachází se v zóně MFT a je centralizovaným adresářem všech ostatních diskových souborů a paradoxně i sám sebe. MFT je rozdělen na položky s pevnou velikostí (obvykle 1 KB) a každá položka odpovídá souboru (v obecném smyslu slova). Prvních 16 souborů je servisního charakteru a jsou pro operační systém nepřístupné – nazývají se metasoubory, přičemž úplně prvním metasouborem je samotný MFT. Těchto prvních 16 prvků MFT je jedinou částí disku, která má pevnou polohu. Zajímavé je, že druhá kopie prvních tří záznamů je kvůli spolehlivosti (jsou velmi důležité) uložena přesně uprostřed disku. Zbytek souboru MFT může být umístěn, stejně jako jakýkoli jiný soubor, na libovolných místech na disku - jeho polohu můžete obnovit pomocí samotného souboru, "zaháknutí" na samém základě - první prvek MFT.

        Metasoubory

Prvních 16 souborů NTFS (metasouborů) je servisní povahy. Každý z nich je zodpovědný za nějaký aspekt fungování systému. Výhodou takového modulárního přístupu je jeho úžasná flexibilita – například na FAT je fyzické poškození v samotné FAT oblasti fatální pro fungování celého disku a NTFS může posouvat, dokonce fragmentovat přes disk, všechny své služby oblasti, obcházení jakýchkoli povrchových poruch - kromě prvních 16 prvků MFT.

Metasoubory jsou umístěny v kořenovém adresáři disku NTFS – začínají symbolem názvu „$“, i když je obtížné o nich získat jakékoli informace standardními prostředky. Je zvláštní, že tyto soubory mají také uvedenou velmi reálnou velikost – například kolik operační systém utratí za katalogizaci celého vašeho disku, můžete zjistit podle velikosti souboru $MFT. Následující tabulka ukazuje aktuálně používané metasoubory a jejich účel.

kopii prvních 16 záznamů MFT umístěnou uprostřed disku

soubor podpory protokolování (viz níže)

servisní informace - jmenovka svazku, verze systému souborů atd.

seznam standardních atributů souborů na svazku

kořenový adresář

objemová mapa volného prostoru

spouštěcí sektor (pokud je oddíl spouštěcí)

soubor, který zaznamenává uživatelská práva k využití místa na disku (začal fungovat pouze v NT5)

soubor - tabulka shody mezi velkými a malými písmeny v názvech souborů na aktuálním svazku. Je to potřeba hlavně proto, že v NTFS jsou názvy souborů psány v Unicode, což činí 65 tisíc různých znaků, jejichž hledání velkých a malých ekvivalentů je velmi netriviální.

        Soubory a streamy

Takže systém má soubory - a nic než soubory. Co tento koncept zahrnuje na NTFS?

    Za prvé, povinným prvkem je záznam v MFT, protože, jak již bylo zmíněno dříve, všechny soubory na disku jsou zmíněny v MFT. Na tomto místě jsou uloženy všechny informace o souboru, s výjimkou samotných dat. Název souboru, velikost, umístění jednotlivých fragmentů na disku atd. Pokud jeden záznam MFT pro informaci nestačí, použije se jich několik, a ne nutně v řadě.

    Volitelný prvek - datové toky souborů. Definice „volitelného“ se může zdát divná, ale přesto zde není nic divného. Za prvé, soubor nemusí mít data – v tomto případě nezabírá volné místo na samotném disku. Za druhé, soubor nemusí být příliš velký. Pak přichází na řadu poměrně úspěšné řešení: data souboru jsou uložena přímo v MFT, v prostoru zbývajícím od hlavních dat v rámci jednoho MFT záznamu. Soubory, které zabírají stovky bytů, obvykle nemají své „fyzické“ provedení v oblasti hlavního souboru – všechna data takového souboru jsou uložena na jednom místě – v MFT.

Situace s daty souboru je docela zajímavá. Každý soubor na NTFS má obecně poněkud abstraktní strukturu – nemá data jako taková, ale existují proudy. Jeden z proudů má význam, který známe – souborová data. Ale většina atributů souborů jsou také proudy! Ukazuje se tedy, že soubor má pouze jednu základní entitu - číslo v MFT a vše ostatní je volitelné. Touto abstrakcí lze vytvořit docela pohodlné věci - například můžete k souboru „připojit“ další stream tím, že do něj zapíšete jakákoli data - například informace o autorovi a obsahu souboru, jak se to dělá ve Windows 2000 (záložka úplně vpravo ve vlastnostech souboru, zobrazená z Průzkumníka). Je zajímavé, že tyto dodatečné toky nejsou standardními prostředky viditelné: pozorovaná velikost souboru je pouze velikost hlavního toku, který obsahuje tradiční data. Můžete mít například soubor nulové délky, který po smazání uvolní 1 GB volného místa – jednoduše proto, že do něj nějaký mazaný program nebo technologie strčil další gigabajtový stream (alternativní data). Ve skutečnosti se však vlákna v současné době prakticky nepoužívají, takže bychom se takových situací neměli bát, i když hypoteticky jsou možné. Jen mějte na paměti, že soubor na NTFS je hlubší a globálnější koncept, než by si člověk mohl představit pouhým procházením adresářů disku. A konečně: název souboru může obsahovat libovolné znaky, včetně celé sady národních abeced, protože data jsou prezentována v Unicode - 16bitové reprezentaci, která dává 65535 různých znaků. Maximální délka názvu souboru je 255 znaků.

      Katalogy

Adresář NTFS je specifický soubor, který ukládá odkazy na jiné soubory a adresáře a vytváří tak hierarchickou strukturu dat na disku. Katalogový soubor je rozdělen do bloků, z nichž každý obsahuje název souboru, základní atributy a odkaz na prvek MFT, který již poskytuje kompletní informace o prvku katalogu. Vnitřní adresářová struktura je binární strom. Co to znamená: k nalezení souboru s daným jménem v lineárním adresáři, jako je FAT, musí operační systém projít všechny prvky adresáře, dokud nenajde ten správný. Binární strom uspořádává názvy souborů tak, že hledání souboru probíhá rychleji – získáváním dvoumístných odpovědí na otázky o umístění souboru. Otázka, na kterou může binární strom odpovědět, zní: ve které skupině vzhledem k danému prvku je hledaný název – nahoře nebo dole? Začínáme takovou otázkou na prostřední prvek a každá odpověď zužuje oblast hledání v průměru dvakrát. Soubory jsou, řekněme, jednoduše seřazeny podle abecedy a otázka je zodpovězena zřejmým způsobem – porovnáním počátečních písmen. Oblast hledání zúžená na polovinu se začíná prozkoumávat podobným způsobem, začíná se znovu od prostředního prvku.

Závěr - například pro vyhledání jednoho souboru mezi 1000 bude muset FAT provést průměrně 500 porovnání (s největší pravděpodobností bude soubor nalezen uprostřed hledání) a stromový systém bude mít aby bylo jen asi 10 (2^10 = 1024). Úspora času při hledání je zřejmá. Neměli byste si však myslet, že v tradičních systémech (FAT) je vše tak zanedbáváno: za prvé je udržování seznamu souborů ve formě binárního stromu poměrně pracné a za druhé i FAT prováděný moderním systémem (Windows2000 nebo Windows98) používá podobné optimalizační vyhledávání. Toto je jen další skutečnost, kterou můžete přidat do své znalostní báze. Rád bych také vyvrátil běžnou mylnou představu (kterou jsem sám nedávno sdílel), že přidat soubor do adresáře ve formě stromu je obtížnější než do lineárního adresáře: jsou to časově docela srovnatelné operace - faktem je že abyste mohli přidat soubor do adresáře, musíte se nejprve ujistit, že soubor s tímto názvem tam ještě není :) - a zde v lineárním systému budeme mít potíže s nalezením souboru, popsaného výše, který více než kompenzovat samotnou jednoduchost přidání souboru do adresáře.

Jaké informace lze získat pouhým přečtením souboru katalogu? Přesně to, co vytváří příkaz dir. Chcete-li provést jednoduchou navigaci na disku, nemusíte pro každý soubor chodit do MFT, stačí si přečíst nejobecnější informace o souborech z adresářových souborů. Hlavní adresář disku – root – se neliší od běžných adresářů, až na speciální odkaz na něj ze začátku metasouboru MFT.

      Protokolování

NTFS je systém odolný proti chybám, který se může snadno obnovit do správného stavu v případě téměř jakéhokoli skutečného selhání. Každý moderní souborový systém je založen na konceptu transakce – akce provedené zcela a správně nebo neprovedena vůbec. NTFS prostě nemá mezistavy (chybné nebo nesprávné) - kvantum změn dat nelze rozdělit na před a po selhání, přinášející destrukci a zmatek - buď je potvrzeno, nebo zrušeno.

Příklad 1: data se zapisují na disk. Najednou se ukazuje, že nebylo možné zapisovat do místa, kam jsme se právě rozhodli zapsat další porci dat – fyzické poškození povrchu. Chování NTFS je v tomto případě celkem logické: transakce zápisu je zcela odvolána - systém si uvědomí, že zápis nebyl proveden. Umístění je označeno jako neúspěšné a data jsou zapsána do jiného umístění - začíná nová transakce.

Příklad 2: složitější případ – data se zapisují na disk. Najednou prásk - napájení se vypne a systém se restartuje. V jaké fázi se záznam zastavil, kde jsou data a kde je nesmysl? Na pomoc přichází další systémový mechanismus – transakční protokol. Faktem je, že systém, který si uvědomil svou touhu zapisovat na disk, označil tento stav v metasouboru $LogFile. Při restartu je tento soubor zkoumán na přítomnost nedokončených transakcí, které byly přerušeny nehodou a jejichž výsledek je nepředvídatelný - všechny tyto transakce jsou zrušeny: místo, kde byl proveden zápis, je opět označeno jako volné, indexy a prvky MFT se vrátí do stavu, ve kterém byly před selháním, a systém jako celek zůstává stabilní. No a co když při zápisu do logu došlo k chybě? Je to také v pořádku: transakce buď ještě nezačala (existuje pouze pokus o zaznamenání záměrů ji provést), nebo již skončila - to znamená, že existuje pokus zaznamenat, že transakce již skutečně proběhla. dokončeno. V druhém případě při příštím spuštění systém sám plně pochopí, že ve skutečnosti bylo vše stejně napsáno správně, a nebude věnovat pozornost „nedokončené“ transakci.

Přesto pamatujte, že protokolování není absolutní všelék, ale pouze prostředek k výraznému snížení počtu chyb a selhání systému. Je nepravděpodobné, že by si průměrný uživatel NTFS někdy všimnul systémové chyby nebo byl nucen spustit chkdsk - zkušenosti ukazují, že NTFS je obnoven do zcela správného stavu i v případě poruch ve chvílích velmi zaneprázdněných činností disku. Můžete dokonce optimalizovat disk a uprostřed tohoto procesu stisknout reset - pravděpodobnost ztráty dat bude i v tomto případě velmi nízká. Je však důležité pochopit, že systém obnovy NTFS zaručuje správnost systému souborů, nikoli vašich dat. Pokud jste zapisovali na disk a došlo k selhání, vaše data nemusí být zapsána. Neexistují žádné zázraky.

Soubory NTFS mají jeden docela užitečný atribut – „komprimovaný“. Faktem je, že NTFS má vestavěnou podporu pro kompresi disku - něco, pro co jste dříve museli používat Stacker nebo DoubleSpace. Jakýkoli soubor nebo adresář lze jednotlivě uložit na disk v komprimované podobě – tento proces je pro aplikace zcela transparentní. Komprese souborů má velmi vysokou rychlost a pouze jednu velkou negativní vlastnost – obrovskou virtuální fragmentaci komprimovaných souborů, která však opravdu nikoho netrápí. Komprese se provádí v blocích po 16 clusterech a využívá tzv. „virtuální clustery“ – opět extrémně flexibilní řešení, které umožňuje dosáhnout zajímavých efektů – například polovinu souboru lze komprimovat a polovinu nikoli. Toho je dosaženo díky skutečnosti, že ukládání informací o kompresi určitých fragmentů je velmi podobné běžné fragmentaci souborů: například typický záznam fyzického rozvržení skutečného, ​​nekomprimovaného souboru:

souborové clustery od 1 do 43 jsou uloženy v diskových clusterech počínaje 400, souborové clustery od 44 do 52 jsou uloženy v diskových clusterech od 8530...

Fyzické rozložení typického komprimovaného souboru:

clustery souborů od 1 do 9 jsou uloženy na diskových clusterech počínaje 400 souborovými clustery od 10 do 16 nejsou nikde uloženy clustery souborů od 17 do 18 jsou uloženy v diskových clusterech počínaje 409 souborovými clustery od 19 do 36. není nikde uloženo. ...

Je vidět, že komprimovaný soubor má „virtuální“ shluky, ve kterých nejsou žádné skutečné informace. Jakmile systém uvidí takové virtuální shluky, okamžitě pochopí, že data z předchozího bloku, násobek 16, musí být dekomprimována a výsledná data pouze zaplní virtuální shluky - to je ve skutečnosti celý algoritmus .

      Bezpečnost

NTFS obsahuje mnoho prostředků pro vymezení práv objektů – předpokládá se, že se jedná o nejpokročilejší souborový systém ze všech aktuálně existujících. Teoreticky je to nepochybně pravda, ale v současných implementacích je systém práv bohužel dosti vzdálen od ideálu a i když je rigidní, není vždy logickým souborem vlastností. Práva přidělená jakémukoli objektu a systémem jednoznačně respektovaná se vyvíjejí - velké změny a doplňky práv byly provedeny již několikrát a u Windows 2000 konečně dospěly k poměrně rozumné sadě.

Práva souborového systému NTFS jsou neoddělitelně spjata se systémem samotným – to znamená, že obecně řečeno nemusí být respektována jiným systémem, pokud je mu poskytnut fyzický přístup k disku. Aby se zabránilo fyzickému přístupu, systém Windows 2000 (NT5) stále zavedl standardní funkci - více o tom viz níže. Systém práv v současném stavu je poměrně složitý a pochybuji, že mohu běžnému čtenáři sdělit něco zajímavého a užitečného pro něj v běžném životě. Pokud vás toto téma zajímá, najdete mnoho knih o architektuře sítě NT, které to popisují podrobněji.

V tomto bodě lze popis struktury souborového systému dokončit, zbývá popsat jen určitý počet jednoduše praktických či originálních věcí.

Tato věc byla v NTFS od nepaměti, ale byla používána velmi zřídka - a přesto: Hard Link je, když stejný soubor má dvě jména (několik ukazatelů na soubor-adresář nebo různé adresáře ukazují na stejný záznam MFT) . Řekněme, že stejný soubor má názvy 1.txt a 2.txt: pokud uživatel smaže soubor 1, zůstane soubor 2. Pokud smaže 2, zůstane soubor 1, tedy oba názvy, od okamžiku vytvoření, jsou si naprosto rovni. Soubor je fyzicky vymazán pouze tehdy, když je smazáno jeho příjmení.

      Symbolické odkazy (NT5)

Mnohem praktičtější funkce, která umožňuje vytvářet virtuální adresáře – úplně stejné jako virtuální disky pomocí příkazu subst v DOSu. Aplikace jsou velmi rozmanité: za prvé, zjednodušení systému katalogů. Pokud se vám nelíbí adresář Dokumenty a nastavení\Správce\Dokumenty, můžete jej propojit s kořenovým adresářem – systém bude s adresářem stále komunikovat divokou cestou a vy budete mít mnohem kratší název, který je zcela ekvivalentní k tomu. K vytvoření takových spojení můžete použít program junction (junction.zip(15 Kb), 36 kb), který napsal slavný specialista Mark Russinovich (http://www.sysinternals.com). Program funguje pouze v NT5 (Windows 2000), stejně jako funkce samotná. Chcete-li spojení odebrat, můžete použít standardní příkaz rd. VAROVÁNÍ: Pokus o smazání odkazu pomocí Průzkumníka nebo jiných správců souborů, kteří nerozumí virtuální povaze adresáře (jako je FAR), smaže data, na která odkaz odkazuje! Buď opatrný.

      Šifrování (NT5)

Užitečná funkce pro lidi, kteří se zajímají o svá tajemství – každý soubor nebo adresář lze také zašifrovat, což znemožňuje čtení jiné instalace NT. V kombinaci se standardním a prakticky neprolomitelným heslem pro spouštění samotného systému poskytuje tato funkce dostatečné zabezpečení pro většinu aplikací pro důležitá data, která vyberete.

Typické okno složky je znázorněno na obrázku.

Okno obsahuje následující požadované prvky.

    Titulní lišta- je v něm napsán název složky. Používá se k přetažení okna.

    Systémová ikona. Otevře servisní nabídku, která umožňuje ovládat velikost a umístění okna.

    Tlačítka pro ovládání velikosti Doplňková výbava: rozkládání (obnovení), skládání, zavírání.

    Lišta menu(rozbalovací nabídka). Zaručeno, že poskytuje přístup ke všem příkazům v daném okně.

    Panel nástrojů. Obsahuje příkazová tlačítka pro provádění nejběžnějších operací. Často si uživatel může tento panel přizpůsobit umístěním potřebných tlačítek na něj.

    Adresní řádek. Označuje přístupovou cestu k aktuální složce. Umožňuje rychle přejít do jiných částí struktury souborů.

    Pracovní prostor. Zobrazuje ikony pro položky uložené ve složce a můžete ovládat způsob jejich zobrazení.

    Posuvníky– umožňují posouvat obsah okna vodorovně nebo svisle, pokud se informace do okna nevejdou.

    Stavový řádek. Zobrazí další informace o objektech v okně.

Souborový systém osobního počítače

Souborový systém poskytuje úložiště a přístup k souborům na disku. Princip organizace souborového systému je tabulkový. Povrch disku je považován za trojrozměrnou matici, jejíž rozměry jsou čísla povrchu, válce a sektorů. Pod válec znamená soubor všech stop náležejících k různým povrchům a stejně vzdálených od osy otáčení. Data o tom, kde je konkrétní soubor zapsán, jsou uložena v systémové oblasti disku ve speciální alokační tabulce souborů ( FAT tabulka). FAT tabulka je uložena ve dvou kopiích, jejichž identita je řízena operačním systémem.

OS MS-DOS, OS/2, Windows-95/NT implementují 16bitová pole v tabulkách FAT. Tento systém se nazýval FAT-16. Takový systém vám umožňuje umístit maximálně 65536 záznamů o umístění jednotek pro ukládání dat. Nejmenší jednotka úložiště dat je sektor. Velikost sektoru je 512 bajtů. Skupiny sektorů jsou podmíněně spojeny do shluky, které jsou nejmenší jednotkou adresování dat. Velikost clusteru závisí na kapacitě disku: ve Fat-16 pro disky od 1 do 2 GB zabírá 1 cluster 64 sektorů nebo 32 KB. To je iracionální, protože i malý soubor zabírá 1 cluster. Velké soubory, které zahrnují více clusterů, skončí s prázdným clusterem na konci. Ztráta kapacity disků v systému FAT-16 proto může být velmi velká. S disky nad 2,1 GB FAT-16 nefunguje vůbec.

Windows 98 a starší verze mají pokročilejší systém souborů – FAT-32 s 32bitovými poli v alokační tabulce souborů. Poskytuje malou velikost clusteru pro disky s velkou kapacitou. Například u disku do 8 GB zabírá 1 cluster 8 sektorů (4 KB).

Soubor je pojmenovaná sekvence bajtů libovolné délky. Před příchodem Windows 95 bylo obecně přijímané schéma pojmenování souborů 8.3 (krátký název) – 8 znaků pro skutečný název souboru, 3 znaky pro příponu jeho názvu. Nevýhodou krátkých jmen je jejich nízký obsah. Počínaje Windows 95 byl zaveden koncept dlouhého názvu (až 256 znaků). Může obsahovat libovolné znaky kromě devíti speciálních: \ / : * ? "< > |.

Přípona jména Počítají se všechny znaky za poslední tečkou. V moderních operačních systémech přenáší přípona názvu do systému důležité informace o typu souboru. Typy souborů jsou registrovány a přidružují soubor k programu (aplikaci), který jej otevírá. Například soubor MyText.doc bude otevřen textovým procesorem MS Word, protože s touto aplikací je obvykle spojena přípona .doc. Obvykle, pokud soubor není přidružen k žádnému otevíracímu programu, je na jeho ikoně označen příznak - logo Microsoft Windows a uživatel může určit otevírací program jeho výběrem z poskytnutého seznamu.

Logicky je struktura souborů organizována podle hierarchického principu: složky nižších úrovní jsou vnořeny do složek vyšších úrovní. Nejvyšší úrovní vnoření je kořenový adresář disku. Termíny "složka" a "adresář" jsou ekvivalentní. Každý adresář souborů na disku odpovídá složce operačního systému se stejným názvem. Pojem složky je však poněkud širší. Ve Windows 95 tedy existují speciální složky, které poskytují pohodlný přístup k programům, ale které neodpovídají žádnému adresáři na disku.

Atributy souboru- to jsou parametry, které definují některé vlastnosti souborů. Chcete-li získat přístup k atributům souboru, klepněte pravým tlačítkem na jeho ikonu a vyberte nabídku Vlastnosti. Existují 4 hlavní atributy: „Pouze pro čtení“, „Skrytý“, „Systém“, Archiv". Atribut „Pouze pro čtení" naznačuje, že soubor není určen k úpravě. Atribut „Skrytý“ označuje, že tento soubor by neměl být zobrazen na obrazovce při provádění operací se soubory Atribut „Systém“ označuje nejdůležitější soubory OS (zpravidla mají také atribut „Skrytý“) Atribut „Archiv“ je spojen se zálohou souborů a má žádný zvláštní význam.

Jedním z hlavních úkolů OS je zajistit výměnu dat mezi aplikacemi a periferními zařízeními počítače. V moderních operačních systémech jsou funkce výměny dat s periferními zařízeními vykonávány vstupně/výstupními subsystémy. Vstupně/výstupní subsystém obsahuje ovladače pro ovládání externích zařízení a souborového systému.

Pro zajištění uživatelského pohodlí s daty uloženými na discích nahrazuje OS fyzickou organizaci dat svým logickým modelem. Logická struktura - adresářový strom, který na obrazovce zobrazuje program Průzkumník atp.

Soubor– pojmenovaná oblast externí paměti, do které lze zapisovat a číst data. Soubory jsou uloženy v energeticky nezávislé paměti, obvykle na magnetických discích. Data jsou organizována do souborů za účelem dlouhodobého a spolehlivého uchování informací a za účelem sdílení informací. Souboru lze nastavit atributy, v počítačových sítích lze nastavit přístupová práva.

Souborový systém zahrnuje:

Sbírka všech souborů na logickém disku;

Datové struktury, které se používají ke správě souborů – tabulky volného a využitého místa na disku, tabulky umístění souborů atd.

Systémové softwarové nástroje, které umožňují provádět operace se soubory, jako je vytváření, mazání, kopírování, přesouvání, přejmenování, vyhledávání.

Každý OS má svůj vlastní souborový systém.

Funkce souborového systému:

Přidělování diskové paměti;

Pojmenování souboru;

Mapování názvu souboru na odpovídající fyzickou adresu v externí paměti;

Poskytování přístupu k datům;

Ochrana a obnova dat;

Typy souborů

Souborové systémy podporují několik funkčně odlišných typů souborů, které obvykle zahrnují:

Běžné soubory, nebo jednoduše soubory, které obsahují libovolné informace, které do nich uživatel zadává nebo které jsou vytvořeny v důsledku provozu systémových nebo uživatelských programů. Obsah běžného souboru je určen aplikací, která s ním pracuje. Běžné soubory jsou rozděleny do dvou širokých tříd: spustitelné a nespustitelné. OS musí být schopen rozpoznat svůj vlastní spustitelný soubor.

Katalogy– speciální typ souborů, které obsahují informace systémové nápovědy o sadě souborů, které se nacházejí v tomto adresáři (obsahuje názvy a informace o souborech). Z uživatelského hlediska umožňují adresáře organizovat ukládání dat na disk. Z pohledu OS se adresáře používají ke správě souborů.

Speciální soubory jsou fiktivní soubory, které odpovídají I/O zařízením a jsou navrženy pro provádění I/O příkazů.

Souborový systém má zpravidla hierarchickou strukturu, na jejímž vrcholu je jeden kořenový adresář, jehož název je shodný s názvem logické jednotky, a úrovně jsou vytvářeny tím, že nižší- adresář úrovně je součástí adresáře vyšší úrovně.

Každý soubor jakéhokoli typu má svůj symbolický název, pravidla pro tvorbu symbolických jmen jsou v každém OS jiná. Hierarchicky organizované systémy souborů používají tři typy názvů: jednoduché nebo symbolické, celé jméno nebo složené a relativní.

Jednoduché jméno definuje soubor ve stejném adresáři. Soubory mohou mít stejné symbolické názvy, pokud jsou umístěny v různých adresářích. "Mnoho souborů - jeden jednoduchý název."

Celé jméno je posloupnost jednoduchých symbolických názvů všech adresářů, kterými prochází cesta od kořene k danému souboru, a samotného názvu souboru. Plně kvalifikovaný název souboru jednoznačně identifikuje soubor v systému souborů. "Jeden soubor - jedno celé jméno"

Relativní jméno soubor je definován pomocí konceptu aktuálního adresáře, tedy adresáře, ve kterém se uživatel aktuálně nachází. Souborový systém zachytí název aktuálního adresáře, aby jej pak mohl použít jako doplněk k relativnímu názvu k vytvoření plně kvalifikovaného názvu. Uživatel zapíše název souboru počínaje aktuálním adresářem.

Pokud operační systém podporuje několik externích paměťových zařízení (pevný disk, disketová jednotka, CD ROM), lze úložiště souborů organizovat dvěma způsoby:

1. Každé zařízení je hostitelem autonomního (svého vlastního) souborového systému, to znamená, že soubory umístěné na tomto zařízení jsou popsány svým adresářovým stromem jako nesouvisející s adresářovým stromem jiného zařízení;

2. Připojení souborových systémů (OS UNIX). Uživatel má možnost kombinovat souborové systémy umístěné na různých zařízeních do jednoho souborového systému, který bude mít jeden adresářový strom.

Atributy souboru– vlastnosti přiřazené k souboru. Hlavní atributy – Pouze pro čtení, Systém, Skrytý, Archiv.

Souborový systém OS musí uživateli poskytnout sadu operací pro práci se soubory ve formuláři systémová volání. Tato sada obsahuje systémová volání: create (vytvoření souboru), čtení (čtení), zápis (zápis), close (zavřít) a některá další. Při práci s jedním souborem se zpravidla neprovádí jedna operace, ale sekvence. Například při práci v textovém editoru. Ať je se souborem provedena jakákoli operace, operační systém musí provést řadu akcí, které jsou univerzální pro všechny operace:

1. Pomocí symbolického názvu souboru najděte jeho charakteristiky, které jsou uloženy v systému souborů na disku;

2. Zkopírujte charakteristiky souboru do OP;

3. Na základě vlastností souboru zkontrolujte přístupová práva k provedení požadované operace (čtení, zápis, mazání);

4. Po provedení operace se souborem vymažte oblast paměti vyhrazenou pro dočasné uložení charakteristik souboru.

Práce se souborem začíná systémovým voláním OTEVŘENO, který zkopíruje charakteristiky souboru a zkontroluje oprávnění a končí systémovým voláním ZAVŘÍT což uvolní vyrovnávací paměť s charakteristikami a znemožňuje pokračovat v práci se souborem bez jeho opětovného otevření.

Souborová organizace dat nazývá distribuce souborů přes adresáře, adresáře přes logické jednotky. Logická jednotka – Adresář – Soubor. Uživatel má možnost získat informace o souborovém uspořádání dat.

Principy umístění souborů, adresářů a systémových informací na konkrétní externí paměťové zařízení se nazývá Fyzická organizace souborového systému.