Nanj lahko postavimo svoje datoteke namenjene svetu. Pri tem mora njihova zascita dovoljevati dostop za branje vsem ( $ SET PROT=W:RE [.WWW]*.* ). Globalni naslov datotek (URL = Uniform Resource Locator), ki ga lahko objavimo ali posljemo znancem po svetu, je: http://www2.ijs.muzej.si/~username/file.ext (pri tem je username nase uporabnisko ime (znak ~ pred njim je obvezen) in file.ext ime neke datoteke na poddirektoriju [.WWW] ).
Datoteka [.WWW]INDEX.HTML ima po dogovoru okrajsan URL: http://www2.ijs.muzej.si/~username/ (torej brez imena INDEX.HTML v URLju !). Vanjo obicajno napisemo svoj vstopni/glavni dokument (personal home page).
Dokumenti so lahko razvrsceni v poddirektorije; na primer URL datoteke [.WWW.IMAGES.TOONS]TOM.GIF je: http://www2.ijs.muzej.si/~username/images/toons/tom.gif
Datoteke so lahko poljubnih tipov (file extension), vendar imajo tipi .HTML, .PS, .DVI, .GIF, .JPEG, .MPEG, .AU in se nekateri drugi poseben pomen -- pri branju se interpretirajo kot hipertekst (glej naslednjo tocko), PostScript, TeX DVI, slike, film, zvok in podobno. Za obicajno neoblikovano besedilo lahko uporabite tip .TXT . Ponudimo lahko tudi binarne datoteke, ki jih obicajno komprimiramo (npr. .ZIP, .GZ, .TAR-GZ, .LZW) .
Svoj osebni dokument lahko navezemo tudi na svoj elektronski postni naslov. Program za iskanje e-mail naslovov bo v tem primeru dodal kazalec iz imena na vas osebni dokument. Vpis osebnega URLja lahko zahtevamo z obrazcem za spremembo e-mail naslova oziroma z obrazcem za dodelitev novega e-mail naslova.
Bolj zlobni bralniki napacen dokument sicer po najboljsih moceh prikazejo, vendar ga opremijo z nalepko Bad HTML zato, da avtorja postane sram in dokument popravi ;-)
Da se izognemo neljubim presenecenjem, obstaja na CATHY program
za preverjanje HTML dokumentov. Pozenemo ga z ukazom:
$ @LOC$COM:HTMLCHEK file.html
Ce smo uporabljali nestandardne razsiritve bralnika Netscape, uporabimo HTMLCHEKN, za preverjanje HTML 3.0 dokumentov pa HTMLCHEK3
Isti program za preverjanje pravilnosti je na razpolago tudi kot obrazec, podati mu moramo URL dokumenta, ki ga zelimo preveriti.
Za svoje HTML dokumente, ki so napisani v slovenscini in uporabljajo nabor znakov ISO Latin 2 (v katerem so tudi slovenski sumniki), uporabite tip datoteke .HTML-LATIN2 (ali krajse .HTML-L2), namesto obicajnega .HTML
Primer:
TEST.HTML ... implicira ISO Latin 1 nabor znakov TEST.HTML-LATIN2 ... implicira ISO Latin 2 nabor znakov
Tule je kratka tabela s kodami sumnikov. Uporabite lahko pravi 8-bitni znak z ustrezno kodo ali pa HTML numerical character reference oblike &#nnn; pri cemer je nnn desetiska koda znaka (ne pozabite na podpicje).
desetiska osmiska | desetiska osmiska znak char.ref koda koda | znak char.ref koda koda ------------------------------+----------------------------- ch è 232 350 | CH È 200 310 sh ¹ 185 271 | SH © 169 251 zh ¾ 190 276 | ZH ® 174 256 cj æ 230 346 | CJ Æ 198 306 dj ð 240 360 | DJ Ð 208 320
Vec o ISO Latin naborih znakov se nahaja na: http://www.cs.tu-berlin.de/user/czyborra/charsets/
Mnogi pregledovalniki, tako v Sloveniji, se posebno pa pri uporabnikih izven Slovenije, nimajo moznosti prikaza ISO Latin 2 abecede (ali pa njihovi uporabniki take moznosti niso nastavili). Vsi pregledovalniki morajo znati prikazati dokument v naboru ISO Latin 1. Dokumentov v drugih naborih niso dolzni prikazati na zaslon -- lahko npr. ponudijo shranitev dokumenta na datoteko.
Iz tega sledi, da naj bo vsak nas dokument ponujen najprej v ISO Latin 1 varianti (csz), lahko pa poleg tega ponudimo isti dokument tudi v ISO Latin 2, nanj napeljemo kazalec in prepustimo bralcu, da se odloci, ali ga bo izbral. Drugi nabori znakov, npr ISO646-YU, CP852 in CP1250, ne sodijo med nabore znakov, ki jih dovoljuje HTTP.
Se prakticen napotek: ce napisemo dokument (npr MY.TXT) v naboru znakov ISO646-YU (~{`}| ^[@]\) in ne uporabljamo mehkega dj (ker sta znaka | in \ uporabna v druge namene), ga lahko pretvorimo v drug nabor znakov na CATHY z ukazom:
Da se izognemo problemom z znakom @, ki se vcasih pojavi npr. v e-mail naslovih, lahko originalni dokument napisemo kar neposredno v ISO Latin 2 in ga pretvorimo v ISO Latin 1 z ukazom: