Ponudite svoje dokumente svetu prek WWW

Odkar tudi na CATHY tece HTTP streznik, lahko vsak uporabnik tega racunalnika ponudi svetu dokumente neposredno s svojega uporabniskega podrocja.

Postopek

Z ukazom $ CREATE/DIR [username.WWW] napravimo poddirektorij WWW.

Nanj lahko postavimo svoje datoteke namenjene svetu. Pri tem mora njihova zascita dovoljevati dostop za branje vsem ( $ SET PROT=W:RE [.WWW]*.* ). Globalni naslov datotek (URL = Uniform Resource Locator), ki ga lahko objavimo ali posljemo znancem po svetu, je: http://www2.ijs.muzej.si/~username/file.ext (pri tem je username nase uporabnisko ime (znak ~ pred njim je obvezen) in file.ext ime neke datoteke na poddirektoriju [.WWW] ).

Datoteka [.WWW]INDEX.HTML ima po dogovoru okrajsan URL: http://www2.ijs.muzej.si/~username/ (torej brez imena INDEX.HTML v URLju !). Vanjo obicajno napisemo svoj vstopni/glavni dokument (personal home page).

Dokumenti so lahko razvrsceni v poddirektorije; na primer URL datoteke [.WWW.IMAGES.TOONS]TOM.GIF je: http://www2.ijs.muzej.si/~username/images/toons/tom.gif

Datoteke so lahko poljubnih tipov (file extension), vendar imajo tipi .HTML, .PS, .DVI, .GIF, .JPEG, .MPEG, .AU in se nekateri drugi poseben pomen -- pri branju se interpretirajo kot hipertekst (glej naslednjo tocko), PostScript, TeX DVI, slike, film, zvok in podobno. Za obicajno neoblikovano besedilo lahko uporabite tip .TXT . Ponudimo lahko tudi binarne datoteke, ki jih obicajno komprimiramo (npr. .ZIP, .GZ, .TAR-GZ, .LZW) .

Svoj osebni dokument lahko navezemo tudi na svoj elektronski postni naslov. Program za iskanje e-mail naslovov bo v tem primeru dodal kazalec iz imena na vas osebni dokument. Vpis osebnega URLja lahko zahtevamo z obrazcem za spremembo e-mail naslova oziroma z obrazcem za dodelitev novega e-mail naslova.

Sintakticno pravilni HTML dokumenti

Preden objavite nek HTML dokument, se spodobi, da preverite njegovo sintakticno pravilnost. Bralniki so sicer precej trdozivi, vendar lahko napaka v dokumentu povzroci nepricakovano obliko. Tudi ce nek pregledovalnik prikaze sintakticno napacen HTML dokument po avtorjevih pricakovanjih, nihce ne jamci, da drug pregledovalnik ali ze naslednja verzija istega pregledovalnika ne bo drugace interpretirala napacne strukture v dokumentu (to se je npr. marsikomu mascevalo, ko je nova verzija Netspace navigatorja zacela bolj dosledno upostevati HTML standard).

Bolj zlobni bralniki napacen dokument sicer po najboljsih moceh prikazejo, vendar ga opremijo z nalepko Bad HTML zato, da avtorja postane sram in dokument popravi ;-)

Da se izognemo neljubim presenecenjem, obstaja na CATHY program za preverjanje HTML dokumentov. Pozenemo ga z ukazom:
$ @LOC$COM:HTMLCHEK file.html

Ce smo uporabljali nestandardne razsiritve bralnika Netscape, uporabimo HTMLCHEKN, za preverjanje HTML 3.0 dokumentov pa HTMLCHEK3

Isti program za preverjanje pravilnosti je na razpolago tudi kot obrazec, podati mu moramo URL dokumenta, ki ga zelimo preveriti.

Slovenski sumniki

Poleg standardnega nabora ISO Latin 1 (ISO-8859-1) zna HTTP streznik na CATHY ponuditi tudi HTML dokumente, ki uporabljajo nabor znakov ISO Latin 2 (ISO-8859-2).

Za svoje HTML dokumente, ki so napisani v slovenscini in uporabljajo nabor znakov ISO Latin 2 (v katerem so tudi slovenski sumniki), uporabite tip datoteke .HTML-LATIN2 (ali krajse .HTML-L2), namesto obicajnega .HTML

Primer:

  TEST.HTML        ... implicira ISO Latin 1 nabor znakov
  TEST.HTML-LATIN2 ... implicira ISO Latin 2 nabor znakov

Tule je kratka tabela s kodami sumnikov. Uporabite lahko pravi 8-bitni znak z ustrezno kodo ali pa HTML numerical character reference oblike &#nnn; pri cemer je nnn desetiska koda znaka (ne pozabite na podpicje).

           desetiska osmiska  |            desetiska osmiska
znak char.ref  koda    koda   | znak char.ref  koda    koda
------------------------------+-----------------------------
  ch  è   232     350    |   CH  È   200     310
  sh  ¹   185     271    |   SH  ©   169     251
  zh  ¾   190     276    |   ZH  ®   174     256
  cj  æ   230     346    |   CJ  Æ   198     306
  dj  ð   240     360    |   DJ  Ð   208     320

Vec o ISO Latin naborih znakov se nahaja na: http://www.cs.tu-berlin.de/user/czyborra/charsets/

Mnogi pregledovalniki, tako v Sloveniji, se posebno pa pri uporabnikih izven Slovenije, nimajo moznosti prikaza ISO Latin 2 abecede (ali pa njihovi uporabniki take moznosti niso nastavili). Vsi pregledovalniki morajo znati prikazati dokument v naboru ISO Latin 1. Dokumentov v drugih naborih niso dolzni prikazati na zaslon -- lahko npr. ponudijo shranitev dokumenta na datoteko.

Iz tega sledi, da naj bo vsak nas dokument ponujen najprej v ISO Latin 1 varianti (csz), lahko pa poleg tega ponudimo isti dokument tudi v ISO Latin 2, nanj napeljemo kazalec in prepustimo bralcu, da se odloci, ali ga bo izbral. Drugi nabori znakov, npr ISO646-YU, CP852 in CP1250, ne sodijo med nabore znakov, ki jih dovoljuje HTTP.

Se prakticen napotek: ce napisemo dokument (npr MY.TXT) v naboru znakov ISO646-YU (~{`}| ^[@]\) in ne uporabljamo mehkega dj (ker sta znaka | in \ uporabna v druge namene), ga lahko pretvorimo v drug nabor znakov na CATHY z ukazom:

ISO646-YU (~{`) --> ISO Latin 1 (csz)
$ exe perl -p -e "tr/~{`}^[@]/cszcCSZC/;" -
my.txt >my.html
ISO646-YU (~{`) --> ISO Latin 2
$ exe perl -p -e "tr/~{`}^[@]/\350\271\276\346\310\251\256\306/;" -
my.txt >my.html-l2

Da se izognemo problemom z znakom @, ki se vcasih pojavi npr. v e-mail naslovih, lahko originalni dokument napisemo kar neposredno v ISO Latin 2 in ga pretvorimo v ISO Latin 1 z ukazom:

ISO Latin 2 --> ISO Latin 1 (csz)
$ exe perl -p -e "tr/\350\271\276\346\310\251\256\306/cszcCSZC/;" -
my.html >my.html-l2
Se opozorilo: MS Windows Latin 2 se razlikuje od standardnega ISO Latin 2 !

HTML prirocniki

Tule je nekaj prirocnikov za jezik HTML, v katerem opisujemo strukturirano besedilo z referencami:

mm