![]() |
Redakcija
Glavni
urednik: Za
izdavača: Saradnik: Dizajn:
Korektura:
Digitalizacija: POKROVITELjSTVO
|
Srbislav BukumirovićMilomir PavlovićPrve srpske ćiriličke baze podataka na InternetuIzlaganje na naučno stručnom skupu "Internet i ćirilica" u Beogradu, 11. 2. 2002. UvodPoslednjih godina je svima jasno, a to je i velika istina, da opstanak svakog jezika i kulture u novom globalnom informacionom društvu zavisi kako od mogućnosti da budu na Internetu ,tako i od stvarne prisutnosti na Internetu. Internet kao i druge savremene informacione tehnologije, uglavnom su razvijene na zapadnom engleskom jezičkom području, pre svega u Americi, tako da je postojala realna opasnost da u u novom informacionom društvu dođe do potpune dominacije engleskog jezika i odumiranja jezičke i kulturne raznovrsnosti i raznolikosti koja je svojim bogatstvom krasila dosadašnji svet i njegovu kulturu. Međutim, na vreme je shvaćeno da savremena globalizacija može u da uspe samo uz poštovanje jezičke, kulturne i druge raznolikosti i raznovrsnosti, odnosno politike «cvetanja svih cvetova» . U tom smislu, u okviru međunarodne zajednice, doneti su određeni zaključci koji su podržali opštu dostupnost informacijama u 21. veku kao i zaštitu kulturne i lingvističke raznovrsnosti i bogastva . Tu bi pre svega pomenuo Preporuke i rezolucije UNESKA o višejezičnosti (1), Program jezičke različitosti Evropske unije (2) i Okinavski dokument (hartiju) Grupe G8 najbogatijih zemalja u kojoj se podvlači neophodnost smanjenja jaza u oblasti informacija i znanja na međunarodnoj pozornici, s tim što bi svaki čovek svuda imao mogućnost da se koristi blagom globalnog informacionog društva a da se u tom odnosu ne podvrgne otuđenju.(3) Kako se ističe u UNESKO-vom dukumentu, «jezik je osnova opštenja ljudi, a takođe i deo njihovog kulturnog nasleđa. Kod mnogih ljudi jezik je povezan sa dubokim emocijama, asocijacijama i vrednostima koje su urasle svojim korenjem u bogato književno, istorijsko, filozofsko i kulturno nasleđe» Naravno, ovo su politički dokumenti ali veoma važni za dalji razvoj savremenih informacionih tehnologija. Međutim, stručnjaci su bili ti koji su pre političara počeli sa ozbiljnim i mukotrpnim radom da bi se ovakve ideje mogle realizovati. Još 1986 godine, Međunardna organizacija za standardizaciju u saradnji sa drugim međunarodnim organizacijama, vladinim i nevladinim organizacijama pokrenula je izradu odgovarajućeg standarda, koji je u tzv. DIS verziji (za diskusiju) izašao 1992 –godine, pod oznakom 10646 i nazivom: Informacione tehnologije – univerzalni višebajtni set kodnih karatera, čiji se prvi deo zove Arhitektura i bazični višejezički projekat. Zatim se pojavio UNIKOD, koji obezbe]uje jedinstveni broj za svako slovo odnosno karakter, bez obzira na računarsku platformu, program ili jezik. UNIKOD standard usvojen je od vodećih industrijskih lidera u oblasti informacionih tehnologija kao što su Majkrosoft, IBM, Orakle, SAN i drigih. Uključen je u sve savremene standarde kao što su HML, JAVA i dr., tako da je postao zvanični put za implementaciju odnosno realizaciju međunarodnog (ISO/IEC) standarda 10646. Podržan je od većine operativnih sistema, svih brauzera odnosno čitača, i većine drugih proizvoda iz oblasti IT. O UNIKODU brine Unikod konzorcium koji je neprofitna organizacija, osnovana za razvoj, širenje i promociju ovog standarda. (WWW.UNICADE. ORG) (4) Izrada i primena ovog standarda tekla je uporedo sa razvojem infotehnologija, tako da danas imamo primena UNIKOD standarda u raznim operativnim sistemima i jezicima, od Vindousa, Jave, i dr. Kao i na raznim čitačima odnosno brauzerima kao što je Internet eksplorer, Netskejp i dr. Razvijaju se i pretraživači na raznim jezicima i pismima, naravno sa zakašnjenjem u odnosu na engleski jezik i englesku latinicu. Ćirilica u Unikodu zauzima značajno mesto sa oko 220 slova odnosno karaktera i više desetina jezika i specifičnih varijanti pisma. Posle kineskog pisma i latinice, ćirilica je najrasprostranjenije pismo na svetu. Pored istočno-slovenskih naroda koji su dugo jedini koristili ćiriličko pismo, posle Oktobarske revolucije oko 50 naroda Evrope i Azije, sve do nekih eskimskih plemena, koji su se tek tada opismenili, prihvatilo je ćiriličko pismo, naravno sa raznim modalitetima. U Rusjiji ih nazivaju «Molodopismenije narodi». Pored njih i neki drugi narodi sa ovih prostora, koji su već koristili određena pismo, takođe je razvilo svoja ćirilička pisma, kao npr. Mongoli, Uzbeki i dr. (5) 2. INTERNET I VUKOVA ĆIRILICAPrelaskom na nove informacione tehnologije pojavili su se veliki problemi, kako obraditi, preneti i predstaviti pisano stvaralaštvo srpskog naroda, koje je uglavnom pisano ćirilicom, poštujući međunarodne i naše standarde i pravila. Posebno, jer je početak rada na automatizacije SNTIS i Bibliotečkog informacionog sistema, pa samim tim i NBS bazirao na programima koji su isključivo koristili latinicu. Sa tim problemom se suočio Centar za naučne informacije i referalnu delatnost NBS u svom radu na automatizaciji poslovanja Centra ali i drugih ustanova, i uspeo da uz pomoć nekoliko spoljnih saradnika reši većinu pitanja koja su se postavljala. Kao osnova za rešavanje ovih pitanja poslužio je Uneskov programski paket CDS/ISIS, interfejs Vebisis koji su zajednički razvili Unesko i Svetska zdravstvena organizacija (za Južnu Ameriku), odnosno njihov Centar za biomedicinske naučne informacije iz Brazila, skraćeno BIREME, i aplikacija u CDS/ISIS- u BIBLIO, koju je razvio Centar za naučne informacije i RD NBS.
Biblio je aplikacija izrađena u programskom paketu CDS/ISIS, koji se primenjuje u preko 130 zemalja sveta i u hiljadama ustanova; Aplikaciju je razvio Centar za naučne informacije i RD NBS. ( Specijalni programi razvijeni su u saradnji sa spoljnim saradnicima). Programa BIBLIO je na ćirilici, i omogućava rad skoro na svim ćiriličkim i latiničkim pismima, a instaliran je u oko 300 ustanova nauke i kulture u Jugoslaviji i Republici Srpskoj. To je postignuto bez ikakvih ulaganja države, a sa entuzijazmom autora i njihovih saradnika. (6) PROGRAMSKI PAKET CDS/ISIS preporučen je od UNESKO-a i Generalnog informacionog programa (Dalje: GIP) kao standardizovani programski paket za biblioteke, arhive, muzeje, INDOK službe i dr. ustanove u okviru Svetskog sistema naučnih i tehnoloških informacija. [7] Zasnovan je na baznim međunarodnim standardima. Omogućava korišćenje brojnih jezika i pisama, i više softverskih sistema (dos, vms, unix, windous); Zvanična verzija osnovnog programskog paketa CDS/ISIS 1.311 pod VINDOUS operativnim sistemom dobijena je od UNESKO-a u avgustu 1988., i uz veliko zalaganje završene su izmene u aplikaciji i rešeni neki važni problemi do početka oktobra iste godine. Rešeno je pitanje istovremene obrade dokumenata na svim ćirilicama, latinici koju koristi srpski narod i engleskoj latinici, čime su stvoreni preduslovi da se ovakve baze podataka postave na Internetu. S obzirom da nismo raspolagali sa serverom koji radi pod Vindousom NT, u pomoć nam je priskočio kolega Milomir Pavlović koji je tada radio na Farmaceutskom fakultetu. On je svakako najzaslužniji u rešavanju problema prebacivanja podataka u Junikod i prilagođavanja programa Perl za odgovarajuće konverzije. Kroz našu saradnju i pomoć od ostalih članova ekipe, baze su postavljene na sajtu Farmaceutskog fakulteta u martu 2000.godine. U aprilu 2000. godine list «Politika» je u rubrici «Svet kompjutera» objavila članak pod nazivom «Baze podataka. Ćirilica na Internetu». S obzirom da sam autor teksta, dozvoliću sebi da citiram poveći deo teksta koji se odnosi na pretraživanje u ćiriličkoj bazi CIP+: «Naprimer za pretraživanje baze podataka CIP+, koja sadrži podatke o izdavačkoj delatnosti u Jugoslaviji (trenutno, probna baza sadrži blizu 42.000 zapisa), potrebno je da korisnik izborom tastature, (srpska ćirilica, latinica i engleska latinica ) ukuca po izboru – autora, naslov dela ,pedmetnu odrednicu, ključnu reč, izdavača, godinu izdanja, itd, i npr, format LIST, dobiće veoma brzo ispise u obliku koji je već pomenut. Adresa sajta je WWW.pharmacy.bg.ac.yu gde se izborom na biblioteku i pretraživač ulazi na stranicu gde dalje birate bazu podataka i ostale opcije koje su na raspolaganju. Treba napomenuti, zbog lakšeg pretraživanja, da je pretraživanje olakšano sufiksacijom. Dovoljno je ukucati koren neke reči i na kraju staviti znak $(dolar) da se dobije rezultat sa svim sufiksima koji slede posle korena reči odnosno termina, odnosno prezimena. (Naprimer, ukucavanjem reči Jovan$ prilikom pretraživanja autora, dobiće se svi autori sa prezimenima Jovanović, Jovanić, Jovančević itd). Konvertor je tako napravljen da svaki korisnik Vindous operativnog sistema koji u opcijama izabere srpsku ćiriličku tastaturu ( nažalost većina verzija Vindous 98 nema tastaturu za srpski jezik i latinicu), ili hrvatsku i slovenačku tastatutu, može pretraživati pomenute baze i sa specifičnim slovima latinice kao što su Č,Ć,Š.Đ,Ž – dok je pretraživanje ćirilicom normalno za sva slova. U pomenutoj bazi sve odrednice su na ćirilici, pa ih tako treba i pretraživati, dok naslovi, ključne reči i delom izdavači sadrže podatke i na latinici i tako ih alternativno možete pretraživati latinicom. Ovih dana biće završena i opcija ulaska u rečnik koji je sređen azbučno i abecedno, zavisno od podataka na kom su pismu.» (Napomena: To je ubrzo realizovano) (6?) S obzirom da je u međuvremenu došlo do kvara na serveru Farmaceutskog fakulteta, i da novonabavljeni server radi pod Linuksom, baze nisu postavljene na njemu. Ostale su na jednom računaru koji radi pod Vindousom 98 u NBS. (8) Ovo je popularni tekst namenjen širokoj publici, a kako radi aplikacija koju smo razvili, posebno zalaganjem M. Pavlovića dajemo u tekstu koji sledi. 2.3.1 VEBISIS Pristup ISIS bazama, iako su sve mrežnog tipa nije jednostavan ni bezbedan izvan lokalne mreže (npr. preko Telnet protokola). Da bi se taj pristup pojednostavio i približio običnim korisnicima preko Interneta, razvijeni su razni tzv. CGI skript jezici (npr. Perl). Njihovo korišćenje se sastoji u tome da korisnik preko svog Internet-pretraživača pozove neki HTML dokument na veb-serveru na kome je instaliran program u kome je napisan CGI skript. Veb-server prosledi upit za bazu CGI programu koji, zatim pristupa bazi, upiše, izmeni ili pročita podatke i vrati ih veb-serveru u vidu HTML dokumenta. Na kraju veb-server vrati korisniku HTML dokument koji je CGI program napravio. Jedan specijalizovani tzv. interfejs za ISIS baze koji radi pod Vindousom 95 ili Vindous NT-om, koji radi i kao CGI program razvila je Panamerička zdravstvena organizacija (PAHO) u okviru Centra BIREME (Latino-Američki i Karibski centar za naučnomedicinske informacije) iz Brazila za svoje potrebe i potrebe Uneska. Taj interfejs sa kompletnim uputstvom za korišćenje može se naći na njihovom sajtu :..... Naziv interfejsa je Wwwisis.exe ili www32i.exe. Može da čita i DOS i Windows baze, a postavlja se u neki zaštićeni poddirektorijum web-servera (samo "execute" dozvola). Na Windows NT-u CGI script se postavlja u virtuelni poddirektorijum "scripts" a u HTML dokumentu se poziva npr. Sa <FORM action="http://web-server/scripts/wwwi32.exe/[in=fajl1.nas] method="post">. Ime fajla "fajl1" i njegova ekstenzija ".nas" su proizvoljni. U tom fajlu treba da se inicijalizuje wwwi32.exe da napravi tzv. "environmental records" u koje smešta podatke dobijene od korisnika preko web-servera. Parametar za inicijalizaciju je cgi=@fajl2.cgi, pri čemu svi parametri za inicijalizaciju mogu da se navedu iza znaka jednako (akoje samo jedan) ili u posebnom fajlu "fajl2.cgi" ako ih ima više. Fajl"fajl2.cgi" mora da sadrži pod jednostrukim znakom navoda (') ime baze, Bulov izraz za pretraživanje, pft format fajl ili parametre za formatiranje izlaza, zatim prolog i epilog parametre iza kojih se navode fajlovi sa zaglavljem i krajem HTML dokumenta. Ovo je jedan primer: 'db=c:\isis\data\biblio\biblio' 'bool="AU=JURIC$"' 'prolog=@pocetak.pro' 'pft=@format1.pft' 'epilog=@kraj.epi' Ovaj program omogućava pretraživanje bilo koje baze podataka rađene u ISIS programskom paketu, uz korišćenje proizvoljnog formata.(9) 2.3.2 JAVAISIS Java je programski jezik za mreže i Internet odn. virtualna mašina za izvršavanje tog jezika na različitim platformama; Slogan "Piši jednom, izvršavaj bilo gde" i prenosivost softvera bez kompromisa su ideje koje su oduševile programere. Brzi razvoj i primena to najbolje potvrđuju: Prve ideje o Javi pojavile su se 1991.godine, a od maja 1995 (kada je Netskejp počeo da podržava Javu) pa do kraja godine IBM i Majkrosoft su licencirali Javu, a 1966 i 1977 SUN proizvedi 1.0 i 1.1 JDK. Java (TM) 2 Runtime Environment (skraćeno JRE), Standard Edition Version 1.3.0_02, sa kojom mi danas radimo proizvedena je 7.aprila ove 2001 godine! Takođe je razvijen i JAVA ISIS. Java isis služi za pretraživanje i procesiranje CDS/ISIS tekstualnih odnosno nenumeričkih baza podataka. JAVAISIS paket sastoji se iz dva dela: (a) JAVA ISIS Server: procesira CDS/ISIS baze podataka na serveru, lista i odgovara na pretraživačke upite koji dolaze sa JAVAISIS klienta preko TCP/IP mreže (Internet, Intranet, Extranet); (b) JAVA ISIS klient: korisnički interfejs preko koga finalni korisnik može da koristi CDS/ISIS baze podataka. Organizacija menija i podmenija skoro je identična onima u Winisis–u. Prva verzija JAVAISIS-a urađena je u martu 1998 i distribuirana od starne Društva za biblioteke i arhive Italije. Verzija 3.0 radila je pod Javom1.0. 2 i nije podržavala UNIKOD i višejezičnost; Verzija 3.5 beta radi pod Javom 2 i uglavnom podržava UNIKOD. Naravno, Java se stalno usavršava, tako da će neki bagovi i problemi koji su teško vidljivi, nadamo se, uskoro biti otklonjeni. Aplikaciju Javaisis-a za podršku naših baza podataka na srpskom jeziku i ćirilici izradili su: Dr Srbislav Bukumirović i Darko Ivošević. JAVAISIS obavlja odnosno ima sledeće funkcije:
Softver je u potpunosti Open Source i može se slobodno modifikovati. Šta novo pruža JAVAISIS za biblioteke i INDOK centre :
Zapaženi problemi: - Što se tiče zapisa, Javaisis je u potpunosti kompatibilan sa Vindousom, međutim,
Autor softvera Javaisis je Renato Enea u saradnji sa UNESKO/ISIS-om i BIREME iz Brazila. Javaisis se sastoji od klijent i server aplikacije. Verzija 3.5 Beta puštena je u martu 2001.godine, sa napomenom da se mora koristiti JRE 1.2 i više. 3. ZAKLJUČAKKao što se iz napred izloženog vidi, grupa entuzijasta okupljenih oko Centra za naučne informacije i RD NBS, uspela je da bez materijalne podrške države realizuje niz programa i zadataka vezanih za primenu ćirilice u savremenim informacionim sistemima. Ideja vodilja u ovim naporima bila je da srpski jezik i pismo a samim tim i kultura, mogu ravnopravno da budu zastupljeni u svaremenim informacionim tehnologijama i naravno računarima. Mi smo u jednom članku istakli konstataciju akademika Lihačova: “Zemlja, država, narod bez svoje kulture gube pravo na postojanje”. U prelomnim vremenima kao što je današnje, treba dobro razmisliti o ovim rečima. [7] LITERATURA[1] Meeting of Experts to examine the Draft Recommendation concerning the Promotion and Use of Multilingualism and Universal Access to Cyberspace, "UNISIST Newsletter Vol.29,No.1, 2001, str.5-6; i Razvitie I ispol`zovanie mnogojazyčija i vseobščij dustup k kiberprostranstvu, “Bjuleten` JUNISIST, Tom 28, No.2, 2000, str.8 [2] Sajt Evropske zajednice [3] G8- Okinavska hartija o globalnom informacionom društvu, Japan, 23.jula 2000. [4] WWW.UNICADE.ORG [5] Bol`saja sovetskaja enciklopedija.- Moskva, 1977, Tom16, str.359 [6] Vidi tabele u WWW.UNICADE.ORG [7] Bukumirović, S. – N.Popović – Vidović Lj. : Biblio na ćirilici, “Info”, 1994, br.1, s.29-31. [8] MINI-MIKRO CDS/ISIS. Referentni priručnik.Verzija 2-3.- Beograd, Saobraćajni fakultet Univeziteta u Beogradu, 1992 I Baxton,A.- A.Hopkinson : The CDS/ISIS.Handbook.- London,Lybrary Associations Publishing, 1994 [9] Bukumirović S. – N. Popović: Standardi i preporuke Generalnog informacionog programa i Svetskog sistema naučnih i tehnoloških informacija i primena ćirilice (sa primerima rešenja), “Vukova zadužbina”, br.27, s.7 [10] Bukumirović, S. i saradnici: Prezentacija programa Biblio pod WINDOWS operativnim sistemom, "Info Science", br.6, 2000, s.49-50. // Projekat
Rastko / Rastkov glasnik //
[ Promena pisma | Mapa projekta | O projektu | Kontakt | Pomoć | Pretraga ] |