1. JOHDANTO T{m{ kirjanen tarjoaa aloittelevalle k{ytt{j{lle lyhyen opastuksen tiedonhausta julkisista tietokannoista. Opas ei pyri korvaamaan tietokantakohtaisia k{sikirjoja, eik{ tee k{ytt{j{st{ kokenutta informaatikkoa. Se antaa niit{ taitoja joiden avulla tutkija , oman tieteenalansa asiantuntija, pystyy aloittamaan tiedonhaut ja hankkimaan tutkimusty|n materiaalia, kirjallisuusviitteit{, tilastoja, lehtiartikkeleita jne. N{k|kulma kirjassa on siis ennen kaikkea tutkijan, joka haluaa suorittaa itse tiedonhakuja. Olen pyrkinyt erityisesti siihen, ett{ k{ytt{j{ saisi kuvan niist{ mahdollisuuksista, joita korkeakoulujen keskuskoneet ja korkeakoulumaailman ja tutkimuslaitosten FUNET-verkko tarjoavat tietoliikenteess{. Tietoliikenneyhteydet ovat se asia, jota tiedonhakuj{rjestelmien k{sikirjoissa ei yleens{ kerrota, vaan k{ytt{j{ j{{ enemm{n tai v{hemm{n yksin vaikeuksien kanssa. Kirjan esimerkit keskuskoneyhteyksist{ perustuvat Tieteellisen Laskennan Palvelun yll{pit{m{n OPMVAXin (VAX-8650) k{ytt||n, mutta ovat paljolti sovellettavissa my|s muihin keskuskoneisiin, joissa on pakettiverkkoyhteydet eli yleens{ yhteys Datapak-verkkoo n. Esimerkit, joissa k{ytet{{n mikrotietokoneita, perustuvat IBM-yhteensopivan mikrotietokoneen k{ytt||n mutta monet seikat, esimerkiksi mikron k{ytt{minen p{{tteen{, ovat p{{osin sovellettavissa my|s muihin mikrotietokoneisiin. 2. MILLOIN HALUTTU TIETO KANNATTAA ETSI[ JULKISISTA TIETOKANNOISTA Tiedonhaku tutkimustarpeisiin voidaan tehd{ hyvin monella tavalla: kirjallisista l{hteist{, havainnoimalla, mittaamalla, haastattelemalla jne. Tutkimusty|n eri vaiheissa ja eri tutkimuksen alueilla tarvitaan monenlaista tietoa: kirjallisuusl{hteit{, tilas toja, lehtiartikkeleita, tietoja patenteista, kaavoja jne. Kaikkea edell{mainitun kaltaista ja paljon muutakin l|ytyy eri tiedonhakuj{rjestelmien tietokannoista. Tiedon hankinta julkisista tietokannoista on vain yksi tapa hankkia tietoa mutta se voi olla j{rkevin joissakin tapauksissa. On syyt{ muistaa ett{ esimerkiksi seuraavissa tapauksissa haku julkisista tietokannoista kannattaa * Tietokannoissa tieto on kootussa muodossa: parhaimmillaan yksi ainoa tiedonhaku voi korvata tiedon hakemisen useista eri painetuista ja muista l{hteist{. * Tiedon jatkok{sittelyn vuoksi aineiston on hyv{ olla valmiiksi tietokoneen ymm{rt{m{ss{ muodossa: mik{li hankittava aineisto on kooltaan suuri voi tiedon manuaalinen tallennus tietokoneelle olla liian vaivalloista, aikaaviev{{ ja aiheuttaa virheit{. * Tieto on kaukana: tietokantojen avulla saavutetaan monia ulkomaisia tietol{hteit{. * Tiedon hankinta tietokannoista voi tulla huomattavasti edullisemmaksi kuin sen hankinta muilla tavoilla. * Tiedonhaku tietokannoista vapauttaa aikaa mielekk{{mpiin ja luovempiin teht{viin. * Tieto ei ole kielivaikeuksista johtuen muuten hankittavissa: merkitt{vimmiss{ ulkomaisissa tiedonhakuj{rjestelmiss{ on tietokantoja, joista k{ytt{j{ voi saada tietoa suurimpien 'vieraiden' kielialueiden tietoja jollain toisella kielell{ (yleens{) englan niksi). T{llaisia tietokantoja on mm. Japanin tieteest{ ja teknologiasta. * Tieto on ker{tt{v{ nopeasti: mik{li kaikki k{ytt{j{tunnus- ja sopimusasiat ovat selv{t ja k{ytt{j{ll{ on tietyt perustiedot tietotekniikan hy|dynt{misest{, on elektroninen tiedonhaku nopeaa. * Tietoa ei ole muualla kuin tietokannoissa: t{m{ tullee yh{ yleistym{{n tulevaisuudessa. 3. KANNATTAAKO TIEDONHAKU TEHD[ ITSE VAI TEETT[[ SE ULKOPUOLISELLA Korkeakoulujen kirjastoissa on yleens{ informaatikko, joka tekee tutkijoille, opettajille ja opiskelijoille tiedonhakuja. Laskutus vaihtelee mutta korkeakoulujen opiskelijoille ja henkil|kunnalle informaatikkojen tekem{t tiedonhaut ovat aina halvempia kui n ulkopuolisille. Jos tiedontarpeet ovat toistuvia, on syyt{ harkita tiedonhakujen tekemist{ itse. T{ll|in ei olla sidottuja kirjastojen aikatauluihin, hakua voidaan tarkentaa ja muuttaa v{litt|m{sti vuorovaikutteisen hakutapahtuman aikana ja tulokset saadaan v{litt|m{sti. 4. MIT[ TARVITAAN TIEDONHAKUUN TIETOKANNOISTA ? 4.1 Sopimukset K{ytt{j{n on yleens{ solmittava sopimus sen tiedonhakuj{rjestelm{n kanssa, josta h{n aikoo tiedonhakuja tehd{. Parhaimmillaan yksi sopimus riitt{{, mutta joskus on solmittava useita sopimuksia, esimerkiksi tietokantakohtaisia sopimuksia k{ytt|oikeudesta ( tiedontuottajan kanssa). Jos k{ytt{j{ tarvitsee suoria valintaisia yhteyksi{ pakettiverkon avulla on h{nen solmittava sopimus pakettiverkon yll{pit{j{n (PTL tai paikalliset puhelinlaitokset) kanssa. Onneksi sopimusk{yt{nn|t ovat viime vuosina yksinkertais tuneet. Mik{li k{ytet{{n korkeakoulun ja Suomen korkeakouluverkon yhteyksi{ edellytt{{ se k{ytt{j{tunnusta korkeakoulun keskuskoneeseen. Sen saa korkeakoulun laskentakeskuksen kautta. 4.2 Laitteet Toteuttaakseen itse tiedonhakunsa tietokannoista k{ytt{j{ tarvitsee seuraavat laitteet: modeemi, puhelin ja mikrotietokone tai p{{te. Mik{li tyytyy k{ytt{m{{n suurimpia ja yleisimmin k{ytettyj{ tiedonhakuj{rjestelmi{ voi selvit{ p{{teyhteydell{ johonkin k orkeakoulun keskuskoneeseen: n{ist{ on usein mahdollisuus luoda yhteys tiedonhakuj{rjestelm{{n. 4.3 Tiet{mys Suorittaakseen itse tiedonhakuja ei tarvitse olla ATK-ammattilainen tai informaatikko. Riitt{{, kun osaa k{ytt{{ mikroa tai p{{tett{. Monimutkaisia tiedonhakuja tutkija voi teett{{ korkeakoulun informaatikoilla. Toisaalta tottuessaan tekem{{n tiedonhakuja itse on tutkijalla k{yt|ss{{n my|s kiistaton etu, sill{ h{nh{n on oman tieteenalansa asiantuntija joka itse pystyy parhaiten arvioimaan saatujen tulosten relevanttisuuden ja tarvittaessa pystyy muuttamaan ja tar kentamaan hakua. 5. MIT[ TIEDONHAKU MAKSAA? Tarkkaa vastausta tiedonhaun hintaan on vaikea antaa, sill{ tiedonhakuj{rjestelmien laskutusperusteet vaihtelevat. Tiedonhaun hinta riippuu my|s muista tekij|ist{. Voi sanoa, ett{ harjaantuessaan tiedonhakuun k{ytt{j{ samalla pystyy laskemaan tiedonhaun k ustannuksia. Kalleimpia tietokantoja ovat yleens{ yritys-, patentti- ja markkinatietokannat. Edullisimpia ovat kirjallisuusviitteit{ sis{lt{v{t tietokannat. Halvimmillaan haku pohjoismaisista tietokannoista maksaa 2-4 mk/min ja kalleimmillaan 10 mk/min (kaupalliset tietokannat). Kansainv{lisiss{ tietokannoissa laskutus on samansuuntaista: kalleimpia ovat patentti ja yritystietokannat. Esimerkiksi Dialogissa, joka on maailman suurin julkinen tiedonhakuj{rjestelm{, maksavat kalleimmat patenttitietokannat noin 30-40 mk/min, halvimmat tietokannat ovat 3 mk/min alkaen, keskim{{rin voisi sanoa tietokantojen olevan hinnoiltaan 5-10 mk/min. Mik{li tiedontarve on yksi nkertainen vie keskim{{r{inen tiedonhaku tekij{n kokemuksen mukaan viitisen minuuttia, kun taas monimutkaisempi taas vie helposti parikymment{ minuuttia ja jopa enemm{nkin. Edell{ mainittujen kulujen lis{ksi kertyy usein erillisi{ kustannuksia koulutuksesta, k{ytt|oppaista ja muusta materiaalista. Korkeakouluk{ytt{j{n on aina syyt{ tarkistaa tarjoaako tiedonhakuj{rjestelm{ tai tietokanta erityisi{ akateemisia alennuksia jotka voivat olla jopa 80-90%. T{ll|in tosin voidaan asettaa uusia rajoituksia k{ytt|aikoihin ja muihin ehtoihin. Suurk{ytt{j{ (e sim. korkeakoulu) voi neuvotella edullisempia sopimuksia. Suurin osa tiedonhakuj{rjestelmist{ tarjoaa alennuksia virka- ja ty|aikojen ulkopuolella tapahtuvasta tiedonhausta. Koska useimmat ulkomaiset tiedonhakuj{rjestelm{t sijaisevat Yhdysvalloissa, merki tsee t{m{ sit{, ett{ suomalaiselle k{ytt{j{lle edullisia aikoja ovat tunnit puolilta |in aina iltap{iv{{n asti. 6. TIETOKANTOJEN TERMINOLOGIAA Perusk{ytt{j{n on helpompi ymm{rt{{ tiedonhakuj{rjestelmien k{sikirjoja sek{ koko tiedonhakutapahtumaa mik{li h{n tuntee t{rkeimm{t perusk{sitteet. Ik{v{ kyll{ tietokantojen terminologia ei ole yksik{sitteist{, vaan k{sitteit{ voidaan k{ytt{{ eri merkityk siss{. Ongelmallisimpia ovat k{sitteet tietopankki ja erilaiset tietokantojen tyypit. Tiedonhaun sanaston standardisoimisty| valmistunee 1990-luvun alkupuolella. Seuraavassa on t{rkeimm{t k{sitteet ja liitteess{ 1 t{ydellisempi luettelo. Tietokanta Tietokanta on tietty{ kohdetta tai ilmi|t{ kuvaavien tietojen ATK-pohjainen kokoelma, jota k{ytt{j{n on mahdollista k{ytt{{ yhden tai useamman tiedonhakuj{rjestelm{n avulla. Tietokanta koostuu tietueista. Tietue Tietueessa on yht{ havaintoyksikk|{ koskevat tiedot. Havaintoyksikk| voi olla kirja, yksi kunta, patentti tms. Tietokanta koostuu n{ist{ tietueista. Kentt{ Tietue jakaantuu yhteen tai useampaan nimettyyn kentt{{n. Jotkut kent{t ovat ns. osoitettavia kentti{, eli hakukomentoja voidaan rajata kohdistumaan erityisesti niihin. Vapaan tekstin kentti{ ovat ne, joihin on talletettu dokumentin tekstiaines. Tietokantojen tyypit Tietokannat jaetaan yleens{ viitetietokantoihin ja faktatietokantoihin. Viitetietokannat sis{lt{v{t kuvauksia varsinaisista tiedonl{hteist{ ja faktatietokannat taas itse ongelmanratkaisutietoa. Viitetietokannat voidaan edelleen jakaa dokumentteihin viitta aviin bibliografisiin tietokantoihin ja hakemistotietokantoihin, jotka viittaavat esim. tutkimushankkeisiin, organisaatioihin tms. Faktatietokannat taas voidaan jakaa tekstitietokantoihin, jotka sis{lt{v{t tietyn dokumentin kokonaisuudessaan, numeerisiin tietokantoihin (esim. aikasarjat) ja tekstinumeerisiin. P{{jako tietokantatyyppeihin suoritetaan joskus my|s teksti- ja numeerisiin tietokantoihin. Jako eri tietokantatyyppeihin ei ole viel{ vakiintunut. Tiedonhakuj{rjestelm{ Tiedonhakuj{rjestelm{ on tietokantaan tai kantoihin tallennetun tiedon hakuun (ja tallentamiseen) k{ytetetty tietojenk{sittelyj{rjestelm{. K{ytt{j{n kannalta tiedonhakuj{rjestelm{ss{ keskeisint{ on sen hakukieli. Tiedonhakuj{rjestelm{n synonyymin{ k{ytet{ {n my|s hakuj{rjestelm{- ja tietopankki-k{sitteit{. Tiedonhakuj{rjestemi{ ovat suorak{ytt|j{rjestelm{ ja er{k{ytt|j{rjestelm{. Suorak{ytt|j{rjestelm{ss{ k{ytt{j{ "keskustelee" tosiaikaisesti j{rjestelm{n kanssa saaden vastaukset ja palautteen v{litt|m{sti . Julkiset tiedonhakuj{rjestelm{t ovat l{hes poikkeuksetta suorak{ytt|isi{. Tietopankki Tietopankilla tarkoitetaan yleens{ tiedonhakuj{rjestelm{{, tai sill{ voidaan tarkoittaa my|s faktatietokantaa ja joskus jopa l{hes mit{ tahansa tiedostoa tai tietovarastoa. Tietopankin k{site ei siis ole kovin vakiintunut ja sen k{yt|ss{ on syyt{ olla var ovainen. Tuottaja Tuottaja ker{{, organisoi ja tallentaa tietokannan sis{lt{m{t tiedot ja luovuttaa ne tiedonhakuj{rjestelm{n yll{pit{j{lle. Yll{pit{j{ ja tuottaja voi olla my|s sama taho. Yll{pit{j{ Tiedonhakuj{rjestelm{n yll{pit{j{ on mik{ tahansa taho, joka hankkii tuottajalta tietokannan k{ytt||ns{, organisoi ja yll{pit{{ sit{ sek{ tarjoaa k{ytt{jille yleens{ korvausta vastaan. Yll{pit{j{n synonyymein{ k{ytet{{n usein k{sitteit{ is{nt{ tai tietopa nkki-is{nt{. Tesaurus Tesaurus on toisilleen merkitykselt{{n l{heisten ja/tai samansukuisten termien kontrolloitu sanasto. Mik{li tietokannassa on tesaurus voi k{ytt{j{ tarvittaessa tukeutua tiedonhaussa siihen. Tesauruksen k{ytt|{ selvitet{{n tarkemmin luvussa 7.4 Indeksointi Monissa tekstimuotoista tietoa sis{lt{viss{ tietokannoissa voidaan haun valmistelussa ja haussa k{ytt{{ hyv{ksi indeksointia. Indeksointi kertoo joko suoraan niiden tietueiden m{{r{n jossa jokin sana tai muu termi esiintyy tai indeksointi voi perustua tie tueiden asiasis{lt|{ kuvaaviin asiasanoihin. Hakukieli Hakukieli on tiedonhakuj{rjestelm{n k{ytt{j{lle n{kyv{ osa, jonka avulla poimitaan haluttuja tietoja tietokannasta; se m{{rittelee k{ytett{viss{ olevat komennot, operaattorit, parametrit, katkaisumerkit jne. Hakukieli{ on hyvin monia ja ne eroavat toisist aan huomattavasti. Hakulause Hakulause on tiedonhakuj{rjestelm{lle l{hetett{v{ toimintaohje, joka sis{lt{{ yhden komennon sek{ hakutermej{, loogisia operaattoreita ja sanankatkaisumerkkej{. Haun laajentaminen ja supistaminen Hakua tarkennetaan saatujen hakutulosten perusteella siten, ett{ saadaan joko laajempi tulosjoukko (laajentaminen) tai suppampi tulosjoukko (supistaminen). Tulosjoukko Tulosjoukko eli setti on yhden hakukomennon perusteella syntyv{ tulosteiden joukko. Mik{li yht{{n tulostetta ei l|ydy, syntyy tyhj{ setti. Yhden hakuistunnon aikana voi synty{ useita tulosjoukkoja. Yleens{ tiedonhakuj{rjestelm{ s{ilytt{{ muistissa tietyn m{{r{n aiempia settej{ ja niit{ voidaan edelleen yhdistell{ loogisten operaattoreiden avulla tai kohdistaa uusi komento aiempaan settiin. Hakuistunto Hakuistunto on tiedonhaun yht{jaksoinen toteutus tiedonhakuj{rjestelm{ss{, eli sis{{n- ja uloskirjoittautumisen v{linen aika. 7. TIEDONHAKUJ[RJESTELM[T JA HAKUKIELET YLEISESTI Ei ole olemassa yht{ ainoaa hakukielt{ jonka avulla k{ytt{j{ voisi tehd{ tiedonhakuja eri j{rjestelmist{ vaan valitettavasti on opeteltava j{rjestelm{kohtaisia hakukieli{ ja niiden komentoja. T{ss{ ei opeteta mit{{n tietty{ hakukielt{, vaan etsit{{n niit{ yhteisi{ piirteit{ mit{ useimmissa hakukieliss{ on. 7.1 Tiedonhakuj{rjestelm{st{ informoivat komennot Useissa tiedonhakuj{rjestelmiss{ on komentoja, joiden avulla saa tietoa olemassa olevista tietokannoista, hakukielest{, laskutuksesta sek{ uutistietoa asiakasseminaareista, julkaisuista yms. 7.2 Keskustelukielen valinta Keskustelukielell{ tarkoitetaan luonnollista kielt{, jolla komennot ja loogiset operaattorit kirjoitetaan ja se on monissa j{rjestelmiss{ valittavissa. Keskustelukielen{ voi esimerkiksi Mintussa (VTKK:n yll{pit{m{ tiedonhakuj{rjestelm{) olla suomi tai eng lanti. Useissa keskieurooppalaisissa j{rjestelmiss{ voi hakukieleksi niinik{{n valita joko ko. maan oman kielen tai englannin. Keskustelukielt{ ei siis pid{ sekoittaa hakukielik{sitteeseen, jonka logiikka ja toiminta on samanlainen riippumatta, siit{ mill { keskustelukielell{ komennot esitet{{n. 7.3 Tietokannan valinta Mik{li tiedonhakuj{rjestelm{ss{ useita tietokantoja, on yleens{ valittava, mihin niist{ kohdistaa hakunsa tai mihin siirtyy seuraavaksi. Niiss{kin tiedonhakuj{rjestelmiss{, joissa j{rjestelm{ tarvittaessa avustaa tietokannan valinnassa, saa k{ytt{j{ parha an tuloksen valitsemalla itse tietokannan. N{in kannattaa tietenkin toimia jos tuntee jonkin verran ko. tietokantoja ja niit{ aihepiirej{ joihin haku kohdistuu. 7.4 Tesauruksen ja indeksoinnin k{ytt| Monissa tiedonhakuj{rjestelmiss{ ja tietokannoissa on k{ytett{viss{ tesaurus ja/tai indeksointi (katso my|s luku 6, tietokantojen terminologiaa), mutta se voi toisaalta puuttuakin saman tiedonhakuj{rjestelm{n joistakin tietokannoista. Tesaurukseen ja inde ksointiin voi tukeutua mik{li hakusanat ovat ep{m{{r{isi{ ja vaikeasti rajoitettavissa, tai ei tarkaan muisteta hakusanan, tekij{n tms. kirjoitusasua. Indeksointi on tavallaan tesaurusta "tyhmempi", sill{ se sis{lt{{ vain aakkosellisen luettelon mahdollisista hakusanoista, tesaurus on sen sijaan hieman "{lykk{{mpi", sill{ se sis{lt{{ luokiteltuja sanoja ja synonyymej{. Tesaurus on hyv{ apuv{line esim. e tsitt{ess{ synonyymej{ hakusanoille, kun taas indeksointi auttaa viitteiden m{{r{n arvioinnissa, kirjoitusasun tarkistuksessa jne. Esimerkki: Indeksoinnin k{ytt| ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ ³Haetaan indeksoinnista ALCO- ³ Ref Items RT Index-term ÚÄ´HOL EDUCATION hakusanaan liit-³ E1 1 ALCOHOL COUNSELORS ³ ³tyv{t indeksitermit. ³ E2 765 7 *ALCOHOL EDUCATION <Ù ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ E3 1 ALCOHOL EDUCATION CENTRE (ENGLAND) E4 2 ALCOHOL EDUCATION DISCIPLINE PROGRAM E5 1 ALCOHOL EDUCATION EVALUATION INSTRUMENT E6 1 ALCOHOL EXPECTANCY QUESTIONNAIRE E7 9 ALCOHOL FUELS E8 0 1 ALCOHOL INTOXICATION Esimerkki: Tesauruksen k{ytt| ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ Ref Items Type RT Index-term ³Tesauruksesta on haettu ALCO-³ R1 765 7 *ALCOHOL EDUCATION <Ä´HOL EDUCATION hakusanaan liit³ R2 438007 B 145 EDUCATION ³tyv{t termit. Saadaan uusia ³ R3 93 R 10 ALCOHOL ABUSE ³hakusanoja ja rinnakkaisia ³ R4 388 R 5 ALCOHOLIC BEVERAGES ³termej{ ³ R5 1605 R 9 ALCOHOLISM ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ R6 1412 R 10 DRINKING R7 1345 R 9 DRUG EDUCATION R8 5181 R 23 HEALTH EDUCATION 7.5 Hakulause Hakulause muodostuu yhdest{ komennosta ja yhdest{ tai useammasta hakusanasta ja niit{ yhdist{vist{ operaattoreista. Hakukomento on tyypillisesti jokin find, search, hae tai muu sen kaltainen verbi joko kokonaan kirjoitettuna tai lyhennetyss{ muodossa. Hak ulauseen pituus ja sallittu loogisten operaattoreiden m{{r{ on rajoitettu. Esimerkki: Hakulause voi olla esim. seuraavanlainen (CCL eli Common Command Language -kielinen): f kogniti$ and comput$ 7.6 Loogiset operaattorit Hakulauseen muodostamisessa k{ytet{{n loogisia operaattoreita yhdist{m{{n hakusanoja (katso tarkemmin liite 3). Loogisia operaattoreita ovat yleens{ ainakin AND, OR ja NOT. Joissain tiedonhakuj{rjestelmiss{ voidaan k{ytt{{ my|s muita operaattoreita. Joissain j{rjestelmiss{ on k{yt|ss{ my|s ns. l{heisyysoperaattorit; niiden avulla voidaan etsi{ ne tietueet joissa hakusanat esiintyv{t tietyss{ j{rjestyksess{ tai l{heisyydess{ toisiinsa n{hden. Loogiset operaattorit kirjoitetaan tiedonhakuj{rjestelm{st{ riippuen joko sellaisenaan (and, ja, or jne.) hakusanojen v{liin tai joskus niiden sijasta k{ytet{{n symboleita (esim. pilkkumerkki{, huutomerkki{ tms.). 7.7 Tulostustoiminnot Tulostettaessa saatuja viitteit{ tai tulosteita on usein mahdollista valita mitk{ kent{t tulostetaan: joskus tarvitaan vain tieto vaikkapa kirjan nimest{, joskus taas tarvitaan tietue kokonaisuudessaan. Tulostusmuoto on siis usein valittavissa. Tiedonhakuj{rjestelmiss{ voi olla mahdollista saada tulosteet my|s ns. offline-tulosteina. T{ll|in k{ytt{j{ saa ne pienell{ viiveell{ tiedonhakuj{rjestelm{n yll{pit{j{n toimittamana esimerkiksi postitse. Offline-tulostusta varten on kyseisiss{ j{rjestelmi ss{ omat komennot, oletuksena on online-tulostus eli tulostus k{ytt{j{n p{{tteelle tiedonhaun aikana. 8. TIEDONHAKUJ[RJESTELM[N VALINTA K{ytt{j{ (laitos, tutkija, ...) voi solmia sopimuksen useiden eri tiedonhakuj{rjestelmien kanssa, mutta usein se on tarpeetonta. Valitsemalla tiedonhakuj{rjestelm{, joka kattaa riitt{v{n hyvin oman tieteenalan tietotarpeet, s{{styt{{n useiden eri hakukiel ten opettelemisen aiheuttamalta vaivalta. Valittavassa tiedonhakuj{rjestelm{ss{ tulisi olla kaikki ne tietokannat joita mahdollisesti tullaan tarvitsemaan. Muita huomioonotettavia seikkoja ovat tiedonhakuj{rjestelm{n hinnoittelu, hakukielen monipuolisuus ja helppok{ytt|isyys ja tietoliikenneyhteydet j{rjestelm{{n. Tiedonhakuj{rjestelm{{ valittaessa on syyt{ huomata, ett{ varsinkin kansainv{lisiss{ tiedonhakuj{rjestelmiss{ on usein samoja tietokantoja. Suosituimmat tietokannat voivat olla monissa eri tiedonhakuj{rjestelmiss{, samoin kuin painettuina kirjoina (esim. Chemical Abstracts, Sociological Abstracts, jne) ja CD-ROM -levyin{. 9. TIEDONHAUN TIETOLIIKENNE Tietoliikenneyhteydet k{ytt{j{n mikrolta tai p{{tteelt{ tiedonhakuj{rjestelm{{n voivat olla hyvin erilaiset. Riippuen valitusta ja/tai k{ytett{viss{ olevista tietoliikenneyhteyksist{, voidaan tiedonhaku tietokannasta tehd{ nopeasti tai hitaammin, edullise mmin tai enemm{n rahaa kuluttaen sek{ varmemmin tai joskus katkeilevin yhteyksin. 9.1 Tietoliikenteen terminologiaa tiedonhakijalle K{ytt{ess{{n tiedonhakuj{rjestelmi{ ja lukiessaan niiden k{sikirjoja k{ytt{j{ t|rm{{ joihinkin tietoliikenteen erikoistermeihin. Seuraavassa on perussanastoa johon k{ytt{j{ voi tutustua tarpeidensa ja mielenkiintonsa mukaan. Ainakin mikron k{ytt{j{ voi t| rm{t{ k{sitteisiin, joita seuraavassa kuvataan. Asynkroninen Asynkroninen yhteys tarkoittaa tahdistamatonta tietoliikennek{yt{nt|{, jossa tiedonsiirto tapahtuu merkeitt{in sit{ mukaa kun k{ytt{j{ n{pp{ilee niit{ tai sy|tt{{ muilla tavoin. Asynkroniset yhteydet ovat ep{varmempia kuin synkroniset mutta satunnaisessa k{yt|ss{ edullisempia. Tavallisimmat modeemit ovat asynkronisia. Baud Baud on tiedonsiirron nopeusmitta. Usein baudeista puhuttaessa tarkoitetaan samaa kuin bps (katso alla), ja hitailla tiedonsiirtonopeuksilla baudiluku voikin olla sama kuin bps, mutta itse asiassa baud tarkoittaa signaalisiirtymien lukua sekunnissa. Suure mmilla nopeuksilla yht{ baudia kohti voidaan koodata useita bittej{, jolloin bps on moninkertainen baudilukuun verrattuna. Bps Bittinopeus on l{hetysnopeuden ilmaus bittein{ sekunnissa. Tarkoittaa k{yt{nn|ss{ noin bittinopeus/10 merkki{ sekunnissa eli esim. 1200 bps merkitsee noin hieman yli sadan merkin siirtoa sekunnissa. Databitti Databittien m{{r{, 7 tai 8, kertoo monenko bitin avulla esitet{{n itse merkki. Seitsem{ll{ bitill{ voidaan esitt{{ 128 erilaista merkki{ eli kaikki yleisimm{t kirjoittuvat merkit, kahdeksalla bitill{ voidaan edell{ mainittujen lis{ksi esitt{{ graafisia ja muita merkkej{. Databittien m{{r{{ voi mikron tietoliikenneohjelman k{ytt{j{ joutua vaihtamaan kun ollaan yhteydess{ eri j{rjestelmiin (katso my|s pariteetti). Datapak Datapak on PTL:n yll{pit{m{ pakettiverkko (katso pakettiverkko). FUNET Finnish University and Research NETwork on suomalaisten korkeakoulujen ja tutkimuslaitosten tietokoneverkko, joka tarjoaa k{ytt{jilleen nopeita ja varmoja yhteyksi{ suurimpaan osaan Suomen korkeakoulujen tietokoneista. Vain muutama tiedonhakuj{rjestelm{ o n suoraan FUNETissa (esim. Jyv{skyl{n yliopiston kirjaston JYKDOK). Lokitiedosto Lokitiedosto tarkoittaa tietokoneen muistiin syntyv{{ tiedostoa johon tallentuu jonkun prosessin (er{ajo, p{{teistunto tms) toimenpiteet ja tulosteet. T{ss{ kirjassa ja tiedonhaussa lokitiedosto tarkoittaa koko tiedonhakuistunnon tallettamista joko keskus koneen tai mikron muistiin. Tallentuminen ei tapahdu itsest{{n, vaan k{ytt{j{n on annettava erikseen komento tai komennon lis{m{{reit{, jolla t{m{ tapahtuu. ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ ³Esimerkki: Yhteydenotto OPMVAXista Datapak-numeroon 202008 ³ ³(Minttu), istunto talletetaan lokitiedostoksi Minttu.log ³ ³ ³ ³OPMVAX> SET HOST/X29/LOG=Minttu.log 202008 ³ ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ NORDUnet Pohjoismaiden korkeakoulujen tietokoneverkko NORDUnet, joka on pohjoismainen vastine FUNETille, tarjoaa k{ytt{jilleen nopeat ja helpot yhteydet eri maiden korkeakouluihin. Jotkut pohjoismaiset korkeakoulujen, tutkimuslaitosten ja kirjastojen tiedonhakuj{r jestelm{t ovat NORDUnetissa. Tarkempia tietoja NORDUnetista samoin kuin FUNETista saa TLP/FUNET-projektilta ja projektin tuottamasta materiaalista. Pakettiverkko Pakettiverkko on tietoliikenneverkko, jossa k{ytt{j{ kytkeytyy l{himp{{n pakettiverkon solmuun ja sit{ kautta edelleen haluamaansa et{isemp{{n osoitteeseen. Pakettiverkossa tietoliikenne on synkronista, merkit liikkuvat paketteina. Etenkin pitkiss{ yhteyk siss{ pakettiverkko on varmempi ja edullisempi kuin suorat valintaiset puhelinyhteydet. Kotimaisia pakettiverkkoja ovat PTL:n Datapak ja yksityisten puhelinlaitosten Digipak. Katso tarkemmin luku 10.2 Pariteetti Pariteetti on er{s tapa, jonka avulla tietoliikenneohjelma tarkistaa siirretyn tiedon mahdolliset linjah{iri|ist{ yms. syist{ syntyv{t virheet. Kun k{ytet{{n mikroa ja p{{teohjelmaa voi k{ytt{j{ joutua asettamaan pariteetin kullekin tiedonhakuj{rjestelm{l le sopivaksi jotta tiedonhakuj{rjestelm{{ voisi hy|dynt{{ parhaiten. Kaikissa keskuskoneissa/tiedonhakuj{rjestelmiss{ ei v{ltt{m{tt{ ole pariteettia (t{ll|in asetetaan pariteetiksi none). Tiedonhakuj{rjestelmiss{ yleisin pariteetti on even eli parillinen. P{{teemulaattori P{{teemulaattori on ohjelma joka emuloi eli matkii jotain p{{tetyyppi{. N{in mikrotietokonetta voidaan k{ytt{{ keskuskoneen p{{tteen{. Katso my|s tietoliikenneohjelma. Synkroninen Synkroninen tarkoittaa tahdistettua tietoliikennek{yt{nt|{, t{ll|in merkit liikkuvat paketteina. Synkroninen tietoliikenne on varmempaa mutta kalliinpaa kuin asynkroninen. Tietoliikenneohjelma Tietoliikenneohjelma tarvitaan aina kun siirret{{n tietoa koneiden v{lill{, joko p{{teyhteyksiss{ tai tiedostojen siirroissa. Mikroa k{ytett{ess{ tarvitaan tiedonhaussa jokin tietoliikenneohjelma mikrotietokoneen ja keskuskoneen tai pakettiverkon v{liseen yhteyteen. Yleisi{ mikron tietoliikenneohjelmia ovat esim. Kermit, Procomm, VaxTerm jne. 10. MITEN OTTAA YHTEYS TIEDONHAKUJ[RJESTELM[[N 10.1 Suora puhelinyhteys Tiedonhakuj{rjestelmiin on poikkeuksetta suoria puhelinyhteyksi{, n{in ollen mikron (tai p{{tteen), modeemin ja puhelimen omaava tiedonhakija voi ottaa yhteyden n{in. Yhteydenotto tapahtuu seuraavasti: * k{ynnistet{{n tietoliikenneohjelma, tarvittaessa asetetaan tiedonsiirtonopeus yms. parametrit. * soitetaan tiedonhakuj{rjestelm{n puhelinumeroon (Huom. eri tiedonsiirtonopeuksille on usein eri puhelinnumerot), kun j{rjestelm{ vastaa (kuuluu vihelt{v{ merkki{{ni) painetaan modeemin datan{pp{int{. Jos k{ytett{viss{ on sis{inen korttimodeemi, osaavat monet tietoliikenneohjelmat (esim. Procomm) soittaa ja muodostaa yhteyden automaattisesti kunhan vain ohjelmalle on kerrottu puhelinnumero, ellei ohjelma osaa soittaa (esim. Kermit ei osaa) on korttimodeemille kerrottava mihin se soittaa kirjoittamalla oh jelman yhteystilassa ATDpuhnro -merkkisarja. * Nyt kummankin p{{n modeemit "k{ttelev{t" ja mik{li yhteys onnistuu, tulostuu n{yt|lle yleens{ tiedonhakuj{rjestelm{n tunnus tms. T{m{n j{lkeen voidaan kirjoittautua sis{{n j{rjestelm{{n. Edell{ mainittu yhteydenottotapa tiedonhakuj{rjestelm{{n on sama kuin yhteydenotto mihin tahansa, vaikkapa korkeakoulun keskuskoneeseen. 10.2 Yhteys pakettiverkon kautta 10.2.1 Miksi k{ytt{{ pakettiverkkoa? Pakettiverkko tarjoaa k{ytt{jille halvemman ja varmemman tavan tietoliikenneyhteyksiin kotimaassa ja ulkomaille. Pakettiverkot ovat tietoliikenneverkkoja, joissa k{ytt{j{ maksaa verkon yll{pit{j{lle p{{s{{nt|isesti siirretyn tietom{{r{n mukaisen eik{ niin k{{n yhteysaikaan perustuvan maksun (kun k{ytet{{n normaaleja valintaisia puhelinlinjoja tiedonsiirtoon maksetaan yhteysajan mukainen maksu). Suomessa pakettiverkkoja yll{pit{v{t yksityiset puhelinlaitokset (Digipak) ja posti- ja telelaitos (Datapak). Datapak kattaa koko maan, Digipak sen sijaan l{hinn{ Etel{- ja L{nsi-Suomen. Korkeakoulupaikkakunnista Oulu, Kuopio, Jyv{skyl{ ja Lappeenranta ei v{t kuulu Digipakiin. Muuten Datapak ja Digipak eroavat l{hinn{ hallinnollisesti toisistaan, sill{ fyysisesti ne toimivat samassa verkossa. Ulkomailla on lukuisia pakettiverkkoja, esim. Telenet ja Tymnet. Tiedonhakuj{rjestelm{t ovat usein kytkettyn{ ainakin yhteen pakettiverkkoon suorien puhelinyhteyksien ja kiinteiden linjojen lis{ksi. My|s monista korkeakoulujen keskuskoneista on yhteys DATAPAKiin. Pakettiverkon k{ytt{j{n on mahdollista k{ytt{{ useimpia muissakin verkoissa olevia tiedonhakuj{rjestelmi{ omasta verkostaan k{sin. T{ll|in yhteys muodostetaan ns. yhdysk{yt{vien kautta. K{ytt{j{lle t{m{ yhdysk{yt{vien k{ytt| ei v{ltt{m{tt{ n{y muuten kuin tavallista pitemp{n{ osoite eli NUA-numerona (NUA=Network User Address). Kun k{ytt{j{ tiet{{ haluamansa tiedonhakuj{rjestelm{n osoitenumeron, verkko osaa hoitaa yhteyden luomisen toisiinkin verkkoihin . Lopussa on liitteess{ 2 lueteltu tiedonhakuj{rjest elmien NUA-numeroita. 10.2.2 Kuinka pakettiverkkoa k{ytet{{n Pakettiverkon k{ytt| edellytt{{ joko oman sopimuksen solmimista verkon yll{pit{j{n kanssa tai oikeutta k{ytt{{ yhteytt{ jostain yhteyden omaavasta keskuskoneesta. Oman sopimuksen solmiminen on j{rkev{{ mik{li k{ytt| on s{{nn|llist{ eik{ keskuskoneyhte ytt{ ole k{ytett{viss{. Pakettiverkkoon kytkeydyt{{n joko mikrotietokoneesta modeemin ja puhelinlinjan avulla tai keskuskoneesta. Ensin mainitussa tapauksessa tarvitaan k{ytt{j{tunnus, jonka saa solmittuaan sopimuksen joko PTL:n tai jonkin puhelinlaitoksen kanssa. J{lkimm{ise ss{ tapauksessa tarvitaan k{ytt{j{tunnus johonkin keskuskoneeseen, josta on yhteys pakettiverkkoon (ja oikeus k{ytt{{ ko. keskuskoneen pakettiverkkoliitynt{{). Useista korkeakoulujen koneista on yhteys Datapakiin (esim. ns. X.25 yhdysk{yt{v{n kautta). Henkil|, jolla on k{ytt{j{tunnus koneeseen on yleens{ my|s oikeutettu ottamaan yhteytt{ kotimaisiin Datapak-numeroihin ilman erillisi{ lis{lupia (n{in on esim. O PMVAXissa). Yhteydet ulkomaisiin Datapak-numeroihin vaativat yleens{ lis{luvan, OPMVAXiin sellaisen saa korkeakoulun laskentakeskuksen OPMVAX-yhteyshenkil|n kautta. Esimerkki: Yhteys tiedonhakuj{rjestelm{{n OPMVAXista Datapak-pakettiverkon avulla otetaan seuraavalla komennolla: OPMVAX> SET HOST/X29 osoitenro Esimerkki: Yhteys mikrotietokoneesta Datapak-pakettiverkon solmuun ja siit{ edelleen tiedonhakuj{rjestelm{{n: * soitetaan Datapak-solmun numeroon (1200 bps: 92912, 2400 bps: 92913), numerot ovat samat eri puolilla maata * kun j{rjestelm{ vastaa (vihelt{v{ {{ni), painetaan data-n{pp{int{ modeemissa * j{rjestelm{n tunnus tulostuu ruudulle. ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ YDV DATAPAK ³Kirjoitetaan kysymysmerkki, oma³ ?tunnus-osoitenumero <ÄÄÄÄÄÄÄÄÄÄ´tunnus, v{liviiva ja haluttu o-³ ³soitenumero. Tunnus ei tulostu.³ ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ COM <ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÂÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ ³Mik{li yhteys onnistuu tulostuu³ ³n{yt|lle COM ³ ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ 10.2.3 Pakettiverkon kustannukset K{ytett{ess{ yhteytt{ korkeakoulun keskuskoneesta pakettiverkkoon laskutetaan k{ytt| aina korkeakoululta, my|s OPMVAXin pakettiverkon k{yt|n maksaa kyseisen k{ytt{j{n oma korkeakoulu. T{ll|in k{ytt{j{ ei siis tarvitse omia pakettiverkkosopimuksia ja -t unnuksia. Mik{li perusk{ytt{j{ solmii oman sopimuksen pakettiverkon k{yt|st{ kertyy kustannuksia liittymisest{ pakettiverkkoon ja lis{ksi kuukausittaiset k{ytt{j{maksut sek{ tiedonsiirtomaksut ja paikallispuheluiden hinta hakuistuntojen ajalta. Alla on maksut Da tapakin osalta, Digipakin kustannukset eiv{t juuri poikkea n{ist{. * pakettiverkon liittymismaksu (kev{{ll{ -89 150 mk) * pakettiverkon vuokra (15 mk/kk) * pakettiverkon liikennemaksut (kutsumaksu + aikamaksu + tietom{{r{maksu, katso 10.4, esimerkki) * paikallispuhelumaksut pakettiverkkoliittym{{n (normaali paikallispuhelu) 10.3 Muita yhteystapoja 10.3.1 Yhteys FUNET tai NORDUnet -verkoissa oleviin tiedonhakuj{rjestelmiin Vain harvat tiedonhakuj{rjestelm{t ovat n{iss{ verkoissa. Yhteys niihin tapahtuu kiinteit{ ja nopeita linjoja pitkin, kustannuksia k{ytt{j{lle ei koidu. Opmvaxista (ja muista FUNET/DECNET) yhteydenotto tapahtuu seuraavasti: OPMVAX> SET HOST solmunnimi 10.3.2 Yhteys edustaohjelmalla, v{litt{j{ohjelmalla tai muulla erikoisohjelmalla Tiedonhakuun ja tiedonhaun tietoliikenteeseen on kehitetty omia erikoisohjelmia. N{it{ voidaan kutsua edustaohjelmiksi tai v{litt{j{ohjelmiksi. N{m{ ohjelmat ovat (toistaiseksi) tiedonhakuj{rjestelm{kohtaisia, suunniteltu tiedonhakuun vain tietyst{ j{rje stelm{st{. T{mm|inen ohjelma voi fyysisesti sijaita mikrotietokoneessa tai jossain keskuskoneessa. Ohjelmien teht{v{ on helpottaa tiedonhakua, auttaa hakulauseiden muotoilemisessa ja mahdollisesti integroida tietoliikenne ja tiedonhaku yhdeksi ainoaksi ta pahtumaksi. Mikrotietokoneella t{m{nkaltainen edustaohjelma avustaa ensin hakulauseen muodostamisessa, mahdollisesti jopa asiantuntijaj{rjestelm{n kaltaisesti. Seuraavaksi edustaohjelma luo yhteyden suoralla puhelinyhteydell{ tai pakettiverkkoa hyv{ksi k{ytt{en, teke e t{m{n j{lkeen automaattisesti haun ja purkaa yhteyden. T{m{ kaikki lyhent{{ hakuistunnon kestoa normaaliin manuaaliseen hakuistuntoon verrattuna, est{{ virheellisten komentojen antamista ja v{hent{{ kustannuksia (esim. Dialog-tiedonhakuj{rjestelm{n Dial ogLink-ohjelma). Er{s mahdollisuus on, ett{ ohjelma luo yhteyden tiedonhakuj{rjestelm{{n, jolloin haku suoritetaan normaalisti vuorovaikutteisena ja ohjelma siirt{{ saadut tulokset mikrotietokoneen muistiin edelleenk{sitelt{v{ksi. Tulokset voivat olla numeerisia matriise ja (esim. VTKK:n StatFin-tiedonhakuj{rjestelm{n MIKA- ja MIKAS-ohjelmat). N{it{ tiedonhaun ohjelmistoja ovat kehitt{neet monet suurten tiedonhakuj{rjestelmien yll{pit{j{t. Ohjelmat ovat kaupallisia, hinnat vaihtelevat sadoista useisiin tuhansiin markkoihin ja niit{ on l{hinn{ vain IBM-yhteensopiviin mikrotietokoneisiin. 10.4 Tietoliikennekustannukset tiedonhaussa Esimerkki: Yhteys ulkomaiseen, aikaveloitteiseen tiedonhakuj{rjestelm{{n (Dialog) kahdella erilaisella tietoliikennetavalla. Molemmissa k{ytet{{n hyv{ksi Datapak-verkkoa ja suoritetaan samanlainen hakuistunto samoine komentoineen. Kummassakin saadaa n tuloksena sama m{{r{ viitteit{ eli yhteens{ 32 t{ydellist{ viitett{ kahdesta tietokannasta. Tapa 1 : Otetaan yhteys mikrosta 1200 bps modeemin ja puhelimen avulla paikalliseen Datapak-solmuun, josta valitaan tiedonhakuj{rjestelm{n verkko-osoitenumero ja kirjoittaudutaan tiedonhakuj{rjestelm{{n. Hakuistunto talletetaan mikron muistiin lokitied ostoksi. Tietoliikennekustannuksia ja yhteysaikaa kertyy seuraavasti: * yhteys kesti 20 min * tietoliikennekustannukset * Datapakin k{yt|st{ 14.5 mk * paikallispuhelu 1.5 mk * tiedonhaku 170 mk * YHTEENS[ 186 mk Tapa 2 : Otetaan yhteys korkeakoulun keskuskoneesta 9600 bps Datapak-liitynn{n avulla. Hakuistunto talletetaan keskuskoneeseen lokitiedostoksi. Tietoliikennekustannukset ja yhteysaika seuraavat: * yhteys kesti 8 min 30 s * tietoliikennekustannukset 12 mk * tiedonhaku (aikaveloitus + tulosteet) 85 mk * YHTEENS[ 97 mk Yll{ oleva esimerkki kertoo kuinka tiedonhaku muuttuu nopeammaksi ja edullisemmaksi k{ytt{m{ll{ nopeampia yhteyksi{. Vaikka nopeus (nopeus ilmaistaan bittein{ sekunnissa eli bps, kun puhutaan baudeista tarkoitetaan usein samaa) nimellisesti kohosi jopa kahdeksankertaiseksi (1200 bps -> 9600 bps), ei t{m{ nopeuden muutos n{y k{ytt{j{lle yhteysajan putoamisena kahdeksanteen osaan, sill{ ensinn{kin todellinen k{ytt{j{lle n{kyv{ nopeus on aina hitaampi kuin nimellinen nopeus ja toiseksi koska tiedonhakui stuntoon sis{ltyy aina vuorovaikutteista komentojen ja hakulauseiden kirjoittamista. Nopeuden nostaminenhan ei nosta k{ytt{j{n tiedonsiirtonopeutta aivoista sormenp{ihin ja siit{ n{pp{imist|lle. Vaikka k{ytt{j{ ei sit{ aina huomaisikaan, on edellisen esimerkin synkroninen tapa 2 varmempi verrattuna tapaan 1. S{{nn|llisess{ tiedonhaussa tiedonhakuj{rjestelmist{, etenkin kokonaan tai osittain aikaveloitteisista j{rjestelmist{, voi k{ytt{j{ s{{st{{ selv{sti aikaa ja rahaa hankkimalla k{ytt||ns{ nopeammat yhteydet. Esimerkiksi k{ytett{ess{ modeemia ja valin taisia puhelinlinjoja on syyt{ harkita yleisint{ 1200 bps modeemia nopeamman 2400 bps modeemin hankintaa, sill{ jo 5-10 yhteysaikaveloitteisen (esim. Dialog) tiedonhaun j{lkeen on ko. laite maksanut itsens{ takaisin s{{stynein{ tiedonhakukustannuksina 11. ER[IT[ TIEDONHAKUJ[RJESTELMI[ 11.1 VTKK:N TIEDONHAKUJ[RJESTELM[T Valtion tietokonekeskuksen tietopalvelu yll{pit{{ monia tilastollisia ja teksti- ja viitetietokantoja. Tietokannat ovat kahdessa tiedonhakuj{rjestelm{ss{: Minttu-j{rjestelm{ss{ ovat teksti- ja viitetietokannat ja APL-ohjelmiston avulla voidaan hy|dynt{{ t ilastotietokantoja. Kummassakin tiedonhakuj{rjestelm{ss{ on monia eri tiedontuottajia, joiden mukaan tietokantoja my|s ryhmitell{{n. Oikeustieteellisi{ viite- ja tekstitietokanoja nimitet{{n yhteisell{ nimell{ FINLEX-tietopankiksi ja kirjallisuusviitteit{ sis{lt{vi{ tietokantoja KDOK-tietopankiksi. Tilastotietokannoilla ei ole ollut selke{{ ja vakiintunutta nime{, mutta tuore nimi tilastotietokantaj{rjestelm{lle on StatFin-tietopankki. 11.1.1 Yhteys VTKK:n tiedonhakuj{rjestelmiin P{{telaitteen asetukset Minttu-yhteyksiss{ ovat seuraavat: -7 databitti{ -even pariteetti -kaiutus -Datapak ja Digipak full-duplex -suora soittoyhteys half-duplex Yll{mainitut asetukset eiv{t ole v{ltt{m{tt|mi{ kun k{ytet{{n muuta kuin suoraa puhelinyhteytt{ (esim. pakettiverkko-yhteytt{) sill{ my|s p{{tteiden (esim. VT100, VT200 jne.) oletusarvoilla voidaan toimia. 11.1.1.1 Suora puhelinyhteys VTKK:een Suora puhelinyhteys on mahdollinen joko VTKK:n Espoon (90-455 2033, 1200 bps) tai Jyv{skyl{n (941-242 155, 1200 tai 2400 bps) solmuihin. K{ytt{j{lle molemmat solmut ovat samanlaisia eik{ k{ytt| mitenk{{n eroa joten on mahdollista valita kumpi tahansa sol mu. 11.1.1.2 Yhteys pakettiverkon avulla VTKK:n Datapak-numero on 202008, Digipak numero 10284. Katso yhteydenotto tarkemmin luku 10.2.2. 11.1.1.3 Yhteys keskuskoneesta Koska VTKK:n tiedonhakuj{rjestelm{t eiv{t ole korkeakouluverkon (Funet) j{seni{, on yhteys korkeakoulujen keskuskoneista sinne luotava pakettiverkon (Datapak) avulla. Yhteys onnistuu n{in ollen vain niist{ keskuskoneista, joissa on Datapak-yhteys. Tosin n iist{ korkeakoulujen IBM-keskuskoneista, jotka kuuluvat ns. SNA-verkkoon, on kiinte{t yhteydet my|s VTKK:n tiedonhakuj{rjestelmiin. Katso my|s esimerkki{ luvussa 11.1.2.2 11.1.2 MINTTU-TIEDONHAKUJ[RJESTELM[ Valtion tietokonekeskuksen Minttu-tiedonhakuj{rjestelm{ss{ on monien tiedontuottajien tekstitietokantoja sek{ viitetietokantoja. Seuraavassa on julkiset tietokannat aiheenmukaisesti lueteltuina: -ty|suojelu (4 tietokantaa) -kotimaiset patentit ja standardit(2) -VTT:n tutkimukset (1) -kotimaiset rekisterit ja julkiset tietokannat (1) -pohjoimaiset julkiset tietokannat (1) -yleiset bibliografiset tietokannat (5) *lehtiartikkelit *suomalainen ja Suomeen hankittu kirjallisuus *kotimaiset {{nitteet -online-harjoittelu (2) -oikeustiede (17) *bibliografiat *oikeusistuinten ja viranomaisten ennakkop{{t|kset *lait ja s{{d|kset 11.1.2.1 Mintun laskutus Uusien Minttu-tietokantojen k{ytt{jien liittymismaksu on 300 mk. Mintun k{ytt|laskutus perustuu komentojen ja tulosteiden m{{riin (itse asiassa keskusyksikk|aikakin vaikuttaa laskutukseen, mutta se on suoraan riippuvainen komentojen ja tulosteiden m{{r{st{). Minttu ei siis ole yhteysaikaveloitteinen. Kello 17 j{lkeen k{ytt| on n. 10% edullisempaa. 11.1.2.2 Haku Minttu-tiedonhakuj{rjestelm{st{ Mintussa on k{yt|ss{ loogiset operaattorit JA (,), TAI (!) ja EI. Kun samassa hakulauseessa on useampia hakutermej{, on k{ytett{v{ pilkku- (,) tai huutomerkki{ (!). Mintussa ei ole k{yt|ss{ l{heisyysoperaattoreita. Kirjoitetussa muodossa operaattoreita k{ ytet{{n vain silloin kun aiemmin syntynytt{ tulosjoukkoa halutaan laajentaa tai supistaa. Loogisten operaattoreiden k{ytt| Mintussa poikkeaa hieman muista tiedonhakuj{rjestelmist{. Esimerkki: Haetaan Mintusta ne viitteet, joissa esiintyv{t joko psykologian tai k{ytt{ytymisen johdannaiset ja lis{ksi joko behaviorismi tai k{ytt{ytyminen tai niiden johdannaiset. KOTI >HAE psykologi-!k{ytt{ytymi- KOTI >JA behaviorismi-!skinner Mintussa on k{yt|ss{ monia komentoja, jotka toimivat vain synkronisilla yhteyksill{, jolloin komentoja annetaan painamalla funktion{pp{imi{ (F1, F12, PF3, jne.). Yleens{ n{m{ komennot eiv{t ole korkeakouluk{ytt{j{n k{ytett{viss{. T{ss{ luvussa esitet{{n p eruskomennot. Tarkemmat komennot ja k{ytt|ohjeet l|ytyv{t Minttu k{ytt|oppaasta, jonka k{ytt{j{ saa solmiessaan k{ytt|sopimuksen VTKK:n kanssa, KDOK/MINTTU-oppaasta tai FINLEX-oppaasta. Esimerkki: Otetaan yhteys OPMVAXista VTKK:n Datapak-numeroon ja talletetaan istunto omaan p{{hakemistoon OPMVAXin muistiin. Tiedonhaussa etsit{{n lehtiartikkeliviiteit{ sis{lt{v{st{ KATI-tietokannasta Esa Saarisen lehtiartikkeleita ja my|s h{nest{ kirjo itettuja lehtiartikkeita, ja koska olemme kiinnostuneita h{nen ja h{nest{ kertovien artikkeleiden v{rikk{{mm{st{ p{{st{, etsimme viel{ hiem{n tarkentaen ja valikoiden. ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ OPMVAX> set host/x29/log=mint.log 202008 <´Yhteys Datapak-numeroon, ³ ³istunto mint.log tiedostoon³ %PAD-I-COM, call connected to remote DTE ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ minttu <ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ´Ilman kehoitetta anna minttu³ ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ M I N T T U V. 3.0 KOLA-tietokanta poistettu! K{ytt|ohjeita saa helpist{ kirjoittamalla kysymysmerkin (?). Yksityiset MINTTU-tietokannat sijaitsevat ohjelmassa YMINTTU. K{ynnist{ komennolla YMINTTU (eik{ MINTTU). Tunnussanan vaihto: Kirjoita tunnussanan per{{n sulkuihin uusi tunnussana kaksi kertaa samanlaisena pilkulla erotettuna mallin mukaisesti. TUNNUS TUNNUSSANA(UUSISANA,UUSISANA) ANNA K[YTT[J[TUNNUS JA TUNNUSSANA ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ GIVE USER ID. CODE AND PASSWORD: ³ Annetaan k{ytt{j{tunnus, ³ ÚÄÄÄÄ´ v{lily|nti ja salasana ³ Mint >vtkkta ZZZZZZZZ <ÄÄÄÄÄÄÄÄÄÄÄÄÄÙ ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ AVAA TIETOKANTA, PELKK[ 'AVAA' N[YTT[[ VAIHTOEHDOT. ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ Mint >avaa kati <ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ´Siirryt{{n Kati-tietokantaan³ KATI VALMIS. ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ KATI >listaa saarinen <ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ´ Katsotaan indeksist{ Saariset ³ ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ SAARINEN ........... 215 SAARINEN_JUHA ...... 2 . . SAARINEN_ESA ....... 43 SAARINEN_PEKKA ..... 3 . . ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ KATI >h t:Saarinen_esa <ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ´Haetaan Esa Saarisen ³ T:SAARINEN_ESA *32 Set 1 ³toimittamat artikkelit³ ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ KATI >tai saarinen,esa <ÄÄÂÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÂÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ SAARINEN,ESA ³ *73 41 Set 2 ³ja artikkelit joissa ³ ³ ³h{net mainitaan ³ KATI >tai saaris-,esa <ÄÄÙ ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ SAARIS-,ESA *78 9 Set 3 ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ ³Koska viitteit{ kertyi³ KATI >ja rankka!power- <ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ´per{ti 78 etsit{{n ³ RANKKA!POWER- *4 204 Set 4 ³vain "rankimmat" ³ ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ KATI >skoko=2000 <ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÂÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ -- OK -- ³Tulostusm{{r{ksi ker- ³ ³ralla 2000 rivi{ ³ KATI >k s4,1-4 <ÄÄÄÄÄÄ¿ ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÂÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ ³tulostetaan viitteet 1-4 ³ 001 ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ Punk, power, kirjallisuus (Mielipiteit{ Esa Saarisen ja Anja Kaurasen artikkelista Ylioppilaslehdess{) T:Alapuro_Kristina L:Suomen_kuvalehti 64 (1980): 43, s.67-69 /Saarinen_Esa /Kauranen_Anja UDK:008 /a /1980 /fin *AI . . 004 Mit{ on Esa Saarisen power? T:V{{n{nen_Tapani L:N{k|piiri 5 (1983): 1, s.18-19 /Saarinen_Esa /Henkil|historia UDK:92 YKL:99.1 /a /1983 /fin *Kp KAIKKI DOKUMENTIT TULOSTETTU. *** D: 4/4 S: 1/1 30.05.1989 11:40 *** ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ KATI >lasku <ÄÄÄ´ Tarkistetaan istunnon aikana kertynyt lasku: ³ ³ 7 * 1.6 mk + 17.64 * 49 p = n. 20 mk ³ ISTUNNON AIKANA ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ -LASKUTETTAVIA KOMENTOJA YHTEENS[ 7 KPL -LASKUTETTAVIA TULOSTEITA YHTEENS[ 0 KPL -K[SITTELY-YKSIK\IT[ (SKY) 17,64 KPL T[SS[ (KATI) TIETOKANNASSA LASKUTETTAVAA -KOMENTOJA YHTEENS[ 7 KPL -TULOSTEITA, V[H. 3 PER[KK[IST[ RIVI[ 0 KPL ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ KATI >eroa <ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ´ Erotaan Mintusta ³ ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ EROTTU MINTUSTA. KATI > %PAD-E-CLR_DTE, call cleared by remote DTE -PAD-I-CAUSEDIAG, cause code 00, ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ diagnostic code 00 ³Opmvax kertoo tie- ³ PAD usage statistics: ³toliikenteen m{{r{n ³ Elapsed time: 00:04:11.20 CPU time:00:00:00.48 <´ja k{ytetyn keskus- ³ Buffered I/O: 148 Direct I/O:80 ³yksikk|ajan (Huom. ³ Page faults: 507 > ³Opmvaxin, ei Mintun)³ ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ %PAD-F-END, control returned to node OPMVAX:: ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ OPMVAX> <ÄÄÄ´Opmvaxin komentotilassa³ ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ 11.1.2 VTKK:n APL-tietokannat Valtion tietokonekeskus on Suomen suurin tilastollisten tietokantojen yll{pit{j{. Tiedon tuottajina toimivat eri tahot, kuten tilastokeskus, asuntohallitus, maatilahallitus jne. Tietokantoja on seuraavilta aloilta: -Ahtika (aikasarjoja, tilastotietoa asumisesta) -Altika (aikasarjoja, tilastotietoa v{est|st{, taloudesta, jne. kunnittain, seutukaavaliitoittain sek{ valtakunnallisesti) -Artika (ajoneuvorekisteri) -Astika (Suomen ja OECD:n taloudellisia tietoja) -Maltika (maa- ja mets{taloustietoa) -Yrtika (yritystietokanta) Artikaa ja Yrtikaa lukuunottamatta tietokannat kuuluvat StatFin-tietopankkiin. K{yt{nn|ss{ my|s Artika ja Yrtika ovat samassa tiedonhakuj{rjestelm{ss{ ja toimivat samoin komennoin. Ottaessaan yhteytt{ VTKK:n tilastotietokantoihin k{ytt{j{ kirjoittautuu ensin VM-k{ytt|j{rjestelm{{n (k{ytt{j{ voi muutenkin joutua joskus tekemisiin VM-k{ytt|j{rjestelm{n kanssa) ja sen j{lkeen haluamaansa sovellusohjelmaan (esim. Astika-tietokantaan kom ennolla ENTER ASTIKA tai ENTER ASTIKA E kun k{ytett{viss{ on tavallinen eik{ APL-p{{te). Itse poimintaohjelma on vuorovaikutteinen eli se kyselee k{ytt{j{lt{ kulloinkin seuraavan toimenpiteen, muuttujat, muuttujien luokat jne. Haun tuloksena muodostuu yks i tai useampia matriiseja. APL-tietokannat on toteutettu APL-ohjelmointikielell{ ja siksi j{rjestelm{{ pystyy edelleenkin parhaiten k{ytt{m{{n henkil|, joka osaa APL-kielt{. Samoin l{ht|kohtana on ollut, ett{ k{ytt{j{ omistaa ns. APL-p{{tteen eli p{{tteen tai mikron joka on nimenom aan suunniteltu APL-k{ytt|{ varten ja jonka n{pp{invalikoima poikkeaa tavanomaisesta. Jos k{ytett{viss{ ei ole t{llaista p{{tett{, on j{rjestelm{{n kirjoittauduttaessa erikseen kerrottava, ett{ k{ytet{{n tavanomaista p{{tett{. Esimerkki: Poimitaan tiedot kolmen kaupungin, Helsingin, Tampereen ja Turun, v{est|ennusteet vuosille 1990, 1995 ja 2000. N{ist{ muodostetuu yksi matriisi, joka l{hetet{{n Opmvaxiin s{hk|postina EARN-yhteyksi{ k{ytt{en. ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ OPMVAX> set host/x29 202008 <ÄÄÄÄÄÄÄÄÄÄ´Otetaan yhteys VTKK:n Datapak-³ ³numeroon 202008 ³ ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ %PAD-I-COM, call connected to remote DTE ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ vm k{ytt{j{tunnus <ÄÄÄÄÄ´Kirjoitetaan vm ja oma k{ytt{j{tunnus ³ ³Huom. j{rjestelm{ ei anna mit{{n kehoitetta ³ Enter password: ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ salasana <ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÂÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ ³Kirjoitetaan oma salasana ³ LOGMSG - 20:36:34 FIN WEDNESDAY 06/07/89 ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ . . Ready; T=0.06/0.08 19:16:16 ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ .enter altika e <ÄÄÄÄÄÄÄÄ´ Siirryt{{n Altikaan koneen k{ytt|j{rjestel-³ L (102) R/O ³ m{st{. Komennon lopussa e kertoo j{rjestel-³ ³ m{lle ett{ k{yt|ss{ ei ole APL-p{{te. ³ APL2 1.3.00 (ENGLISH) ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ . . Tervetuloa! Uutiset (26.06.1989) komennolla: UUTISET K{yt|ss{si on tietokanta ALTIKA Poiminta aloitetaan komennolla: POIMI Luettelo t{rkeimmist{ komennoista: OHJE -------------------------------------------------------- Ohjelmiston uusi versio otettu k{ytt||n 21.2., ks. UUTISET / Yleist{ poimi <ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÂÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ *** poiminta ALTIKAsta *** ³Aloitetaan tiedonhaku ³ Mika aluepoiminta:? <ÄÄÄÄÄ¿ ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ ** KUNTAPOIMINTA ** ³ ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ 11 KAIKKI KUNNAT ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ´Haluttaessa saadaan ³ 12 POIMINTA KUNTANUMERON MUKAAN ³vastausvaihtoehdot n{-³ 13 POIMINTA LAANIN MUKAAN ³kyviin ? -merkill{ ³ 14 POIMINTA SEUTUKAAVA-ALUEEN MUKAAN ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ 15 POIMINTA ALUELUOKITUSREKISTERIN MUKAAN -------------------------------------------------- ** SUMMATASOPOIMINNAT ** 21 KOKO MAA YHTEENSA 22 LAANISUMMAT 23 SEUTUKAAVA-ALUESUMMAT -------------------------------------------------- SAMA \ KAYTETAAN EDELLISTA VALINTAA UUSI \ TULOSTUS UUSITAAN POIMITULLE MATRIISILLE ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ Mika aluepoiminta:12 ³Valitaan halutut kun- ³ MITKA KUNNAT:91 837 853 <ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ´takoodit (Hki,Tre,Tku)³ Mika ilmioalue :0217 <ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ´ilmi|alue (v{est|en- ³ Mitka muuttujat:ik{ryhmitys <ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ´nuste), halutut muut- ³ Mitka muuttujan vuosi luokat:90 95 00 <ÄÄÄÄÄÄÄÄÄ´tujat ja niiden luokat³ Mitka muuttujan ikaryhmitys15 luokat:(19-33) <ÄÄÁÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ 1=summataan, 2=alueittain (t. alueluokituksen mukaan):2 <ÄÂÄÄÄÄÄÄÄÄÄÄÄÄ¿ Haetaan tiedot... ³Ei summata ³ ÀÄÄÄÄÄÄÄÄÄÄÄÄÙ Poimittu matriisi on 3 3 1-kokoinen ja se sis{lt{{ 9 lukua. Mit{ poimitulle aineistolle tehd{{n? 1 = S{ilytet{{n muistissa tulostusta ja muuta k{sittely{ varten 2 = Tulostetaan pelk{t luvut ilman tekstej{ n{yt|lle 3 = Kuten 1 (s{ilytet{{n muistissa), j{rjestet{{n tulostusasultaan parhaaksi Enter = ei poimintaa (paluu ed. kohtiin) Anna tulostusvalinnan numero (suositus=3):3 Anna nimi:vaki CPU: .36 ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ Mika aluepoiminta: <ÄÄ´Kun edellinen matriisi on poimittu, ohjelma³ ³siirtyy aloittamaan uutta poimintaa. T{st{ ³ KIITOS ³p{{see yli antamalla rivinvaihdon ³ ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ Sinulla on ty|tilassa seuraavat poimitut matriisit: VAKI Poimintaohjelmaa kutsutaan kirjoittamalla komento: POIMI Luettelo t{rkeimmist{ komennoista saadaan kirjoittamalla: OHJE ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ 'Vaki' tulosta 'vaki' <ÄÄÄÄÄÄÄÄÄÄÄÄ´Halutaan tulostaa matriisi ³ *** Matriisin tulostaminen levylle *** ³vaki tiedostoksi vaki. Ko- ³ ³mento on yleisemmin muotoa ³ ³'tiedosto' TUL 'matriisi' ³ ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ ANNA TULOSTUSDESIMAALIN PITUUS(OLETUS=0): Tiedosto VAKI DATA on tulostettu levylle A ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ ulos <ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ´Poistutaan komentotasolle ³ P{{teyhteyden lopettaminen ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ Jos haluat perua, anna P, muutoin vain Enter ULOS - p{{teyhteys lopetetaan ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ CONNECTED 0.8.26 ³L{hetet{{n tiedosto EARN- ³ CPU TIME 0.0.1 ³solmuun FINFUN (Opmvax) ³ Ready; T=1.07/1.50 19:24:55 ³k{ytt{j{tunnukselle Lyly- ³ .sendfile vaki data to lylykorpi at finfun <´korpi. Huom. t{m{ ei onnis³ File VAKI DATA A1 sent to LYLYKORP at FINFUN³tu kaikkiin EARN-solmuihin³ on 06/26/89 19:25:26 ³L{hett{misen vaihtoehtona ³ Ready; T=0.04/0.05 19:25:26 ³on istunnon tallentaminen ³ .logoff <ÄÄÄÄÂÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ ³lokitiedostoksi muistiin. ³ ³ Kirjoittaudutaan ulos. ³ ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ CONNECT= 00:09:30 VIRTCPU= 000:01.17 TOTCPU= 000:01.68 LOGOFF AT 19:25:44 FIN MONDAY 06/26/89 11.1.2.1 StatFin-Matriisien jatkok{sittely Ohjelmisto tarjoaa my|s mahdollisuudet matriisien yhdistelemiseen ja tilastolliseen k{sittelyyn (SAURUS-ohjelma). T{m{ asettaa vaatimuksia tietoliikenneyhteyksille, vaatii ohjelmaan paneutumista ja maksaa k{ytt{j{lle. SAURUS-ohjelmistosta l|ytyy lis{tieto a VTKK:n toimittamasta oppaasta ja omien luokittelujen tekemisest{ (joka vaatii jonkin verran paneutumista APL-kieleen) APL-k{ytt{j{n oppaasta. Korkeakouluk{ytt{j{ll{ on kuitenkin mahdollisuus k{sitell{ ja yhdistell{ matriiseja korkeakoulujen keskuskoneilla tai mikroilla (katso tark. luku 12) 11.1.2.2 StatFin-j{rjestelm{n laskutus Tilastotietokantojen laskutus perustuu annettujen komentojen m{{r{{n. Hinnat ovat n. 10% normaalihintoja edullisemmat klo. 17 j{lkeen. 11.2 DIALOG-TIEDONHAKUJ[RJESTELM[ Amerikkalaisessa Dialogissa on saatavissa l{hes 400 tietokantaa ja se on maailman suurin tiedonhakuj{rjestelm{. Tietokantoja on eri tieteen aloilta sek{ liike-el{m{st{ ja kaupasta. Seuraavassa on tietokannat aiheenmukaisesti luokiteltuina: -maatalous ja ravitsemus (9 tietokantaa) -yleiset bibliografiat, kirjat ja monografiat (12) -talous: 12 eri alaa(yhteens{ noin 100) -kemia(26, mukana mm. CA) -tietojenk{sittelyoppi(7) -uutiset(19) -puolustus(6) -hakemistot(11, mm Marquis Who's Who) -kasvatus(5) -energia ja ymp{rist|(16) -s{{ti|t ja apurahat(4) -laki ja hallinto(17) -materiaalitieteet(6) -l{{ketiede ja biotieteet(26) -online-harjoittelu(26, eri aloilta) -patentit ja tavaramerkit(23) -tiede ja teknologia yleens{(29) -yhteiskunta- ja humanistiset tieteet(22, mm. Sociological Abstracts ja Historical Abstracts) -muut(8, mm. Academic American Encyclopedia) Dialogissa on nelj{n tyyppisi{ tietokantoja: BIBLIOGRAFISIA eli viitteit{ kirjoihin, lehtiartikkelihin, patentteihin jne, HAKEMISTOJA yhti|ist{, j{rjest|ist{, audio-visuaalisesta materiaalista jne, NUMEERISIA eli tilastoja, usein my|s tekstinumeerisia, F ULLTEXT-tietokantoja jotka sis{lt{v{t lehtiartikkeleita kokonaisuudessaan, tietosanakirjoja, sanakirjoja jne. Maksut perustuvat yhteysaikaan sek{ tulostettujen viitteiden m{{r{{n ja ne vaihtelevat tietokantakohtaisesti (n{ist{ tarkemmin my|hemmin). Varsinaisten tietokantojen lis{ksi Dialogissa on halpoja harjoittelutietokantoja eri alueilta ja niiden tiedot ovat usein alan vanhempaa tietoa tai sis{lt{v{t vain osan tietueista (esim. ONTAP AGRICOLA, file 210, sis{lt{{ 24000 tietuetta AGRICOLAn 2,4 miljoonasta). Harjoittelutietokantojen k{ytt| on huomattavsti halvempaa kuin varsinaisten. 11.2.1 Yhteys Dialog-tiedonhakuj{rjestelm{{n Yhteysmahdollisuudet Dialogiin kuten moniin muihinkin tiedonhakuj{rjestelmiin ovat hyvin moninaiset: suora puhelu (joko tavallisella p{{te-emulaattoriohjelmalla tai DialogLink-ohjelmalla), mikrosta Datapak- tai Digipak-verkkoon ja siit{ edelleen tiedonhak uj{rjestelm{{n jostain keskuskoneesta pakettikytkent{isen verkon kautta. Tietoliikenneparametrit Dialog-tiedonhakuj{rjestelm{{ varten ovat seuraavat: 7 databitti{, 1 parillinen pariteettibitti (1 even parity), 1 stopbitti. N{m{ ovat usein riitt{v{t asetukset, my|s muilla asetuksilla yhteys voi onnistua mutta salasanat tulostu vat ruudulle (kaiuttuvat), merkkien tuhoaminen ei onnistu tms. Edell{mainittujen parametrien pit{si olla riitt{v{t, mutta lis{ksi voi asettaa my|s 'hienos{{t|asetuksia' mik{li se on ohjemallisesti mahdollista: XON/XOFF optio ON -asentoon, Auto Line Feed O FF-asentoon, ABM/Answerback OFF-asentoon, Block Mode OFF-asentoon ja Auto Disconnect OFF-asentoon. 11.2.1.1 Suora puhelinyhteys Dialog-tiedonhakuj{rjestelm{{n Puhelinyhteys modemin avulla suoraan Dialogiin on mahdollinen, joskin t{ll|in tiedonsiirtokustannukset muodostuvat helposti hyvin suuriksi. Hieman edullisempi vaihtoehto on puhelinyhteys Lontoossa sijaitsevaan Dialnetin solmuun (p. 990 44 1 831 7322). Yht eys on mahdollinen 300, 1200 ja 2400 bps nopeuksilla ja sen hinta on kaukopuhelun hinta. Sis{{nkirjoittautuminen tapahtuu t{ll|in seuraavasti: 1. Asetetaan p{{te FULL DUPLEX -tilaan 2. Otetaan yhteys Dialnet-solmuun numeroon p. 990 44 1 831 7322 3. Kun yhteys on muodostunut painetaan ENTER tai tai A -n{pp{int{ (mik{li ei onnistu yritet{{n n. 10 sekunnin kuluttua uudelleen) 4. N{kyviin tulee teksti "ENTER SERVICE:" johon vastataan kirjoittamalla DIALOG 5. T{m{n j{lkeen kirjoittaudutaan sis{{n normaalisti antamalla k{ytt{j{tunnus ja salasana 11.2.1.2 Yhteys keskuskoneesta pakettikytkent{isen verkon kautta Mik{li olet oikeutettu k{ytt{m{{n keskuskoneen ulkomaanyhteyksi{ (tarkista tarvitaessa korkeakoulusi laskentakeskuksesta), voit ottaa yhteyden Dialogiin vaikkapa seuraavalla komennolla (OPMVAXista), joka samalla tallentaa istunnon lokitiedostoon: $ SET HOST/X29/LOG=DIALOG.LOG DIALOG tai mik{li nime{ ei ole m{{ritelty (OPMVAXissa on m{{ritelty, kaikissa FUNET/DECNETin solmuissa ei ole) niin: $ SET HOST/X29/LOG=DIALOG.LOG 0234212300120 11.2.2 Editointi Dialog-j{rjestelm{ss{ Editointi komennot ovat seuraavat: edellisen merkin tuhoaminen (backspace) =CTRL-H rivin tuhoaminen=ESC ja sen j{lkeen k{ynnistetyn komennon keskeytt{minen= online outputin keskeytt{minen= 11.2.3 Haku Dialog-tiedonhakuj{rjestelm{st{ Dialog-tiedonhakuj{rjestelm{ss{ valitaan sis{{nkirjoittautumisen j{lkeen haluttu tietokanta josta haku suoritetaan. Mik{li tietokantaa ei valita ollaan oletustietokannassa joka on yleens{ ensimm{inen eli kasvatustieteellinen harjoittelutietokanta ERIC joku muu edullinen (ERIC on 30 $/h) harjoittelutietokanta. Oletustietokannan voi vaihtaa vain l{hett{m{ll{ kirjallisen pyynn|n Dialogille. Paitsi harjoittelu, niin my|s ?NEWS, ?FILES, ?RATES yms. j{rjestelm{n tilaa ja hintoja koskevat komennot on syyt{ t ehd{ t{ss{ vaiheessa, sill{ Dialogin tietokantakohtaiseen yhteysaikaan ja tulosteisiin sidottu laskutus suosii t{t{. Dialogissa ovat k{ytett{viss{ Boolen operaattorit (prioriteettij{rjestyksess{) NOT, AND ja OR. Lis{ksi hakulauseiden muodostamisessa voidaan k{ytt{{ l{heisyysoperaattoria (N), toista l{heisyysoperaattoria (W), joka etsii hakusanoja vain tietyss{ j{rjesty ksess{, F-operaattoria (F), jolla etsit{{n samassa kent{ss{ miss{ tahansa j{rjestyksess{ olevia hakusanoja sek{ katkaisu- ja korvaavuusmerkki{ (?). Haku voidaan rajoittaa tiettyihin kenttiin tai se voidaan tehd{ vapaatekstihakuna. Hakustrategian voi tall ettaa my|hemp{{kin k{ytt|{ varten, sen voi asettaa suoritettavaksi automaattisesti aina tietokannan p{ivitt{misen yhteydess{: n{in esimerkiksi jonkun kiinnostavan tutkijan tuotantoa odotellessa voi saada automaattisesti tiedon mik{li jotain ilmestyy. Hakulause muodostetaan esimerkiksi seuraavasti: SELECT AU=SMITH,R? AND (TELEVISION?/TI OR TV/TI) SELECT voidaan my|s korvata pelk{ll{ S-kijaimella. Esimerkiss{ hajamielinen tutkija etsii jotain SMITH-nimist{ tekij{{ jonka etunimi oli jotain Robert, Rob tai jotain muuta R-kirjaimella alkavaa ja otsikossa (/TI merkitsee haun kohdistamista otsikkokentt{ {n) esiintyi joko sana television (olisiko ollut per{ti taivutetussa muodossa, siksi katkaisumerkki ?) tai tv. Edellisess{ rivin alussa oleva ? on tiedonhakuj{rjestelm{n kehoite (prompt) joka on merkkin{ siit{ ett{ j{rjestelm{ on valmiina ottamaan komentoja vastaan. Dialogissa on my|s tietokantakohtainen tesaurus (sanaluettelo), jonka avulla voidaan etsi{ hakusanoja ja arvioida viitteiden m{{ri{. 11.2.3.1 Online-tulosteet Hakuistunnon aikana tulosteet saadaan joko tulostamalla ne paperille, ottamalla koko istunto lokitiedostoon tai tallentalla haluttu hakuistunnon osa p{{te-emulaattorin avulla muistiin. Tulostaminen tapahtuu TYPE tai T -komennolla ja sen yhteydess{ on annettava parametreina tulosjoukko (setti), johon tulostus kohdistuu ja haluttu tulostusmuoto (format) sek{ halutut viitteet. Tulostusmuodot (format) biliografisissa tietokannoissa ovat seuraavat: 1:Viitenumero (Dialogin) 2:T{ydellinen tietue tiivistelm{{ lukuunottamatta 3:Bibliografinen sitaatti 4:Tiivistelm{ ja otsikko (tietokantakohtainen) 5:t{ydellinen tietue 6:otsikko 7:bibliografinen sitaatti ja tiivistelm{ 8:otsikko ja indeksointi Esim. TYPE 12/6/1-12 tai T 12/7/ALL Ensimm{isess{ esimerkiss{ tulostettiin setist{ 12 viitteet 1-12 tulostusmuodossa 2 (vain otsikko) ja toisessa esimerkiss{ samasta setist{ kaikki viitteet t{ydellisess{ tulostusmuodossa abstrakteineen. Numeerisissa tietokannoissa tulostaminen tapahtuu REPORT komennolla. 11.2.3.2 Offline-tulosteet Dialogissa on mahdollista saada haluamansa tulosteet postitse itselleen, t{ll|in ne ovat hieman kalliimpia kuin itse tulostettuina. Toisaalta yhteysaika j{{ n{in lyhyemm{ksi. Offline-tulosteet saadaan komennolla PRINT tai PR. Mahdollinen peruminen tapahtuu komennolla PRINT- tai PR-. Aivan samoin kuin online-tulostuksessa on m{{ritelt{v{ tulostusmuoto ja halutut tietueet. Esimerkki: Tulostetaan tulosjoukosta 7 tulostusmuodossa 5 (t{ydellinen tietue) viitteet 1-49. PR 7/5/1-49 Dialog: t{rkeimm{t komennot BEGINn (Bn) Siirtyminen tietokantaan n ja haun aloittaminen. Tuhoaa aiemmin (muissa tietokannoissa) tehdyn ty|n. DISPALY SETS (DS) Kertoo istunnon aikana kertyneet setit. EXPAND (E) Tulostaa osan indeksist{. Voidaan k{ytt{{ sanojen, etuliitteiden tai tesauruksen kanssa. K{yt{ PAGE (P) komentoa tulostuksen jatkamiseen seuraavalle sivulle. EXPAND sana Tulostaa osan indeksist{, voidaan k{ytt{{ my|s etuliitteiden kanssa (esim. E AU=JONES). EXPAND (sana) Haetaan tesauruksesta sanaan liittyv{t synonyymit ja rinnakkaiset ilmaisut. Huom: kaikissa tietokannoissa ei ole tesaurusta. EXPLAIN (?) Online-apua j{rjestelm{n komennoista. PAGE (P) Seuraava ruutu (DISPLAY tai EXPAND -komentojen j{lkeen). SELECT (S) Hakukomento SELECT FILES (SF) K{ytet{{n vain DIALINDEX-tietokannan yhteydess{ COMBINE (C) K{ytet{{n Boolen operaattoreiden AND, OR ja NOT kanssa yhdist{m{{n settej{. TYPE (T) Online-tulostuskomento: muotoa TYPE setti/formaatti/viitteet. DISPLAY (D) Online-tulostuskomento k{ytett{ess{ Videotex-p{{tett{. Muotoa DISPLAY setti/formaatti/viitteet PRINT (PR) Offline-tulostuskomento: muotoa setti/formaatti/viitteet tai setin sijasta komento voi kohdistua Dialogin viitenumeroihin. PRINT- (PR-) Offline-tulostuksen perumiskomento. REPORT Tulostuskomento numeerisia tietokantoja varten. LOGOFF Poistuminen Dialogista: antaa automaattisesti tiedot kertyneest{ yhteysajasta ja kustannuksista. LOGOFF HOLD Poistuminen tilap{isesti: s{ilytt{{ hakuistunnon tulokset v{hint{{n 10 min ajan mutta katkaisee linjayhteyden. LOGON Poistuminen linjayhteytt{ katkaisematta (esim. sis{{nkirjoittautuminen toisella tunnuksella). Esimerkki: Haku Dialogin tilastotietokannasta ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ OPMVAX> SET HOST/X29/LOG=DIALOG1.LOG DIALOG <Ä´Yhteys Opmvaxista Dia- ³ ³logiin pakettiverkon ³ %PAD-I-COM, call connected to remote DTE ³kautta. Istunto tiedos-³ ³toon Dialog1.log ³ DIALOG INFORMATION SERVICES ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ PLEASE LOGON: ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ ******** <ÄÄÄÄÄÄÂÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ´Annetaan k{ytt{j{tunnus³ ENTER PASSWORD: ³ ³ja salasana ³ ******** <ÄÄÄÄÄÄÙ ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ Welcome to DIALOG Dialog level 19.5.7A Last logoff 14feb89 12:30:05 Logon file001 14feb89 12:35:53 File 1:ERIC - 66-88/DEC. ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ Set Items Description ³Valitaan tietokanta 575 ³ --- ----- ----------- ³(v{est|tietoja) ³ ?b 575 <ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÁÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ 14feb89 12:36:11 User171409 Session A1.1 $0.18 0.006 Hrs File1 $0.18 Estimated cost File1 $0.18 Estimated cost this search $0.18 Estimated total session cost 0.006 Hrs. File 575:D&B - Donnelley Demographics - 8/88 (Copr. 1988 DMIS) * 1988 data is now available! * * NOTE: Until you receive the new bluesheet in the Oct. Chronolog, * * refer to ?FIELD575 for changes in the file. * ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ Set Items Description ³Valitaan ne tietueet, jotka ovat ³ --- ----- ----------- ³kaupunkeja ja asukasluku on yli ³ ?s lv=city and ag>=1000000 <ÄÄÄÄÄÄÄÄ´miljoonan. Haku kohdistetaan ³ ³kenttiin, jotka saa tarvittaessa ³ 22529 LV=CITY ³komennolla FIELD tai k{sikirjasta³ 370 AG>=1000000 ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ S1 8 LV=CITY AND AG>=1000000 ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿ ?.sort 1/all/ag,d <ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ´J{rjestet{{n kaikki (all)