Localizarea Informației în Internet

Previzualizare laborator:

Extras din laborator:

Internetul este un uriaş depozit de informaţii. Informaţiile sunt localizate în cele peste 1,5 miliarde de site-uri existente în anul 2002 în reţea (numărul lor se dublează odată la 18 luni). Marea parte a informaţiei în reţea este disponibilă gratuit, dar sunt şi destule excepţii.

Problema majoră pe care o au utilizatorii Internet este dimensiunea uriaşă a reţelei. Întrebarea care apare în mod natural când este vorba de căutare pe Internet este: cum găsim informaţiile care ne interesează ?. Din păcate, nu există nici un sistem care să asigure evidenţa curentă a site-urilor din reţea, cum ar fi cartea de telefoane sau catalogul unei biblioteci, etc.

Browser – este un program folosit la deplasarea (navigarea) prin paginile Web, fiind de fapt o aplicaţie de „răsfoire” a conţinutului unui server Web. Browser-ul lansează cererea utilizatorului către serverul Web şi oferă documentul primit pentru utilizare. Programele de navigare cele mai cunoscute sunt Mosaic, Netscape Comunicator, Microsoft Inernet Explorer şi Lynx.

Programul de navigare aduce pagina cerută pe calculatorul utilizatorului, interpretează textul şi comenzile de formatare conţinute în text şi afişează pagina gata pe monitor. Şirurile de caractere care reprezintă cuvintele cheie al documentului şi legăturile către alte documente ce conţin aceleaşi cuvinte cheie se numesc hiperlegături şi sunt afişate în mod diferit decât restul documentului, de obicei evidenţiat cu altă culoare sau subliniat. Pentru a selecta o legătură este de ajuns plasarea cursorului în zona respectivă şi clicarea pe legătura respectivă.

Browser- ele fac legătura între utilizator şi Web, dar nu rezolvă problema localizării surselor ce dispun de informaţiile necesare.

Unica soluţie pentru a rezolva problema localizării informaţiilor necesare în reţeaua globală este utilizarea unor servicii puse la dispoziţie de către Internet care apar din ce în ce mai multe şi mai performante. Serviciile de căutare existente pe Internet se împart în două mari categorii: motoare de căutare şi directoare.

Un motor de căutare este un server ale cărui programe speciale navighează automat pe Internet şi indexează toate paginile găsite, în funcţie de anumite criterii. Aceste programe se numesc robots, spiders sau crawlers. Ele sunt destinate pentru a indexa (înregistra) documentele de pe Internet cuvânt cu cuvânt. Astfel, teoretic, aceste motoare de căutare vor ajunge să indexeze tot spaţiul Web şi deci ne putem da seama de volumul de date din baza de date al motorului. Atunci când un navigator transmite motorului o interogare – formată din unul sau mai multe cuvinte -, motorul caută aceste cuvinte în lista sa de indecşi (adică în baza sa de date) şi returnează o listă de adrese a documentelor susceptibile că ar conţine informaţia cerută.

Există o mulţime de motoare de căutare pe Internet, dar cele mai cunoscute sunt:

Altavista (www.av.com)

Google (www.google.com)

Excite (www.excite.com)

HotBot (www.hotbot.com)

Lycos (www.lycos.com)

Webcrawler (www.webcrawler.com)

Northern Light (www.northernlight.com)

Cel mai cunoscut (şi cel mai bun, după părerea multora) motor de căutare este Google. Acesta indexează, pe lângă paginile Web normale şi fişiere PDF (formate cu Adobe Acrobat Reader) şi chiar imagini.

Primele 2 motoare de căutare sunt cele mai apreciate din punct de vedere al rezultatelor obţinute. Rezultatele sunt relevante şi actualizate, deoarece spider – ele lor explorează Reţeaua cel puţin odată pe lună şi indexează site-urile noi apărute. Altavista oferă posibilitatea de căutare în 25 limbi (alegerea opţiunii se face din pagina gazdă), iar Google dispune de interfeţe pentru câteva zeci de limbi, inclusiv română, care poate fi conectată din pagina principală. Google poate limita căutările la documente redactate doar în limba pe care utilizatorul o indică. Chiar şi atunci când se caută informaţii redactate în altă limbă decât engleză, este recomandabil de utilizat aceste motoare, deoarece sunt superioare ca performanţă motoarelor de căutare locale.

Un motor de căutare românesc performant este GoFind (www.gofind.ro). Pentru căutare în Web-ul francofon este recomandabil motorul Voila (www.voila.fr). Cele mai utilizate motoare de căutare realizate în R. Moldova sunt www.moldova.cc şi www.ournet.md

Directoarele sau cataloagele funcţionează după un principiu diferit faţă de motoarele de căutare. Un director Web este o colecţie de link- uri, însoţite de anumite explicaţii şi împărţite în anumite categorii / subcategorii. De cele mai multe ori directoarele sunt alcătuite manual. Aceasta însemnă că site - urile sunt verificate de către o anumită persoană, după care sunt înscrise într-o categorie sau alta, conform unor criterii stabilite (schemă de clasificare, numită taxonomie).

De aceea, informaţiile din directoarele Web sunt mai puţin voluminoase, dar mult mai valoroase. Majoritatea directoarelor oferă şi posibilitatea de căutare direct în baza lor de date (a nu se confunda cu baza de date al adevăratelor motoare de căutare).

Directoarele pe Internet se împart în două categorii: directoare generale (sau orizontale) şi directoare specializate (sau verticale). Cel mai popular director general este Yahoo (www.yahoo.com). Alte directoare generale care merită menţionate sunt:

About (www.about.com),

Looksmart (www.looksmart.com),

Dmoz (www.dmoz.org).

Pe Web-ul românesc directoarele cele mai populare sunt: Kappa (www.kappa.ro), Acasă (www.acasa.ro), Edison (www.edison.ro), Trafic (www.trafic.ro).

O listă cu 2600 directoare specializate, organizate pe 39 categorii, puteţi găsi la:

GoGettem (www.gegettem.com sau www.gogettem.com).

Un director cunoscut în R. Moldova este www.ournet.md

Folosirea directoarelor este utilă atunci când informaţia căutată se încadrează într-o categorie clară, bine delimitată. Căutarea într-un director se poate face în două moduri:

• Mergând direct la categoria în care se găseşte informaţia, dacă o cunoaştem, sau

• Folosind cuvinte – cheie, la fel ca în cazul motoarelor de căutare. Directorul ne va returna categoriile de bază unde putem găsi documente ce conţin cuvintele cerute.

Graniţa dintre motoarele de căutare şi directoare începe să se şteargă odată ce motoarele de căutare îşi organizează propriile directoare (exemple Altavista şi Google). Acestea au de obicei două opţiuni: căutare pe Web sau în director.

Calitatea rezultatelor pe care ni le furnizează un motor de căutare depinde în mod hotărâtor de calitatea interogării utilizate. Interogările bine formulate pot da rezultate excelente, în timp ce cele formulate anapoda vor returna liste interminabile de rezultate, care conţin în mare parte documente irelevante. Iată câteva sfaturi pentru a crea interogări eficiente.

1. Este necesar de definit cât mai exact tipul informaţiilor de care aveţi nevoie. Dacă informaţia pe care o căutaţi se referă la un domeniu vast de cercetare, atunci împărţiţi domeniul în subdomenii mai mici şi căutaţi informaţiile pentru fiecare în parte. Pentru căutarea informaţiilor despre piaţa produselor auto din R. Moldova am putea diviza problema în mai multe după careva categorii care ţin de priorităţile noastre (căutare după model, după distribuitor, după preţ, etc.).

2. Alcătuiţi o listă cu cuvinte cheie care vă pot ajuta să găsiţi informaţia necesară. Cu cât lista este mai lungă, cu atât este mai bine. Formaţi cu cuvintele cheie fraze care definesc univoc informaţia căutată. Eliminaţi din căutări cuvintele cheie cu mai multe înţelesuri. De exemplu, dacă vom utiliza pentru interogare cuvântul „piaţa”, rezultatele primite se vor referi atât la Piaţa Centrală din Chişinău, cât şi la piaţa produselor alimentare, de uz casnic, etc. În opinia specialiştilor, cele mai eficiente cuvinte cheie sunt substantivele, urmate de verbe. Adjectivele şi adverbele sunt mai puţin utile. Prepoziţiile şi conjuncţiile sunt ignorate de către motoarele de căutare.

Observații:

Este util pentru cursurile de sisteme informationale in management

Download gratuit

Documentul este oferit gratuit,
trebuie doar să te autentifici in contul tău.

Structură de fișiere:
  • Localizarea Informatiei in Internet.doc
Alte informații:
Tipuri fișiere:
doc
Nota:
8/10 (1 voturi)
Nr fișiere:
1 fisier
Pagini (total):
16 pagini
Imagini extrase:
16 imagini
Nr cuvinte:
8 624 cuvinte
Nr caractere:
43 630 caractere
Marime:
95.46KB (arhivat)
Publicat de:
NNT 1 P.
Nivel studiu:
Facultate
Tip document:
Laborator
Domeniu:
Management
Predat:
la facultate
Materie:
Management
Profesorului:
Toaca Lilia
Sus!