Poradnik - Kop głębiej! - Google to nie wszystko 08-2005.pdf

(577 KB) Pobierz
M-poradnik1.indd
NA CD NEWSY Z OKŁADKI FIRMA MAGAZYN PROGRAMY WARSZTAT
poradnik
Kop głębiej!
Google to nie wszystko
Wyszukiwarki globalne, konwencjonalne, czyli po prostu
takie jak Google, znajdują wszystko. Taka panuje opinia.
I rzeczywiście znajdują coraz więcej. Z jednej strony użyt-
kownik gubi się w morzu wyników, z drugiej – szczególnie
gdy wpisze specjalistyczne hasło – wyszukiwarka nic
nie znajduje. Czy to oznacza, że tego nie ma w internecie?
Prawdopodobnie jest,
tylko dobrze schowane.
Dorota Szumilas
Mroki internetu
Zasoby internetu, które są trudno dostępne dla
konwencjonalnych wyszukiwarek, zwykło się
określać „Invisible Net”, „Invisible Web” (nie-
widoczna sieć) lub „Deep Web” (głęboka sieć).
Ostatnie określenie jest wymyślone i promo-
wane przez Bright Planet. Specjaliści z tej fir-
nie brzmiących, jak dla zwykłego śmier-
telnika, rzeczy z dziedziny mikrobiolo-
gii. Otworzyła stronę wyszukiwarki, wpisała
słowa, które powinny się znaleźć w dokumen-
tach. Wyszukiwarka nic nie znalazła. Nawet
linki sponsorowane były ubogie i zupełnie
nie na temat. Trzeba było zmienić taktykę po-
szukiwania, by dostać się do zasobów inter-
netu położonych nieco głębiej, niedostępnych
dla wyszukiwarek, ale jak najbardziej dostęp-
nych dla ludzi. Trzeba było tylko je znaleźć.
I udało się.
Strona Bright Planet
(http://www.brightplanet.com)
CompletePlanet
(http://www.completeplanet.com) –
w polu tekstowym „Find databases relevant to:”
wpisz słowa, które powinny się znaleźć
w szukanym dokumencie
60
INTERNET.sierpień.2005
K iedyś moja siostra szukała dosyć dziw-
27419355.039.png 27419355.040.png 27419355.041.png 27419355.042.png 27419355.001.png 27419355.002.png 27419355.003.png 27419355.004.png 27419355.005.png 27419355.006.png
WARSZTAT
PROGRAMY
MAGAZYN
FIRMA
Z OKŁADKI
NEWSY
NA CD
poradnik
Wyszukiwanie przez SearchEdu.com (http://www.searchedu.com)
Możliwości wyszukiwania ProFusion (http://www.profusion.com)
my twierdzą, że najlepiej oddaje istotę rzeczy.
Owe zasoby są wszak dostępne i widoczne, tyl-
ko trzeba wiedzieć, jak do nich dotrzeć. Są po
prostu głębiej schowane.
Natomiast określenia „Invisible Web” użył
po raz pierwszy dr Jill Ellsworth w 1994 r.
Określił w ten sposób zasoby nieindeksowa-
ne przez globalne wyszukiwarki.
Wyszukiwarka naukowa Scirus (http://www.scirus.com)
Bright Planet
i Copernic Agent
Wyszukiwarka Turbo10 (http://turbo10.com)
Bright Planet (http://www.brightplanet.com)
– firma,którazajmujesięzagadnieniem„Deep
Web”, szacuje, że zasoby głębokiego internetu
są 500 razy większe od tego widocznego
z poziomu konwencjonalnych wyszukiwarek.
Firma oferuje narzędzie do przeszukiwania
zasobów głębokiego internetu – Deep Query
Manager (DQM).
Co to jest „Deep Web”?
Określenia typu głęboka sieć, głęboki czy też
niewidzialny internet brzmią być może tajem-
niczo, ale żadnej tajemnicy nie kryją. I praw-
dopodobnie nieraz już z owego głębokiego in-
ternetu korzystałeś. Bardzo prosty przykład:
gdy chcesz znaleźć pociąg z Piły do Suwałk,
co wpisujesz do wyszukiwarki? Nie piszesz
słów: Piła, Suwałki, pociąg, a od razu szu-
kasz rozkładu jazdy PKP, czyli strony PKP,
bo należy przypuszczać, że stamtąd będzie
dostęp do rozkładu jazdy pociągów. Intuicyj-
nie wiesz, co robić. I oczywiście taki rozkład
znajduje się na stronie PKP. Żeby znaleźć po-
łączenie Piła – Suwałki, musisz w odpowied-
nie pola wpisać dane i kliknąć przycisk Szu-
kanie połączeń. Po chwili zostaną wyświetlo-
ne szukane połączenia.
Inny przykład. Chcesz stworzyć drzewo
genealogiczne swojej rodziny. Wyszukiwanie
po nazwisku w wyszukiwarce konwencjonal-
nej może okazać się bezowocne. Lepiej zacząć
od baz danych serwisów genealogicznych, re-
jestrów pasażerów statków z emigrantami itd.
Tego konwencjonalna wyszukiwarka nie znaj-
dzie. Takie informacje są ukryte głębiej.
Bazy danych
Zasoby głębokiego internetu to głównie bazy
danych, z których możesz skorzystać, jeśli
wiesz, gdzie one się znajdują. Wyszukiwarki
pomijają wiadomości w nich zawarte, ponie-
waż do takich zasobów można się dostać do-
piero po wpisaniu konkretnego zapytania.
Na pewno wiesz, jak wygląda indeksowa-
nie adresów stron przez wyszukiwarki. Wy-
obraź sobie, że robot wchodzi na stronę, na
której znajduje się baza danych, nie ma na-
tomiast odnośników. Robot zapamięta adres
główny, ale nie poinformuje, że na tej stronie,
którą właśnie odwiedził, jest mnóstwo przy-
datnych informacji. Tam jest cenna baza da-
nych, tylko robot jej przecież nie używa, trze-
ba bowiem w odpowiednich polach wpisać to,
czego się szuka, by uzyskać informacje. Cza-
sem, by skorzystać z pewnych zasobów, trze-
Program Copernic Agent (wersja płatna), do
pobrania ze strony http://www.copernic.com,
również oferuje przeszukiwanie zasobów
schowanej części internetu. Natomiast za
pomocą wersji darmowej można przeszukać
np. bazę danych użytkowników ICQ – to też
należy do tzw. głębokiego internetu.
INTERNET.sierpień.2005
61
27419355.007.png 27419355.008.png 27419355.009.png 27419355.010.png 27419355.011.png 27419355.012.png 27419355.013.png 27419355.014.png 27419355.015.png 27419355.016.png 27419355.017.png 27419355.018.png 27419355.019.png
 
NA CD NEWSY Z OKŁADKI FIRMA MAGAZYN PROGRAMY WARSZTAT
poradnik
nie takich baz to praca żmudna, mało efektow-
na, niewdzięczna, choć niezmiernie przydat-
na, bo z tej pracy każdego dnia korzystają ty-
siące osób. I może się okazać, że aby dotrzeć
do owej głębokiej warstwy internetu, i tak naj-
pierw musisz użyć konwencjonalnej wyszuki-
warki, aby w ogóle owe bazy danych znaleźć.
Nie wszystkie zasoby ukryte w bazach danych
są udostępniane bezpłatnie.
Katalog stron głębokiego internetu i możli-
wości przeszukiwania go znajdziesz na stronie
CompletePlanet ( http://www.completeplanet.com ). Ze-
brano tam ponad 70 tys. odnośników. Katalog
ułożony jest tematycznie. Możesz od razu wy-
brać dziedzinę, która cię interesuje.
Dobierz wyszukiwarkę
Innym sposobem, by dotrzeć do tego, co głę-
biej, jest wybór wyszukiwarki – czy to specja-
Potężna baza artykułów
(http://www.findarticles.com)
Library Spot (http://www.libraryspot.com)
– imponująca kolekcja przydatnych odsyłaczy
ba się zarejestrować i dopiero po zalogowaniu
można z nich korzystać. Ta część również bę-
dzie niewidoczna dla wyszukiwarek.
Wśród stron indeksowanych przez wyszu-
kiwarki znajdą się też strony amatorskie i nie-
aktualizowane. Bazy danych głębokiego inter-
netu są zazwyczaj pod kontrolą. Są sprawdzane
przez specjalistów i uzupełniane. Takie, któ-
rym można zaufać. Warto ich poszukać i do
nich sięgać, gdy potrzebujesz materiałów na
sprecyzowany temat.
Co oprócz baz danych znajdzie się w głę-
bokiej strefie internetu, do której wyszuki-
warkom trudno sięgnąć? Strony, których za-
wartość się zmienia niemal co dnia, np. wia-
domości, pogoda, ogłoszenia, notowania gieł-
dowe, a także archiwa, słowniki, książki tele-
foniczne itp.
Gdzie szukać?
Przeszukaj w internecie, co kryją ośrodki aka-
demickie, biblioteki, archiwa, stowarzyszenia
naukowe. Tutaj niestety lepiej przedstawiają
się ośrodki zagraniczne niż polskie. Stworze-
62
INTERNET.sierpień.2005
27419355.020.png 27419355.021.png 27419355.022.png 27419355.023.png 27419355.024.png 27419355.025.png 27419355.026.png 27419355.027.png 27419355.028.png 27419355.029.png
WARSZTAT
PROGRAMY
MAGAZYN
FIRMA
Z OKŁADKI
NEWSY
NA CD
poradnik
listycznej, czy np. regionalnej. To, czego kon-
wencjonalna wyszukiwarka nie znajdzie (albo
nie pokaże w pierwszej kolejności), może od-
naleźć od razu odpowiednia wyszukiwarka
specjalistyczna.
Wyszukiwarką, która przeszukuje głęboką
sieć, jest ProFusion ( http://www.profusion.com ). Zo-
stała utworzona w 1995 roku na Uniwersyte-
cie Kansas. Wyszukiwarka Turbo10 ( http://turbo-
Nie tylko Google...
Strony, na których znajdują się łącza do różnych wyszukiwarek:
Beaucoup – http://www.beaucoup.com – łącza do ponad 2500 baz danych i katalogów
SearchBug – http://www.searchbug.com – ponad 500 wyszukiwarek w 15 kategoriach
Freeality Internet Search – http://www.freeality.com – przewodnik po wyszukiwarkach
Search Engine Guide – http://www.searchengineguide.com – ponad 1000 wyszukiwarek
w 25 kategoriach
Informacje o wyszukiwarkach:
http://www.pandia.com
http://searchenginewatch.com
http://www.searchengineguide.com
http://www.searchengines.pl
10.com ) również chwali się, że potrafizaglądać
do głębokich warstw internetu.
Ponad 20 milionów zindeksowanych stron
ma wyszukiwarka na stronie http://www.searche-
du.com . Na stronie odnośnik m.in. do słowni-
ków http://www.yourdictionary.com – słowniki w po-
nad 280 językach.
Wyszukiwarkę artykułów dotyczących in-
formatyki znajdziesz np. na stronie http://search.
internet.com , a cenioną wyszukiwarkę stron i tek-
stów naukowych, która ma zindeksowanych
ponad 200 milionów odnośników, na stronie
http://www.scirus.com .
Jeśli szukasz pliku w formacie PDF, wy-
korzystaj wyszukiwarkę na stronie http://se-
archpdf.adobe.com .
Czasem lepiej odnaleźć regionalną wyszu-
kiwarkę danego kraju i za jej pomocą szukać
informacji. Łącza do wyszukiwarek z różnych
krajów świata znajdziesz na stronie http://www.
searchenginecolossus.com .
Projekt Humbul (http://www.humbul.ac.uk)
Rezygnować z Google?
Oczywiście, że nie. Wyszukiwarki takie jak
Google są bardzo dobre. Mają miliony zin-
deksowanych stron. Ale która z tych stron
będzie rzeczywiście wartościowa dla cie-
bie? Otworzysz po kolei tysiąc lub więcej
stron? Jeśli potrzebna ci krótka informacja
na jakiś temat, to pewnie wystarczy. A jeśli
nie, to warto poszukać głębiej, by mieć pod
ręką inne źródła informacji, przede wszyst-
kim wtedy, gdy szukasz szczegółowej in-
formacji, czy to związanej z pracą, szkołą,
czy też z hobby.
Czy określenia „głęboki”, „niewidoczny”
internet mają jeszcze sens? Wszak i wyszu-
kiwarki są coraz sprytniejsze, i ludzie po-
trafią efektywniej korzystać z internetu.
Wielu z nich intuicyjnie korzysta z owych
baz danych głębokiego internetu i pewnie
do głowy im nie przyjdzie, że korzystają
z czegoś „ukrytego”. A i głęboki internet
coraz częściej wypływa na powierzchnię za
sprawą ulepszanych wyszukiwarek global-
nych. Czy zostanie całkowicie odsłonięty?
Czy może wtedy przyjdzie czas na odsła-
nianie jeszcze głębszego internetu? Ile lalek
w tej Matrioszce?
Zasoby głębokiego internetu
http://www.freepint.com/gary/direct.htm – strona Gary’ego Price’a i jego imponująca kolekcja
http://www.libraryspot.com – odnośniki do ponad 2500 bibliotek na świecie
http://www.thebighub.com – odnośniki do baz danych w ponad 300 kategoriach
http://infomine.ucr.edu – wyszukiwarka dla studentów i nauczycieli
http://www.infoplease.com – wyszukiwanie w kilkunastu kategoriach
http://oaister.umdl.umich.edu/o/oaister – OAIster to dzieło The Digital Library Production Service
Uniwersytetu Michigan. Skatalogowali ponad pięć milionów zasobów z ponad 450 instytucji
http://lii.org – Librarians’ Index to the Internet – przejrzane i wybrane źródła
http://www.humbul.ac.uk/help/subjects.html – projekt Humbul dla studentów, nauczycieli
i badaczy w UK
http://deepwebresearch.blogspot.com – Marcus P. Zillman podaje mnóstwo odnośników
dotyczących „Deep Web”
http://www.invisible-web.net – The Invisible Web Directory – wskazuje, gdzie kryją się
ciekawe bazy danych. Katalog powstał jako dopełnienie książki o głębokich zasobach internetu,
zatytułowanej „The Invisible Web”, a napisanej przez Chrisa Shermana i Gary’ego Price’a
http://www.findarticles.com–bazaponad5milionówartykułów
http://magportal.com – artykuły z ponad 200 gazet
http://highwire.stanford.edu – archiwum tekstów naukowych
http://bubl.ac.uk – katalog zasobów internetowych przydatny dla studentów i badaczy
INTERNET.sierpień.2005
63
27419355.030.png 27419355.031.png 27419355.032.png 27419355.033.png 27419355.034.png 27419355.035.png 27419355.036.png 27419355.037.png 27419355.038.png
Zgłoś jeśli naruszono regulamin