Informacje ogólne

Deep Web (Ukryta Sieć, Ukryty Internet, Głęboka Sieć, Invisible Web, dark matter) – w technicznym ujęciu zagadnienia obejmuje zasoby, które zostały wykluczone z zasięgu wyszukiwarek i katalogów, a co za tym idzie – są niewidoczne w wynikach wyszukiwania uniwersalnych serwisów, takich jak Google. Ta część cyberprzestrzeni jest uważana za „niewidzialną”, gdyż bardzo trudno jest ją odszukać bez znajomości dokładnego adresu internetowego, bądź narzędzi, przy pomocy których zlokalizowanie ukrytych danych jest możliwe.

Deep Web zawiera wiele bogatych i cennych źródeł, które nie są możliwe do znalezienia przez uniwersalne wyszukiwarki. Do takich źródeł zalicza się: informacje rządowe, artykuły z czasopism, „białe księgi”, specjalne kolekcje materiałów, blogi, strony typu wiki, media społecznościowe itp. Zestawienia wyników wyszukiwania są oddzielnie tworzone dla każdej wyszukiwarki, gdyż w każdej z nich szperacze mają inny zasięg działania, więc zupełnie różne strony mogą podlegać indeksowaniu.

Ukryty Internet jest ogromnym zbiorem informacji, trudno jednak uzyskać zgodność, co do jego faktycznych rozmiarów. Według rankingu opublikowanego w 2011 roku na blogu The deep web: semantic search takes innovation to new depths, Deep Web obejmuje aż 96% zawartości Internetu.


Do głównych rodzajów zasobów Głębokiej Sieci zalicza się:
1. Bazy publikacji – bazy składające się z bieżących i archiwalnych artykułów.
2. Biblioteki – w pełni przeszukiwalne kolekcje biblioteczne, za których tworzenie odpowiedzialne są głównie biblioteki akademickie.
3. Dokumenty o nietypowych formatach.
4. Kalkulatory online – nie są to typowe bazy danych, ale wiele z nich zawiera dane wewnętrzne wykorzystywane do obliczeń, np. translatory, kalkulatory kredytów, słowniki.
5. Oferty pracy.
6. Ogłoszenia.
7. Ogólne bazy danych – bazy przystosowane do internetowego przeszukiwania informacji.
8. Portale – bardzo rozbudowane witryny, składające się z więcej niż jednej wymienionej tu kategorii.
9. Serwisy newsowe i czaty.
10. Strony widoczne dla wyszukiwarki, jednak znajdujące się na odległych miejscach w wynikach wyszukiwania.
11. Strony, których autorzy zabronili indeksacji.
12. Tematyczne bazy danych – zbiory ukierunkowane na gromadzenie informacji na jeden, konkretny temat, np. bazy patentowe, medyczne bazy danych, itp.
13. Wyszukiwarki wewnętrzne – bazy danych tworzone dla dynamicznie tworzonych, dużych witryn, np. bazy danych bieżących i archiwalnych artykułów.
14. Yellow/White Pages – informacja teleadresowa do użytku osobistego i biznesowego.
15. Zakupy i aukcje – serwisy te, to ogromne i przeszukiwalne bazy danych

Academic Invisible Web (AIW) – naukowa część Ukrytego Internetu, która zawiera miliardy dokumentów elektronicznych najróżniejszego typu. Pod względem potrzeb informacyjnych, najważniejszym elementem Academic Invisible Web są bazy danych, czyli elektroniczne zbiory danych tworzonych zgodnie z określonymi regułami (mogą być bibliograficzne, abstraktowe, faktograficzne, jak i pełnotekstowe) oraz różnego rodzaju kolekcje wirtualne. Warto również zauważyć, że aby dostać się do zasobów AIW niejednokrotnie wymagana jest rejestracja, bądź wypełnienie formularza wyszukiwawczego, czego nie są w stanie zrobić szperacze, dlatego znaczna część AIW nie podlega indeksacji.

Kategorie AIW:

- dane
- literatura (książki, raporty, artykuły, rozprawy naukowe)
- treści wyłącznie pochodzenia sieciowego (Open Access)

Dostawcy Academic Invisible Web:
- biblioteki
- sprzedawcy baz danych
- repozytoria Open Access
- wydawcy dostarczający informację pełnotekstową oraz inne zbiory danych należące do stowarzyszeń i korporacji
    Blogger Comment