Neviditelný web

Neviditelný web (často označovaný jako „invisible web“ nebo „deep web“) obsahuje dokumenty, které jsou obtížně vyhledatelné. Opakem je viditelný web (též „visible web“ nebo „surface web“), který označuje běžně dostupné stránky. Přesnou velikost viditelného a neviditelného webu nelze určit. Odhaduje se, že neviditelný web je až 550× větší než web viditelný.

Důvody neviditelnosti

  • odpojené stránky — robot nemůže sledovat spojení na stránku
  • stránka obsahuje hlavně obrázky, video, audio — nedostatek textu, aby robot porozuměl obsahu
  • stránka obsahuje hlavně soubory pdf, postscript, flash apod. — stránka se většinou neindexuje z ekonomických důvodů
  • obsah v relačních databázích — roboty nedokážou vyplnit požadovaná pole v interaktivních formulářích
  • obsah se mění v reálném čase — obrovské množství dat, které se neustále mění
  • dynamicky vytvářený obsah — personalizovaný obsah není zajímavý pro většinu uživatelů
  • soukromé weby a placený či heslem zabezpečený přístup

Vyhledávače pro neviditelný web

Google Scholar — rozhraní pro vyhledávání odborných zdrojů (recenzované články, disertační a diplomové práce, patenty, knihy, abstrakty, články), u řady zdrojů je možný přístup k plnému textu. Využít lze také rozhraní Google Patents pro vyhledávání patentů.

Back to: Vyhledávání na internetu ve volně dostupných zdrojích > Vyhledávání na internetu