Archiwum

2007 +

  • Wrzesień
  • Październik
  • Listopad
  • Grudzień

2008 +

  • Styczeń
  • Luty
  • Marzec
  • Kwiecień
  • Maj
  • Czerwiec
  • Lipiec
  • Sierpień
  • Wrzesień
  • Październik
  • Listopad
  • Grudzień

2009 +

  • Styczeń
  • Luty
  • Marzec
  • Kwiecień
  • Maj
  • Czerwiec
  • Lipiec
  • Sierpień
  • Wrzesień
  • Listopad
  • Grudzień

2010 +

  • Styczeń
  • Luty
  • Marzec
  • Kwiecień
  • Maj
  • Czerwiec
  • Lipiec
  • Sierpień
  • Wrzesień

Tagi

polityka

religia

społeczeństwo

akcje

Linux

Prawo

Państwo

Informatyka

recenzja

programowanie

Polska

Internet

Szkoła

blog

ZaDiS

reformy

Kościół Rzymskokatolicki

książki

Moje pomysły

święta

AboutBlogProjekty & PomysłyRegulaminRSS
31 Stycznia 2010, 10:34

Roboty internetowe

Tagi: google, wyszukiwarki, Moje pomysły, roboty_internetowe, roboty_indeksujące, transfer, indeksy,
Kategoria: Reszta

Roboty internetowe zwane także robotami indeksującymi to programy zbierające i przetwarzające informacje o stronach internetowych umieszczonych w indeksach wyszukiwarek lub różnych agregatorów. Popularne strony muszą się liczyć z tym, że takie roboty pożrą dużą część transferu. Poruszył tą tematykę na swoim Piotr Waglowski: Mam się cieszyć, czy martwić?.

Zgadzam się z nim, że nie ma tu dużego wyboru, przecież nie poblokuje wszystkich robotów, można porównać jego (i nie tylko) sytuację do związku między USA a Chinami (USA chciałyby się pozbyć się Chin, ale wtedy gospodarka USA by się załamała). Wydaje się, że problem jest nie do rozwiązania, lecz… wystarczyłoby zaimplementowanie pewnego rozwiązania przez roboty i strony. Webmaster umieszcza na stronie pliczek UPDATED.php (rozszerzenie jest nieważne), który generuje treść XML o określonej strukturze, w której byłyby zawarte informacje, kiedy jaka podstrona została zakutalizowana. Oczywiście mądry webmaster nie umieszczał by tam informacji, że należy ponownie zindeksować wszystkie podstrony, bo plik ze stylem CSS został zaktualizowany. Myślę, że rozwiązanie jest godne poświęcenia uwagi.

Cytat z DI - Polskie Google już szuka w czasie rzeczywistym: Google rozważa w przyszłości rozszerzenie funkcji wyszukiwania w czasie rzeczywistym dzięki protokołowi PubSubHubbub (PuSH). Niewykluczone, że wszyscy dostawcy treści będą mogli po prostu informować Google o nowych treściach, a wyszukiwarka natychmiast je zindeksuje. Więcej informacji na ten temat można znaleźć w innym tekście na łamach DI.

Jeśli spodobał ci się wpis, zasubkrybuje kanał RSS

Poleć znajomym |
«Udev - problem z konfiguracją
52 książki»
Podobne wpisy
  • Dwór - gra karciana mojego pomysłu
  • Wikia Search
  • Korporacje
  • Urodziny na odwrót
  • Prywatny Numer Identyfikacyjny(PNI)



1 komentarz»

Sławomir Domagała napisał 8 Lutego 2010 o 09:18

Eeeh... artykuł jest już tak długo, a nikt go nie skomentował?
A Ty jaką masz opinię, o tym co napisałem?

Roznica trzy i osiem
Nick
Email (będzie ukryty)
Webpage

© Godlark 2007 - 2010 | Usługi hostingowe zapewnia