Google zorgt voor wat problemen...
26 februari 2004 - 23:16   
geplaatst door: Leon
[news]Google, mijn favoriete search engine, gaat wel erg te keer zeg. Eens per 5 a 10 seconden indexeert Google de GEHELE site. Handig, want dan dan is Google altijd up-to-date. Minder handig is dat van de 100GB aan traffic (zo bleek uit m'n logfiles) Google ongeveer verantwoordelijk is voor maarliefst 7GB. Naast de extra traffic die het maandelijks genereert zorgt het ook voor een overdreven hoge load op de server. Ik heb die lui al een e-mail gestuurd met het verzoek MacFreak slechts een maal per dag te indexeren. Meer dan genoeg IMHO. Ondertussen heb ik middels een robots.txt file in m'n www-root er voor gezorgd dat zoekmachines niet langer de site kunnen indexeren.

Na wat zoeken blijkt dat Google zelfs hele sites plat gooit door behoorlijk agressief te indexeren. Vele webmasters weren Google inmiddels van hun site.

Probeer je dus te via Google iets te zoeken op MacFreak, dan krijg je dus niet de laatste informatie te zien. [/news]

Google zorgt voor wat problemen...
27 februari 2004 - 13:33    reactie #1
geplaatst door: TLM
Gewoon uit interesse Leon, wat gebruik je om de logbestanden te bekijken. 'k vermoed niet dat je zelf de 'raw' logbestanden bekijkt en een optelsommetje maakt :smile:

Wel interessant om te onthouden dat Google dus blijkbaar nogal wat trafiek kan genereren. Als ik ooit m'n database op een site gooi zal ik daar zeker rekening mee moeten houden ... als ik het me dan uberhaupt nog kan herinneren :crazy:

TLM

(Bewerkt door TLM om 13:35, 27-02-2004)

Google zorgt voor wat problemen...
27 februari 2004 - 15:57    reactie #2
geplaatst door: Pako
He Leon, leuk weetje!
Google zorgt voor wat problemen...
27 februari 2004 - 16:39    reactie #3
geplaatst door: Leon
@TLM; ik heb een log analyzer die ik zelf in Perl geschreven heb, naast m'n gewone statistieken programma Webalizer.
Google zorgt voor wat problemen...
27 februari 2004 - 17:09    reactie #4
geplaatst door: ab
|
|     Goed om te weten .
|     Dankjewel !
Google zorgt voor wat problemen...
27 februari 2004 - 19:31    reactie #5
geplaatst door: Leon

Hier, ik liet Google even toe tot de site... moet je eens zien wat er gebeurde...

Google zorgt voor wat problemen...
27 februari 2004 - 19:41    reactie #6
geplaatst door: TLM
Wow dat is niet normaal meer :crazy: Tja dan zit er niets anders op dan ze te weren met een robots.txt bestand natuurlijk.

Ik gebruikte vroeger (op m'n ter ziele gegane site) altijd Analog, maar 'k heb de indruk dat dit programma al door velen voorbijgestoken is.

TLM

Google zorgt voor wat problemen...
27 februari 2004 - 19:44    reactie #7
geplaatst door: Pako
Het lijkt me logisch dat een zoekmachine zijn info ergens vandaan moet halen om een adequate zoekmachine te kunnen zijn. Het is natuurlijk niet voor niets dat Google een van de beste is.

Of dat 24/7 moet is inderdaad een heel ander verhaal.

Maar is dat niet meer een probleem voor Site-moderators cq eigenaars dan voor mij als 'toevallige' bezoeker?

Google zorgt voor wat problemen...
27 februari 2004 - 20:07    reactie #8
geplaatst door: Leon
[news]Natuurlijk moet een zoekmachine z'n informatie ergens vandaan halen. Maar of dat op zo'n "intrusive" manier moet vraag ik mij af. Er zijn veel vriendelijkere methodes, en iedere 5 tot 10 seconden is echt pure overkill. Ik ben dan ook van mening dat ze bij Google daar de mensen die zich aanmelden op hun engine voor dienen te waarschuwen, en in ieder geval de mogelijkheid moeten geven om zelf te bepalen wanneer die indexering plaats vindt.

En het is niet alleen een probleem van site beheerders... Ook jij als "toevallige" bezoeker zal hier last van ondervinden omdat Google gewoon (zie image) een enorme load veroorzaakt op de server. Dit komt de performance van je site niet ten goede. [/news]

Google zorgt voor wat problemen...
27 februari 2004 - 20:42    reactie #9
geplaatst door: Eiji
heb je eraan gedacht dat het eventueel aan jouw safari zou kunnen liggen, dat die kapot is? Dit is niet de eerste keer dat je een probleem met jouw safari op het forum zet. Is maar een idee en waarschijnlijk zal het niet kloppen, maar de kans is er
Gezocht: powermac G4 800mhz of meer
[MF] Eiji -> www.macfreakclan.cjb.net
Google zorgt voor wat problemen...
3 maart 2004 - 00:00    reactie #10
geplaatst door: Dries Van Giel
sorry Eiji, maar dat heeft er in de verste verte niets mee te maken hoor...
an apple a day keeps the doctor away...
Google zorgt voor wat problemen...
3 maart 2004 - 00:36    reactie #11
geplaatst door: Leon

Citaat
Eiji om 20:42, 27-02-2004
heb je eraan gedacht dat het eventueel aan jouw safari zou kunnen liggen, dat die kapot is? Dit is niet de eerste keer dat je een probleem met jouw safari op het forum zet. Is maar een idee en waarschijnlijk zal het niet kloppen, maar de kans is er

[news]Onzin in zijn meest pure vorm. A) Safari staat hier helemaal los van en B) de problemen die ik meld m.b.t. Safari zijn algemeen bekende problemen de zelfs de developer van Safari bevestigd. Lijkt mij een klare zaak dacht ik zo... Ik ben niet iemand die zomaar begint te brullen zonder alle mogelijke opties op voorhand te hebben onderzocht.

Ik heb sinds Google niet meer toegelaten wordt op de site een reductie waargenomen in de load op de server van tussen de 20 en 30%. Dit geeft naast de getoonde grafiek en de entries in m'n logfiles al aan dat Google een behoorlijke impact heeft op een site, wat ik ook eerst onderzocht heb alvorens hierover te beginnen. Ik ben nu eenmaal dol op feiten. Overigens heb ik net een mailwisseling met de engineers van Google achter de rug, en die bevestigen het probleem en ik zou niet de eerste zijn die hierover geklaagd heeft. MacFreak zal nu slechts een maal per dag geïndexeerd worden. Het probleem is dus bij de bron aangepakt, en daarmee is het probleem ook keurig opgelost.[/news]

Google zorgt voor wat problemen...
3 maart 2004 - 08:28    reactie #12
geplaatst door: Dries Van Giel
ik kan onmogelijk snappen welke zin het heeft een site om de 5-10 sec te scannen. Om het uur of om de 2-3 uur lijkt me al veel, maar ééns per minuut of zo vind ik helemaal te zot.
Ik denk dat 1x per dag ook wel zal volstaan om een recent beeld te hebben van de inhoud van de site.
an apple a day keeps the doctor away...
Google zorgt voor wat problemen...
3 maart 2004 - 10:33    reactie #13
geplaatst door: Thomas
Wat mij dwarszit is hoeveel bandbreedte google dan wel niet ter beschikking moet hebben- en hoeveel server capaciteit - als ze bij elke site ter grootte van macfreak op deze manier te werk gaan. Of is het het weinig voorkomend probleem waar sclechts een paar sites last van hebben? En als het maar een paar sites zijn, waarin zit dan het verschil? Ik zou hierover wel eens een verklaring van google willen zien...

Thomas

Wat ik hier uitkraam is puur mijn persoonlijke mening.
Google zorgt voor wat problemen...
3 maart 2004 - 11:28    reactie #14
geplaatst door: Leon
Zoek maar even op Google, info genoeg (inclusief verklaringen)  ;)