Traffic des Forums


Hawk-Eye

Linienrichter
Beiträge
2.085
Punkte
0
ne, das ist nicht die "ehre", die mich davon abhält...
Zu 100%: Deine Fähigkeit!

Sorry, aber jetzt kannst mich ja sperren lassen. Kannst auch selbst machen. Was im Netz zur Zeit abgeht, ist unvereinbar mit der Reaktionszeit der Verantwortlichen des Forums. Sag dazu mal was. SAG DAZU MAL WAS! REAKTIONSZEIT!!!
 

JamiLLX

Bankspieler
Beiträge
23.513
Punkte
113
Ich will das Forum nur vor Schaden bewahren. Dass das über deinen augenblicklichen Einkaufszettel hinausreicht, konnte ich deinen letzten Beiträgen schon entnehmen.

Schau mal hier


Ich sag jetzt nicht, dass du ein Idiot bist, aber etwas mehr Hintergrund würde dir sicherlich zu Gesicht stehen, bevor du dich festlegst.

ich merke nur dass du keine ahnung hast was ein crawler ist. noch dazu wundert es mich, dass du, der keinen einblick in die server logs hat, sagen kann dass der sportforen server davon in irgendeiner form betroffen ist

übrigens, hier noch was vom hersteller dieses super mega aggressiven und höchstgefährlichen crawlers: https://ahrefs.com/robot/
 

liberalmente

Moderator Non-Sports & Football
Teammitglied
Beiträge
37.417
Punkte
113
@ Hawk Eye

Beruhige dich mal wieder. Verstehe nicht, warum du hier so ausrastest. Warum wertest du versuche, dir zu helfen, gleich als Angriff? Ich habe das Gefühl, dass hier einige aneinander vorbeischreiben. :crazy:
 

akira1

Administrator
Beiträge
55
Punkte
0
der ahref-bot kommt im moment mit unglaublichen 2-4 requests pro minute reingesegelt. ich glaube, wir brauchen bald mehr server (!plural!). oder auch: von 952455 zugriffen im aktuellen access.log hat ahref ca 1579.

update:

googlebot: 13647
bingbot: 4148
ahrefbot: 1598
 
Zuletzt bearbeitet:

Sm0kE

The Magic Man
Beiträge
22.159
Punkte
113
Verdammt, den Thread hab ich ja jetzt erst gesehen. :jubel::laugh2::crazy:
 

Hawk-Eye

Linienrichter
Beiträge
2.085
Punkte
0
Zur Klarstellung

Hallo User

Warum dieser Thread so aus dem Ruder gelaufen ist, habe ich lange nicht verstanden. Auch ich habe sicher meinen Teil dazu beigetragen. Ich habe mich über einige Tage mit Postings zurück gehalten und immer wieder überlegt, was passiert sein könnte und mich auf die Palme trieb. Hier meine Sicht der Dinge.

Die Motivation

Jedes Forum verursacht Traffic und trägt oftmals nicht unerhebliche Kosten. Je weniger Werbung geschaltet wird, desto höher wird der Eigenanteil. Wenn ein Forum dann Opfer von Bots wird, ist das in meinen Augen ne ziemliche Sauerei, weil das hohen und überlüssigen Traffic verursachen kann und den Betreiber somit Geld kostet. Als die längeren Ladezeiten auftraten, schaute ich nach, wer online ist und fand neben den üblichen Crawlern auch die Suchmaschine AhrefsBot. Diese hat einen sehr schlechten Ruf bei Forenbetreibern:


Da mir das Fortum bereits nach kurzer Zeit ans Herz gewachsen ist, weil hier überdurchschnittlich hoher Inforamtionsgehalt gepostet wird, dachte ich mir, diesen Thread zu eröffnen und den Betreibern, Admins und/oder Moderatoren einen Hinweis auf eine potentielle Schadsoftware zu geben.

Der Thread

Seit gestern habe ich eine extreme Verlangsamung des Traffics bei Sportforen festgestellt. Heute konnte ich sehen, dass AhrefsBot Suchmaschine auf den Seiten rumstöbert. Diese "Suchmaschine" kommt aus der Ukraine, durchsucht die Seiten, stöbert nach Backlinks und verursacht einen gehörigen Traffic.

Schaut doch mal, ob das der Grund für die langsame Verbindung ist und stellt die Ursache bitte ab, so meine Vermutung richtig war.

Einen Tag später hatte dieser Thread über 800 Hits, aber keine Antwort auf meinen Hinweis. Daher hakte ich nochmals nach:

Es wird nicht besser. Dieses Forum ist die einzige Seite, die sich so langsam aufbaut. Feedback wäre nett ;)

bei mir läuft alles normal

Geissbocks Feedback zur Sache enthält die Info, dass es nicht zwangsläufig an den Servern von Sportforen liegen muss.

Müsste an deiner Verbindung liegen. Wenn ich zuhause bin, läuft bei mir alles normal. In meiner anderen Wohnung dauerts auch ewig.

Das Posting von Chef Koch bestätigt das. Mein Problem der Ladezeit konnte ich relativ schnell eliminieren. Siehe hier:

(...) Ich habe ein Tool installiert, welches einige Sachen blockt. Da das Forum auch Klicks benötigt, werde ich es nicht öffentlich rausposaunen. Die Mods und Mitarbeiter der Technik bekommen aber Auskunft, so sie Interesse haben (Bitte PN). Jetzt geht der Aufbau innerhalb weniger Sekunden (...)

Auf meine Warnung wurde aber bis hierhin nicht eingegangen. Dann kam das Posting von akira:

es hat sich auf dem server nichts geändert. ich kann auch keinen höheren load erkennen. oder ram-mangel. oder irgendeine andere sache, deren kenngrößen nicht im normalen liegen.

bzgl ahref-bot: keine traffic-änderungen etc auf dem server erkennbar. google-analytics sieht das auch so. das interne monitoring sieht das auch so.

von welcher ip gibt es denn die probleme? wenn es verbindungsprobleme zum server gibt: da sind ja meist mehr als nur 2 rechner beim datenaustausch involviert.

Das war wohl ein schlechter Einstieg. Meine aktuelle IP in ein öffentliches Forum zu posten wärte eine Einladung an andere Leute, meinen PC zu entern. Daher auch meine "noch" humorvolle Reaktion:

Du bist echt ein lustiger und dynamischer Geselle der Neuzeit. Ich bin nur ein alter Sack und ziemlich tüttelich. Meine IP? Schau hier... :D

Dann der heilige Spruch, den ich mir einrahmen lasse:

du weisst schon dass er der server admin ist?

Woher sollte ich das wissen? Wenn bei jedem Admin/Moderator steht, wie soll ich dann einen Server-Admin erkennen, der mir zum ersten Mal im Forum begegnet und keinerlei Hinweis in seinem Avatar hat? Und wenn er Server-Admin ist, wieso fragt er nach meiner IP? Er kann sie doch lesen. Ab hier fühlte ich mich veräppelt. Daher auch dieses Posting, noch immer bemüht, nicht allzu heftig zu werden:

Nein, das wusste ich nicht und wenn er sich nicht über die angebotenen internen Möglichkeiten und anderen Wegen für mich ein "Normalo" bleibt, werde ich auch nicht weiterhelfen. Zu viele Server sind abgekackt, weil jemand der "Oberguru" war.

Als Serveradmin sehe ich die IP jeden Users, wenn er sich einlogged. Da muss man nicht nachfragen. Hör mir also auf mit der "Ehrfurcht" vor weißen Kitteln. Die können vielleicht gut Quellcodes schreiben, haben aber offentsichtlich ein Defizit, was den menschlichen Umgang und "normale" Kommunikation betrifft.

God serve the Queen! :D

Dann wieder diese Replik:

ja, wenn halt keine hilfe bei _deinem_ problem erwünscht ist, ist das die angemessene reaktion.

zumal die ip 78.43.x.x zu sein scheint (wie mir ein blick in die datenbank zeigt). und die zu kabel-bademwürtemberg gehört. und irgendwie nach stuttgart / lorrach riecht. und traceroute nach 30+ hops aussteigt. und traceroute auf meine ip nach 9 fertig ist. und bei dir via 84.116.191.5 laeuft .. wien.

eine pm haette es ja auch getan. aber hauptsache geheim geheim.

Es ist nicht mein Problem. Es sollte ein Hinweis auf AhrefsBot sein. Mein "Problem" konnte ich relativ schnell mit nem Ad-Blocker korrigieren.

:rolleyes: wenn ich deine bisherigen IPs checke, finde ich knapp 50 Einträge. Da wird man ja nachfragen dürfen ... aber Hauptsache erst mal den Server-Admin blöd von der Seite anquatschen :thumb:

die Seite ist übrigens sehr flott. Hab weder auf meinem Rechner noch in der Arbeit noch am Handy irgendwelche Probleme.

Fazit:

Dafür entschuldige ich mich bei akira. Dieses Posting hilft hoffentlich, die Situation zu klären und wie es dazu kam. Ich würde mich freuen, wenn du, akira, meine Entschuldigung annimmst.

Was danach dann kam, muss nicht en détail nochmals aufgelistet werden. Seiteneinsteiger, welche mit Herabsetzung einer Person ihre Präsenz zeigen wollen, aber Null Inhalt zum Thema beitragen. Diese Leute gibt es überall.

Ich werde in Zukunft versuchen, die Postings noch genauer zu lesen und nicht so schnell persönlich zu nehmen. Nicht immer gelingt mir das, aber ich werde es versuchen.

Sollte es kein weiteres Feedback geben (1 bis 2 Tage), kann dieser Thread geschlossen werden.

Danke fürs lesen und Gruß Hawk-Eye
 

liberalmente

Moderator Non-Sports & Football
Teammitglied
Beiträge
37.417
Punkte
113
Ich werde in Zukunft versuchen, die Postings noch genauer zu lesen und nicht so schnell persönlich zu nehmen. Nicht immer gelingt mir das, aber ich werde es versuchen.

:thumb:

Ich muss, btw, auch sagen, dass ich auch nicht wusste, dass akira ein Admin ist. Eine Userbezeichnung wäre da schon hilfreich. Er diskutiert zwar kaum mit, will aber den Usern helfen und da wird vieles schneller klar, wenn der User weiß, dass er ein Admin ist.
 

akira1

Administrator
Beiträge
55
Punkte
0
Jedes Forum verursacht Traffic und trägt oftmals nicht unerhebliche Kosten. Je weniger Werbung geschaltet wird, desto höher wird der Eigenanteil. Wenn ein Forum dann Opfer von Bots wird, ist das in meinen Augen ne ziemliche Sauerei, weil das hohen und überlüssigen Traffic verursachen kann und den Betreiber somit Geld kostet. Als die längeren Ladezeiten auftraten, schaute ich nach, wer online ist und fand neben den üblichen Crawlern auch die Suchmaschine AhrefsBot. Diese hat einen sehr schlechten Ruf bei Forenbetreibern

nicht das forum verursacht den traffic: die vorbeikommenden surfer tun es. der traffic wird nicht nur von angemeldeten oder nicht angemeldeten "nutzern" verursacht, sondern auch von spassvögeln, die den server abscannen ... oder einfach mal so ne verbindung zum webserver aufbauen. all diese "nutzer" kannst du als forum-nutzer nicht sehen. du kannst schon gar nicht einfach mal schauen, welche anderen tcp-verbindungen zum server bestehen und wie schnell die wann reinkommen. ich kann das. und ich sage dir: der ahref-crawler ist kein problem. er erzeugt nicht mehr traffic als du (er lädt zb nicht die ganzen avartare runter oder irgendwelche gifs) oder der googlebot oder baidu oder msn oder bing oder yahoo oder sonst wer.

all die von dir zitierten expertenmeinungen zu diesem crawler sind irreführend weil nicht vollständig. was ist ein agressiver crawler? auf keinen fall einer, der von 952455 zugriffen (aller user) für 1579 verantwortlich ist. der googlebot ist im gleichen zeitraum für 13647 verantwortlich, das ist fast faktor 10 mehr. soll ich jetzt den agressiven google-bot sperren? der ahrebot, so wie er im moment agiert, ist 0 problem für den server.

die "hinweise" auf den "experten-seiten" sind .. quatsch:

* ja, der bot hat eine ip. so wie du auch. ja, "bots" ändern ihre ip, so wie du auch. eine bot-farm in der ukraine oder in russland oder in china oder sonstwo: die haben ip-blöcke, von denen sie kommen. nicht nur 10 oder 20, 1000ende. soll ich die einzeln raussammeln und .. dann was? dazu müßte ich dann erstmal erkennen, dass es "der böse ahrefbot" ist. wie mach ich das?

* achso, der bot meldet sich mit einer "kennung" .. ich kann mich auch als ahrefbot auf deinem webserver ausgeben und da fröhlich aufschlagen. das kann keiner überprüfen, was da wirklich ankommt. basierend auf dem user-agent kann ich so zb auch einfach mal sportforen.de anhitten und so tun, als wäre ich der bot xyz. nur um den eindruck zu erwecken, es gäbe ein problem mit xyz.

* "Die Aggressivität dieses Bots birgt das immanente Risiko eines Denial of Service" ... dieses risiko geht von allen "nutzern" da draußen aus. eine 0-aussage. wenn ich ein crawler wäre und wollte den content der seite crawlen, würde ich das definitiv nicht so machen, dass die seite down geht. das wäre eine völlig sinnfrei aktion, mir selber die quelle meines geschäftes abzugraben, weil ich so bekloppt bin, die seite mit nem ddos zu belegen. wenn ich unerkannt agieren wollen würde, würde ich auch nicht meine "bot-kennung" offensichtlich mitschicken sondern was nehmen, was aussieht wie ein normaler nutzer. zb (reales beispiel):

192.3.54.184 - 2014-07-04T20:50:22+00:00 "GET /raw HTTP/1.0" 200 13 "http://myexternalip.com" "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.2a1pre) Gecko/20090402 Firefox/3.8a1pre (.NET CLR 3.5.30729)"
192.3.54.184 - 2014-07-04T20:50:24+00:00 "GET /raw HTTP/1.0" 200 13 "http://myexternalip.com" "Mozilla/5.0 (X11; U; Linux x86_64; en-US; rv:1.9.2a1pre) Gecko/20090428 Firefox/3.8a1pre"
192.3.54.184 - 2014-07-04T20:50:29+00:00 "GET /raw HTTP/1.0" 200 13 "http://myexternalip.com" "Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.2a1pre) Gecko/20090428 Firefox/3.8a1pre"
192.3.54.184 - 2014-07-04T20:50:36+00:00 "GET /raw HTTP/1.0" 200 13 "http://myexternalip.com" "Mozilla/4.0 (compatible; MSIE 5.0b1; Mac_PowerPC)"
192.3.54.184 - 2014-07-04T20:50:39+00:00 "GET /raw HTTP/1.0" 200 13 "http://myexternalip.com" "Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10_5_5; en-us) AppleWebKit/525.26.2 (KHTML, like Gecko) Version/3.2 Safari/525.26.12"
192.3.54.184 - 2014-07-04T20:50:53+00:00 "GET /raw HTTP/1.0" 200 13 "http://myexternalip.com" "Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.2a1pre) Gecko/20090428 Firefox/3.8a1pre"
192.3.54.184 - 2014-07-04T20:50:52+00:00 "GET /raw HTTP/1.0" 200 13 "http://myexternalip.com" "Mozilla/5.0 (X11; U; Linux x86_64; en-US; rv:1.9.2a1pre) Gecko/20090428 Firefox/3.8a1pre"


innerhalb weniger sekunden wird da fröhlich die user-agent "kennung" durchgewechselt. aggresiv sieht auch anders aus (wieder real): 130+ requests / sekunde von der gleichen ip auf die gleiche resource.

was auch immer ahrefbot macht: sie agieren vollständig moderat und ohne (merkbare) last auf dem server zu erzeugen.


Meine aktuelle IP in ein öffentliches Forum zu posten wärte eine Einladung an andere Leute, meinen PC zu entern

darum hättest du das auch als pm schicken können. oder nachfragen. oder begrenzen auf nen teil-abschnitt der ip, damit man ne idee bekommt, aus welcher richtung du aufschlägst. nen link auf eine alberne ip-localhost-ach-wie-lustig seite ist eher weniger hilfreich.

was du an adblockern oder sonstigen tools einsetzt ist mir relativ rille, darauf hab ich keinen einfluß noch interessiert es mich. wenn es routing-probleme gibt zu anderen rechnenzentren oder kabel beim hoster locker sind und ich da nen ticket aufmachen muss etc, interessiert mich das schon.

nochmal: ahrefbot ist im moment _kein_ problem da es _keinen_ traffic erzeugt, der irgendwie signifikant wäre.

**update** kleiner nachtrag (da ich jetzt zu deiner session eine ip habe): du hast im aktuellen access.log 442 eintraege. ahrefbot hat 563, googlebot 14072.


nachtrag zur ip-paranoia: man kann das _gesamte_ ipv4-internet in unter 45 minuten abscannen: https://zmap.io/ oder auch https://www.youtube.com/watch?v=K47MZIEXQEI ... ob du deine ip hier postest oder nicht, spielt keine rolle. leute mit zugriff auf gbit-rootserver haben die ip schon, ukrainer mit infrastruktur für nen "agressiven" webcrawler haben da definitiv zugriff auf gbit-rootserver. und wissen auch schon, ob du offene ports hast oder ob deine firewall funktioniert. nur um mal jegliche illusionen einzureissen. hinweis 2: sportforen.de läuft auch mit ipv6 .. da dauert das sehr viel länger mit dem scannen. aber das nur am rande.
 
Zuletzt bearbeitet:

Hawk-Eye

Linienrichter
Beiträge
2.085
Punkte
0
was auch immer ahrefbot macht: sie agieren vollständig moderat und ohne (merkbare) last auf dem server zu erzeugen.
Danke für die ausführliche Info. Damit ist meine Anfrage beantwortet. Der Thread kann geschlossen werden.

Lieben Gruß
 

His Royness1

Administrator
Beiträge
15.460
Punkte
0
Ort
Hamburg
Boy that de-escalated quickly...

anchorman_ron_burgundy-10629.jpg
 
Oben