Kom ihåg mig?
Home Menu

Menu


Blocka bot

Ämnesverktyg Visningsalternativ
Oläst 2009-08-15, 13:43 #1
gibson gibson är inte uppkopplad
Medlem
 
Reg.datum: Jan 2009
Inlägg: 71
gibson gibson är inte uppkopplad
Medlem
 
Reg.datum: Jan 2009
Inlägg: 71
Jag har problem med botar utvecklade i java som tar upp bandbredd och skapar massa fel.

User-agent kan t.ex. vara Java/1.6.0_14
De börjar alltid på Java/1.

Jag har testat att ip-spärra några i IIS:en men antingen är det olika botar eller så byter de ip.
Vad är bästa sättet att bli av med dessa? Visst, jag kan kolla vad användaren har för user-agent och skicka iväg botarna nånstans men då har de redan förbrukat bandbredd.
Någon som har något bra sätt att lösa detta på? Jag kör .NET och IIS 6.0
gibson är inte uppkopplad   Svara med citatSvara med citat
Oläst 2009-08-15, 13:50 #2
emilvs avatar
emilv emilv är inte uppkopplad
Bara ett inlägg till!
 
Reg.datum: Feb 2004
Inlägg: 1 564
emilv emilv är inte uppkopplad
Bara ett inlägg till!
emilvs avatar
 
Reg.datum: Feb 2004
Inlägg: 1 564
Testa att lägga in den i robots.txt och om det inte hjälper, blockera den på user-agent (ge helt tomt svar). Bandbredden den då förbrukar är ändå minimal jämfört med om du skickar ett helt svar.
emilv är inte uppkopplad   Svara med citatSvara med citat
Oläst 2009-08-15, 13:57 #3
gibson gibson är inte uppkopplad
Medlem
 
Reg.datum: Jan 2009
Inlägg: 71
gibson gibson är inte uppkopplad
Medlem
 
Reg.datum: Jan 2009
Inlägg: 71
Dåliga bots bryr sig inte om robots.txt för fem öre tyvärr.

Jag surfade vidare lite och hittade faktiskt ett bra sätt!
Det finns något som heter urlscan och version 2.5 funkar fint till iis 6.0
Här kan man blocka user-agents och mycket mycket annat på en lägre nivå, dvs. innan requestet kommer fram till webservern verkar det som.
Verkar skitbra, håller på att testa nu
gibson är inte uppkopplad   Svara med citatSvara med citat
Oläst 2009-08-15, 15:26 #4
WeaZear WeaZear är inte uppkopplad
Mycket flitig postare
 
Reg.datum: May 2008
Inlägg: 689
WeaZear WeaZear är inte uppkopplad
Mycket flitig postare
 
Reg.datum: May 2008
Inlägg: 689
Citat:
Originally posted by gibson@Aug 15 2009, 12:57
Dåliga bots bryr sig inte om robots.txt för fem öre tyvärr.

Jag surfade vidare lite och hittade faktiskt ett bra sätt!
Det finns något som heter urlscan och version 2.5 funkar fint till iis 6.0
Här kan man blocka user-agents och mycket mycket annat på en lägre nivå, dvs. innan requestet kommer fram till webservern verkar det som.
Verkar skitbra, håller på att testa nu
Meddela gärna om det funkar, kör också IIS 6 och de skulle vara bra att lägga till detta, om det nu funkar. :huh:
WeaZear är inte uppkopplad   Svara med citatSvara med citat
Oläst 2009-08-15, 15:27 #5
gibson gibson är inte uppkopplad
Medlem
 
Reg.datum: Jan 2009
Inlägg: 71
gibson gibson är inte uppkopplad
Medlem
 
Reg.datum: Jan 2009
Inlägg: 71
Äh. Fan också.
Man kunde bara förhindra vissa header names från att göra requests.
Dvs. man kan lägga in alla med User-Agent: i sin header, men däremot inte User-Agent: Java

Och det suger ju stenhårt med tanke på att om man lade in User-Agent: så skulle ingen kunna gå in på siten.

Några ideér?
gibson är inte uppkopplad   Svara med citatSvara med citat
Oläst 2009-08-15, 17:40 #6
gibson gibson är inte uppkopplad
Medlem
 
Reg.datum: Jan 2009
Inlägg: 71
gibson gibson är inte uppkopplad
Medlem
 
Reg.datum: Jan 2009
Inlägg: 71
Blev en kul eftermiddag det här...
Men nu har jag äntligen hittat ett verktyg som funkar fint.
Det heter Webknight och är ett isapi-filter som är väldigt lätt att installera och hantera för IIS.
http://aqtronix.com/?PageID=99

Här kan man göra allting som man kan i urlscan men då också lägga till de user-agents man inte vill ha att göra med. Det finns också massa inställningar för att skydda sig mot sql-injections m.m.

Om någon använder detta, glöm inte kryssa ur (eller modifiera) "Use allowed content-type" samt "Use denied extensions" om ni kör med ajax. Annars funkar nämligen inte axd-filen + att ajax-anrop kör en annan content-type än normalt.
gibson är inte uppkopplad   Svara med citatSvara med citat
Oläst 2009-08-15, 21:37 #7
Jonas Jonas är inte uppkopplad
Klarade millennium-buggen
 
Reg.datum: Feb 2004
Inlägg: 3 364
Jonas Jonas är inte uppkopplad
Klarade millennium-buggen
 
Reg.datum: Feb 2004
Inlägg: 3 364
Det hindrar ingen att byta user-agent eller använda cURL för att göra samma sak?

Skulle satsa på att kolla upp ett ev. samband med IP mm, att enbart gå på user-agent är dåligt då detta är på HTTP-protokoll nivå, alltså det är något man enkelt kan byta ut.
Jonas är inte uppkopplad   Svara med citatSvara med citat
Oläst 2009-08-16, 12:50 #8
Normans avatar
Norman Norman är inte uppkopplad
Mycket flitig postare
 
Reg.datum: Feb 2004
Inlägg: 589
Norman Norman är inte uppkopplad
Mycket flitig postare
Normans avatar
 
Reg.datum: Feb 2004
Inlägg: 589
IPS:er har grundläggande stöd för det här.
Vet att google och större sökmotorer faktiskt har anti-scraping avdelningar med folk som övervakar scraping och gör decisions så att de inte blir "scrapade".
Norman är inte uppkopplad   Svara med citatSvara med citat
Oläst 2009-08-17, 08:00 #9
Slacker Slacker är inte uppkopplad
Medlem
 
Reg.datum: Apr 2008
Inlägg: 276
Slacker Slacker är inte uppkopplad
Medlem
 
Reg.datum: Apr 2008
Inlägg: 276
Det går att blockera useragent Java via .htaccess:
http://blamcast.net/articles/block-b...an-ip-htaccess
Slacker är inte uppkopplad   Svara med citatSvara med citat
Oläst 2009-08-17, 10:37 #10
emilvs avatar
emilv emilv är inte uppkopplad
Bara ett inlägg till!
 
Reg.datum: Feb 2004
Inlägg: 1 564
emilv emilv är inte uppkopplad
Bara ett inlägg till!
emilvs avatar
 
Reg.datum: Feb 2004
Inlägg: 1 564
Citat:
Originally posted by Slacker@Aug 17 2009, 07:00
Det går att blockera useragent Java via .htaccess:
http://blamcast.net/articles/block-bots-ho...ban-ip-htaccess
... i IIS?
emilv är inte uppkopplad   Svara med citatSvara med citat
Svara


Aktiva användare som för närvarande tittar på det här ämnet: 1 (0 medlemmar och 1 gäster)
 

Regler för att posta
Du får inte posta nya ämnen
Du får inte posta svar
Du får inte posta bifogade filer
Du får inte redigera dina inlägg

BB-kod är
Smilies är
[IMG]-kod är
HTML-kod är av

Forumhopp


Alla tider är GMT +2. Klockan är nu 22:58.

Programvara från: vBulletin® Version 3.8.2
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Svensk översättning av: Anders Pettersson
 
Copyright © 2017