Kom ihåg mig?
Home Menu

Menu


Crawla webbsidor och lagra utlagda epostadresser

 
Ämnesverktyg Visningsalternativ
Oläst 2009-12-08, 13:45 #1
olsserik olsserik är inte uppkopplad
Flitig postare
 
Reg.datum: Jul 2007
Inlägg: 300
olsserik olsserik är inte uppkopplad
Flitig postare
 
Reg.datum: Jul 2007
Inlägg: 300
Standard Crawla webbsidor och lagra utlagda epostadresser

Ok, känns lite spamvarning på detta va?

Då känns det ju bra att fråga (jag kan ju inte detta :-))

Jag skulle vilja söka igenom några sajter efter epostadresser med något script, hur gör man det bäst?

Det är i gott syfte och anledningen är att jag inte orkar surfa runt själva och spara publika emails.

Någon som har koll?
olsserik är inte uppkopplad   Svara med citatSvara med citat
Oläst 2009-12-08, 13:48 #2
BarateaUs avatar
BarateaU BarateaU är inte uppkopplad
Klarade millennium-buggen
 
Reg.datum: Nov 2007
Inlägg: 2 648
BarateaU BarateaU är inte uppkopplad
Klarade millennium-buggen
BarateaUs avatar
 
Reg.datum: Nov 2007
Inlägg: 2 648
e-mail spider script varianter finns välla en del på nätet?
sök, ladda ner, testa
BarateaU är inte uppkopplad   Svara med citatSvara med citat
Oläst 2009-12-08, 13:53 #3
crazzys avatar
crazzy crazzy är inte uppkopplad
Har WN som tidsfördriv
 
Reg.datum: Aug 2007
Inlägg: 1 089
crazzy crazzy är inte uppkopplad
Har WN som tidsfördriv
crazzys avatar
 
Reg.datum: Aug 2007
Inlägg: 1 089
Du måste ha ett script eller program som läser in webbsidor, läser igenom deras htmlkod och sparar mailadresser. Det måste även spara alla länkar för att ha nånstans att fortsätta crawla. Förslagsvis sparar du även alla urler du besökt tillsammans med en tidsangivelse. Hoppas du också förstår att om du crawlar hela internet, kommer du bli fattig på diskutrymme.

edit: Läste inte ordentligt.....
Som BarateaU säger finns färdiga sript att ladda ner. Alternativt skriver du ett själv, kan använda dej av file_get_contents() och preg_match() i php om du bara ska ha från några få sidor.
crazzy är inte uppkopplad   Svara med citatSvara med citat
Oläst 2009-12-08, 13:55 #4
olsserik olsserik är inte uppkopplad
Flitig postare
 
Reg.datum: Jul 2007
Inlägg: 300
olsserik olsserik är inte uppkopplad
Flitig postare
 
Reg.datum: Jul 2007
Inlägg: 300
Tjena,
Hmm, har sökt lite innan faktiskt.
Det känns som två världar, antinge är resultatet ett script för sajtägare att motverka epostkravlande, eller också mega-bad, typ download FREE *.RU
Attans!
Någon som har någon "vit" länk till en bra lösning?
olsserik är inte uppkopplad   Svara med citatSvara med citat
Oläst 2009-12-08, 14:00 #5
olsserik olsserik är inte uppkopplad
Flitig postare
 
Reg.datum: Jul 2007
Inlägg: 300
olsserik olsserik är inte uppkopplad
Flitig postare
 
Reg.datum: Jul 2007
Inlägg: 300
Tjena Crazzy,
Ja, tanken har slagit mig att göra ett eget.
Men eftersom jag normalt inte kodar spindlar och mina timmar är dyra tänkte jag komma undan utan att uppfinna ett nytt hjul.
Kanske inte skulle vara så svårt ändå, är ju bara ett fåtal domäner så det måste kunna hårdkodas i någon GET sats till att börja med.

PM:a gärna om ni skulle vilja hjälpa till men inte vill posta i forumet.
olsserik är inte uppkopplad   Svara med citatSvara med citat
Oläst 2009-12-08, 14:01 #6
Perben Perben är inte uppkopplad
Flitig postare
 
Reg.datum: Apr 2009
Inlägg: 393
Perben Perben är inte uppkopplad
Flitig postare
 
Reg.datum: Apr 2009
Inlägg: 393
Jag kan rekommendera Nutch (www.nutch.org). Väldigt lätt att sätta igång globala eller begränsade spindlar för att sedan filtrera ut datat man vill. Tror till och med det finns exempelkonfigurationer för det du åtagit dig.
Perben är inte uppkopplad   Svara med citatSvara med citat
Oläst 2009-12-08, 14:08 #7
crazzys avatar
crazzy crazzy är inte uppkopplad
Har WN som tidsfördriv
 
Reg.datum: Aug 2007
Inlägg: 1 089
crazzy crazzy är inte uppkopplad
Har WN som tidsfördriv
crazzys avatar
 
Reg.datum: Aug 2007
Inlägg: 1 089
http://users.telenet.be/ahmadi/nettools.htm
I det här kitet finns en email crawler. Den ligger under Network Tools->Email Extractor

Sen bara anger man en url, den fortsätter crawla tills du säger stopp och sparar ner alla emails.
crazzy är inte uppkopplad   Svara med citatSvara med citat
Oläst 2009-12-08, 14:13 #8
olsserik olsserik är inte uppkopplad
Flitig postare
 
Reg.datum: Jul 2007
Inlägg: 300
olsserik olsserik är inte uppkopplad
Flitig postare
 
Reg.datum: Jul 2007
Inlägg: 300
Tackar!
Båda verkar bra, men nettools verkar passa bäst hittills då det blir enklare att kommia igång i windowsmiljö.
olsserik är inte uppkopplad   Svara med citatSvara med citat
Oläst 2009-12-09, 05:24 #9
emilvs avatar
emilv emilv är inte uppkopplad
Bara ett inlägg till!
 
Reg.datum: Feb 2004
Inlägg: 1 564
emilv emilv är inte uppkopplad
Bara ett inlägg till!
emilvs avatar
 
Reg.datum: Feb 2004
Inlägg: 1 564
Tänk på att det i de flesta fall är ett brott mot marknadsföringslagen att skicka reklam till de e-postadresser du samlar in på detta sätt.
emilv är inte uppkopplad   Svara med citatSvara med citat
Oläst 2009-12-09, 16:00 #10
Althalos Althalos är inte uppkopplad
Medlem
 
Reg.datum: Jan 2006
Inlägg: 282
Althalos Althalos är inte uppkopplad
Medlem
 
Reg.datum: Jan 2006
Inlägg: 282
Kan rekommendera följande tjänst:
http://80legs.com/

Superbilligt och du kan söka igenom miljontals sidor inom väldigt kort tid

Kan kräva lite kunskap i programmering för att få det exakt som man vill dock. Men det bör räcka med vanlig regex..
Althalos är inte uppkopplad   Svara med citatSvara med citat
Svara


Aktiva användare som för närvarande tittar på det här ämnet: 1 (0 medlemmar och 1 gäster)
 

Regler för att posta
Du får inte posta nya ämnen
Du får inte posta svar
Du får inte posta bifogade filer
Du får inte redigera dina inlägg

BB-kod är
Smilies är
[IMG]-kod är
HTML-kod är av

Forumhopp


Alla tider är GMT +2. Klockan är nu 20:19.

Programvara från: vBulletin® Version 3.8.2
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Svensk översättning av: Anders Pettersson
 
Copyright © 2017