首页
|
新闻
|
论坛
|
博客
|
专题
|
FTP
|
金融
|
微博
|
图库
|
MyHome
|
搜索
|
登陆
|
注册
|
帮助
|
设为首页
·
在线人数:
4071
§您的位置:
文逸首页
>
easyshow 's home
>
【教育学习】专栏
> [转贴]如何实.
easyshow 的主页网址:http://wonyen.net/home.aspx?id=easyshow
给我留言
§ easyshow
的【
教育学习
】专栏
作者:
easyshow
发表时间: 2006/2/25 9:46:33 查看: 5917 评论: 4
标题:
[转贴]如何实现代理海量吸附的经验谈
原地址
http://www.ifstar.net/bbs/read.php?tid=73398&fpage=1
一年多不搞代理了,近来重又拾取,初始的目的是为了挣些威望,目的很不良哈?!可的确是这样,用不动脑的方法拿威望,何乐而不为?再者对一些数据库的破解也要用代理的。于是我开始温故知新——代理吸附,近十余天,小有收获,作为一种经验,介绍给新手朋友们。可别不相信我,为了加强我的贴子的说服力,之前在代理发布版边续发贴很多日,才写此文。
1.什么是代理吸附网址?
大家打开以下网址,看看
http://www.zzxy.cn/proxy/best_proxy.php
http://www.anonymitychecker.com/page1.html
http://www.proxywhois.com/proxylist/cache/anonymous-proxy-list_1.htm
聪明的朋友们,一定领会到了,代理吸附网址不就是含有代理的网页吗? RIGHT!把这些网页地址放在一块,就是代理吸附的列表了(PROXYLISTS)。你可以看到论坛里有人发贴的。
2.如何寻找代理吸附网址?
(1)最简单的方法就是在各代理论坛里,用人家的发布了的。把他们的复制到你自已的文本文件里吧!
(2)再有就是GOOGLE来找,
输入proxies
proxylist
proxylists
proxy+list
proxy+lists
anon+proxies
anon+proxy
anon-proxy
anon_list
之类的检索词,或你用些GOOGLE语法,如inurl:proxylist等。
中文的,你也可以输入:今日代理 代理列表 等等。
找到后手工保存下其有代理的网址。
(3)用一些工具软件,自已制作。比如用Z-LEECHER吸附搜索引擎中含代理的URLS,过滤去重。应用PROXY-LEECH等试验下载,并去除无效的URLS即可,这种方法用了几种工具,但并不自动化,效率也不高,我也在研习。但这也是一种获取PROXYLISTS的思路吧!
3.当获取了大量的代理吸附列表,有很多重复的,很多无效的,如何整理?
我个人对收集的整理过程是:
(1)去重复:我用MAGICFILT或Z-LEECHER,当然还有很多,甚至有论坛发贴专门的去重软件。
(2)把所有链接都改为:标准的http://格式,比如
http://www.dabest.org
改为www.dabest.org
因为,有一些工具(如GETPROXYLIST),只支持这种标准格式,这点很重要,一定要做,否则吸不到代理,也不能怨别人了。
当然这种批量添
http:// 
;头的工作,是用EXCEL来完成的,别告诉我你不会用啊!这可是每个研究生必备的工具之一。
(3)经排序处理好的以每500条左右,作为一个单元(数量要以软件运行的承受力来定,个人去体会)存放在不同的TXT文本中。
3.什么是代理吸附?
代理吸附就是用某些工具,从以上形式的网页中,把代理下载下来,放入TXT文本文件中,以进一步验证。
那我们有什么样的工具与方法呢?那实在是太多了,而且会不断有新工具与方法出台,也有旧工具不断被淘汰或者是进化。我就我所知道的方法与评价一一道来,不能保证我的经验一定是圣经一样神圣,所以你必须带着挑剔的眼光来看贴。也不妨提一下你个人的意见。
(1)
传统的AD与APL
曾风风光光,到现在还是余威尚在,很多论坛的朋友,仍沉在其中,乐此不疲,可渐有许多朋友会发现,AD与APL吸附下来的代理,是越来越少。尤是APL的GOOGLE吸附完全不能用,而很多吸附不了的网页找开一看,却是明明有代理的。为什么?那是因为代理吸附网页,编程的发展,网页形式与结构,使AD与APL失效了。如打开看看
http://www.proxy4free.com/page1.html
]
多好的代理啊,可二者都下不下来了。有的论坛聪明的人,把AD能吸附的网址单独收集起来,仍发挥AD的热能。可我不喜欢,没那种精力。当然AD的其他功能,如密码,代理匿名验证还是强大,不可忽略。
单就代理吸附,我不建议大家再用它们了
。
(2)不用代理列表,用GOOGLE上直接吸附的工具可以不可以呢?嗨!说来也伤心,那种方法,曾是我最为中意的海量获取代理的最简单方法。老手都知道
proxynator2.0
俗称西红柿,以及它的升级版
PROXYMA
,以及前面所说的
APL
原本都是可以经由GOOGLE进行海量吸附代理的。但GOOGLE防黑客利用,屡屡改版,而代理软件不能跟上形式,以上的工具的新版都没有吸附功能了。伤心总是难免的。
我们也就不用它们了
。也许有一天,哪个精英大侠,会CRACK GOOGLE一下,解解气。
(3)
代理猎狗1.0
,是目前可用一种吸附工具,在小木虫与鸭绿江都有下载。以小木虫的为完整。也有详细的说明,大家可以去那时下载。
简介:
能够过滤出不规范的代理格式(非标准格式)。
支持多种版本的proxyjudeg验证版本。
可以最小化到托盘图标。
支持不规则各种代理页的代理吸附。
提供上传下载功能,可以互相共享大家新验证的代理。
吸附速度快,测试了吸附1000多页面,很快完成。
过滤重复代理功能独立化,可以用来过滤其他需要过滤得文本数据。(过滤速度超块,测试过滤7W多吸附代理,只需要2秒不到)
能够识别代理的归属.
活代列表可以排序,导出
我对此没试用,但从小木虫网友的使用情况来看,
目前还是一款可用的吸附工具。
(4)
FLASHGET+MAGICFILTER
,这也是有效的方法。在鸭绿江被作为了一种教程。
第一步:你要找到天天更新的代理网页,复制下他的网址,粘贴到记事本上。注意:最好改记事本的后缀名为LST,方便在网际快车下打开。
第二步:在网际快车上打开文件选项->导入列表 下载发布代理的网页
第三步:用MagicFilter这个软件在网页中提取代理。
1。选择源文件2.提取代理。
我对此的评价:
尚可一试。
(5)
花刺、代理超人
可实现有效的代理吸附,但不是海量吸附,前者不支持批量导入,后者对吸附的数量有限制,
不是真正意义上的海量吸附!
(6)很久前曾用过
PROXYJUSTICER大众版,
也设计了代理吸附,但用起来,软件不稳定。
我不推荐使用
。
(7)
PROXY LEECH与GetProxyList
两款小巧的代理吸咐工具是近期我在论坛发贴子,推荐大家使用的。
前者是根据APL改版的,吸附力超强,对超量的验证有时会发生OVER RUN软件中止运行现象,而且会频频跳出存放网页COOKIE要求,无效的网页会对其运行速度有一定影响,
但其小巧对于小于500条的PROXYLIST可以跑动,同时在验证完成它的窗口会显示每一条链接,吸取了几个代理,我们也可以
据此来清理无效的地址。
GETPROXYLIST较前者运行更稳定。速度飞快!!!正因为速度太快了,我都懒于清除无效的链接。
我正在用这二款,
仍力荐,尤其是后者!
(8)
其他的
:如用代理猎手/代理之王/SOCKETFINDER的PING网段来找代理,非代理吸附的内容就免谈了。
另外我还在试用Z-LEECHER来利用各种搜索引擎来吸附代理,但速度太慢了,软件易发故障,效率低,用于吸附,
暂时免谈了。
分享到:
easyshow于2006/2/25 9:55:36经过修改.
【
管理日志
】【
我要评论
】
§
评论: [转贴]如何实现代理海量吸附的经验谈
共
0
条评论; 每页显示 15 条评论;
1
/
1
↑到页首
您未登陆,发表评论时请填写:用户名
*
密码
*
注册新用户
评论: [转贴]如何实现代理海量吸附的经验谈
内容
(8000字以内)
(CTRL+ENTER提交)
关闭窗口
用户登陆
我要发表文章
搜 索
§easyshow 的网志导航
【
感想随笔
】
(2)
【
生活休闲
】
(0)
【
饮食健康
】
(0)
【
自然妙趣
】
(0)
【
潮流时尚
】
(0)
【
游览见闻
】
(0)
【
情感绿洲
】
(7)
【
娱乐搞笑
】
(3)
【
读图时代
】
(0)
【
影音视听
】
(2)
【
商业新知
】
(1)
【
理论研究
】
(0)
【
时事纵横
】
(0)
【
社会文化
】
(0)
【
文学欣赏
】
(0)
【
教育学习
】
(27)
§easyshow 的友情链接
emuch
丁香园
关于文逸
|
小文论坛
|
文逸博客
|
文逸金融
|
精华文章
|
网站地图
| 联系我们 |
隐私保护
Copyright©
WWW.WONYEN.NET
2003 - 2021
闽ICP备09016518号-16
闽公网安备 35020502000004号
本站最高 10508 人同时在线,发生时间 2005-5-17 5:09:15
文逸科技
制作维护