论坛风格切换切换到宽版
  • 3418阅读
  • 0回复

新云Newasp采集功能视频教程 [复制链接]

上一主题 下一主题
离线admin
 

发帖
17338
金钱
88513105
威望
88
贡献值
20070
只看楼主 倒序阅读 使用道具 0 发表于: 2009-05-04
新云网站管理系统采集功能演示 PaZFM  
----------------------------------------------------- qmK!d<4  
  我们要学习的是文章采集功能,软件采集和文章大同小异,此教程需要你有一定的网页知识。 A6sBObw;  
  要采集的目标网站:天空软件站(www.skycn.com) w7 QIKsI0  
  采集前请添加文章、软件分类 ^qDkSoqC"  
  下面我们开始采集前的项目设置,登录网站管理系统后台--文章采集 vxwctJ&  
第一步、“采集基本设置”--根据自己的要求设置,这一步就不多说了; LJiMtqg  
第二步、“添加采集项目”--填写项目的一些基本设置; D( _a Xy  
“网站URL”--http://www2.skycn.com xJ3#k;  
“远程文章列表网址” --http://www2.skycn.com/sort/sort0200wz_indate_DESC_1.html HU'd/5fun  
如果有列表有分页可以用“*”或者“{$PageCode}”来代替分页,如:http://www2.skycn.com/sort/sort0200wz_indate_DESC_*.html X23TS`  
“列表最多页数”--112,一般网站都有说明列表的总页数,可以在目标网页内找到, (zhmZm  
也可以自己计算出它的页数或者根据自己的需求来设置要采集的页数; *L^{p.K4  
其它的自行设置; FCI T+ 8K  
设置完成后请进行下一步 prwyP  
这一步我们将要获取显示列表标题的所有源代码,以备后面使用,文本框内显示的是要采集的目标网页源码; hVlL"w*1  
“列表开始代码”--在目标网页源码中找到列表的开始代码,这段代码必须是目标源码中唯一的代码,不能有重复,可以用计事本的“查找”功能测试看是否有重复; 3!d|K%J  
  a@ lK+t  
--------------------代码如下--------------------  =HSE  
<font color=#0000ff>人气</font></td> RJWlG'i  
--------------------Code End-------------------- % va/x]K  
“列表结束代码”--必须是开始代码后面唯一的字符 N\vc<Zpn  
--------------------代码如下-------------------- [Ea5Bn;~!  
<table border='0' cellPadding=0 cellSpacing=0 width='540'> L *5&hPU  
--------------------Code End-------------------- ?>,aq>2O$  
设置正确后请进行下一步 ;Y~;G7  
这一步我们将要获取所有文章内容的URL,文本框内显示的是要采集的目标网页源码 sFGXW  
“列表连接开始代码”--这里的获取方法是匹配获取,将获取所有相匹配的URL 4Q]+tXes  
--------------------代码如下-------------------- +28FB[W  
<A href=' u54+oh|,M  
--------------------Code End-------------------- bT>^% H3  
“列表连接结束代码” s=6w-'; V  
--------------------代码如下-------------------- k}BNFv8  
'><b> UyJ5}fBJ  
--------------------Code End-------------------- P#yS]F/  
设置正确后请进行下一步 TX*P*-'  
这一步我们将获取文章内容 Qn<< &i~  
“文章标题开始代码” iWv gCm4  
--------------------代码如下-------------------- zX5p'8-  
<tr><td width='100%' align='center' bgcolor='#CED7F1' height='20'><b><font color='#000000'> #v`G4d  
--------------------Code End-------------------- }R>g(q=N  
“文章标题结束代码” Ohjqdv@  
--------------------代码如下-------------------- p?!] sO1l  
</font></b> nmgW>U0jZh  
--------------------Code End-------------------- YZoH{p9f  
“文章内容开始代码” }R J2\CP  
--------------------代码如下-------------------- VE GUhI/d  
</td></tr><tr><td><br> Fc nR}TE  
--------------------Code End-------------------- plp).Gq  
“文章内容结束代码” N),Zb^~nw  
--------------------代码如下-------------------- hTy#Q.=  
<iframe name=import_frame width=1 height=1 ? G3OAx?<  
--------------------Code End-------------------- `yVJ `} hm  
“文章作者设置”--可选项 S>'wb{jj!  
“文章来源设置”--可选项 qV(Plt%  
“过虑其它字符”--可选项,有时候文章内容中可能有广告,可能在此过虑掉 +)V6"XY-(  
设置完成后请行下一步 nVYh1@yLy  
如果显示正常,便可以开始采集了。 ?! kup  
'[A>eC++  
!,1~:*:  
iBc( @EJ  
http://down.3389hack.com/2008061806@www.3389hack.com.rar
评价一下你浏览此帖子的感受

精彩

感动

搞笑

开心

愤怒

无聊

灌水
快速回复
限100 字节
 
上一个 下一个