可以自动建立分一级分类和二级分类。全部入到一个一级分类下名字可以改
修复了下自己知道的错误。
由于第一次写采集所以嘛。。嘿嘿~~~错误希望帮忙解决下拉。。
地址无法转换成真实的地址。。
下一步学习:地址转换真实地址。。图片文件全部本地并且自动建立目录!
希望高人指点下哦。。。。
采集使用方法:
把主程序直接复制然后在惊云admin权限目录建立文件。名字自己起, 但是要在下面两个地方
<FORM METHOD=POST ACTION="addyxgame.asp" onsubmit="return checkinput();">
response.write "<meta http-equiv=""refresh"" content=""0;url='addyxgame.asp?action=Alibaba'"">"
提交的文件名字改改,然后就可以正常使用了。。。嘿嘿~~~~~
<%Admin="DownMake"%>
<!--#include file="check.asp"-->
<!--#include file="mdb_path_down.asp"-->
<SCRIPT LANGUAGE="JavaScript">
<!--
function checkinput()
{
if (document.all.StartID.value=="" document.all.EndId.value=="")// (document.all.StartID.value > document.all.EndId.value))
{
//alert(document.all.StartID.value>document.all.EndId.value);
alert(document.all.StartID.value);
alert(document.all.EndId.value);
alert("输入错误!请检查输入");
return false;
}
else
{
return true;
}
}
//-->
</SCRIPT>
<FORM METHOD=POST ACTION="addyxgame.asp" onsubmit="return checkinput();">
<INPUT TYPE="hidden" name="action" value="Alibaba">
<INPUT TYPE="hidden" name="status" value="start">
开始<INPUT TYPE="text" NAME="StartID">结束:<INPUT TYPE="text" NAME="EndId">
<INPUT TYPE="submit">
</FORM>
<%
Server.ScriptTimeOut=240
if request("action")="Alibaba" then
if request("status")="start" then
session("StartId")=request("StartID")
session("EndId")=request("EndId")
session("NowId")=request("StartID")
end if
if session("NowId")<>session("EndId")+1 then
response.write "<meta http-equiv=""refresh"" content=""0;url='addyxgame.asp?action=Alibaba'"">"
response.write "正在获取ID为:" & session("NowId") & "的数据! 您输入的起始id为:" & session("StartId") & " 输入id为:" & session("EndId")
strHTML=getHTTPPage("/jishu513556http://patch.ali213.net/view.asp?id="&session("NowId"))
if strHTML="" then
response.write "<p>此ID有错误发生!程序将忽略它继续采集!</p>"
else
'--------------------------------------------------------------
Soft_Name=mymid(strHTML,"<td[^>]+><div[^>]+>\s<font[^>]+>(.+?)<\/font><\/div><\/td>")
response.write Soft_Name&"<br>"
soft_class=mymid(strHTML,"<td[^>]+><div[^>]+>类型:(.+?)<\/div><\/td>")
response.write soft_class&"<br>"
softsize=mymid(strHTML,"<td[^>]+><div[^>]+>大小:(.+?)<\/div><\/td>")
response.write softsize&"<br>"
soft_url="http://patch.ali213.net/"&mymid(strHTML,"<a href=""([^""]+)"" target=""blank"">点击下载<\/a>")
response.write soft_url&"<br>"
set rs2=server.createobject("adodb.recordset")
sql2="select * from downtype where tname='游戏补丁"&soft_class&"'"
rs2.open sql2,conn,1,3
if rs2.eof or rs2.bof then
rs2.close
call addtype()
classid=rs2("ID")
rs2.close
else
classid=rs2("ID")
end if
rs2.close
set rs2=nothing
response.write "classid="&classid
set rs=server.CreateObject("ADODB.RecordSet")
sql="select * from down where (id is null)"
rs.open sql,conn,1,3
rs.addnew
rs("tid")=classid
rs("cxn")=Soft_Name
rs("pic")=""
rs("cxv")=""
rs("yy")="简体中文"
rs("cd")="Flash游戏"
rs("sq")="免费"
rs("size")=softsize
rs("hot")=3
rs("hy")=0
rs("user")="Hipshow"
rs("system")="windows"
rs("date")=now()
rs("body")=htmlencode(title)
rs.update
rs.close
sql="select top 1 id from down order by id desc"
rs.open sql,conn,1,1
if not rs.eof then
newid=rs("id")
end if
rs.close
sql="select * from downfile where (id is null)"
rs.open sql,conn,1,3
rs.addnew
rs("downid")=newid
rs("downno")=1
rs("filename")="马上下载"
rs("file")=soft_url
rs.update
rs.close
end if
session("NowId")=session("NowId")+1
else
response.write "完成!"
session("StartId")=""
session("EndId")=""
session("NowId")=""
end if
else
session("StartId")=""
session("EndId")=""
session("NowId")=""
end if
'---------------------------------------------------------------------------
'定义函数
'正则式内容截取函数
function mymid(byval A_strString,byval A_strPattern)
dim MM_objRegexp
dim MM_strExecute
set MM_objRegexp=new regexp
with MM_objRegexp
.Pattern=A_strPattern
.IgnoreCase=True
.Global=false
set MM_strExecute=.Execute(A_strString)
if MM_strExecute.count<>0 then