已屏蔽 原因:{{ notice.reason }}已屏蔽
{{notice.noticeContent}}
~~空空如也
好了不多废话了,代码很少,直接贴出来!附件是完整代码

attachment icon tiebasearch.zip 0.70KB ZIP 33次下载
#!/usr/bin/env python

import re
import os
import sys
import time
import random
import urllib


def get_urls_in_apage(page):
   out = XXXXXndall(r'href\=\"\/p\/[^\s]*',page)
   for i in out:
      #print i
      t = "XXXXXXXXXXXXXXXXXXXXXX" + i[6:len(i)-1]
      print t
      cid = XXXXXndall(r'\#[^\s]*',t)
      ids = cid[0][1:]
      #print ids

  

def get_record_size(tname):
   urls = "XXXXXXXXXXXXXXXXXXXXXX/f/search/ures?ie=utf-8&kw=&qw=&rn=30&un="
   req = urllib.urlopen(urlstr + tname)
   web = XXXXXXad()
   totalsizestr = XXXXXndall(r's\_nav\_right hasPage[^\s]*',web)
   totalsize = XXXXXndall(r'[0-9][0-9]{0,}',totalsizestr[0])
   sizex = int(totalsize[0])
   return sizex

if __name__ == '__main__':
   urlstr = "XXXXXXXXXXXXXXXXXXXXXX/f/search/ures?ie=utf-8&kw=&qw=&rn=30&un="
   if(len(XXXXXXgv)==3 and XXXXXXgv[1] == '-k' ):
       namex = XXXXXXgv[2]
       sizex = get_record_size(namex)
       print "find all record size = " + str(sizex)
       rn = 30
       pn = sizex / rn
       print pn
       i = 1
       while i < pn:
          newurl = urlstr + namex +"&" + "pn=" + str(i)
          print newurl
          reqx = urllib.urlopen(newurl)
          web2 = XXXXXXXad()
          get_urls_in_apage(web2)
          i = i + 1
          if i > 76:
             break
          print str(i)
          XXXXXXXeep(1)
文号 / 771180

千古风流
名片发私信
学术分 4
总主题 188 帖总回复 2352 楼拥有证书:学者 机友 笔友
注册于 2015-01-11 13:58最后登录 2024-11-22 16:06
主体类型:个人
所属领域:无
认证方式:手机号
IP归属地:广东

个人简介

收音机爱好者

文件下载
加载中...
{{errorInfo}}
{{downloadWarning}}
你在 {{downloadTime}} 下载过当前文件。
文件名称:{{resource.defaultFile.name}}
下载次数:{{resource.hits}}
上传用户:{{uploader.username}}
所需积分:{{costScores}},{{holdScores}}下载当前附件免费{{description}}
积分不足,去充值
文件已丢失

当前账号的附件下载数量限制如下:
时段 个数
{{f.startingTime}}点 - {{f.endTime}}点 {{f.fileCount}}
视频暂不能访问,请登录试试
仅供内部学术交流或培训使用,请先保存到本地。本内容不代表科创观点,未经原作者同意,请勿转载。
音频暂不能访问,请登录试试
投诉或举报
加载中...
{{tip}}
请选择违规类型:
{{reason.type}}

空空如也

插入资源
全部
图片
视频
音频
附件
全部
未使用
已使用
正在上传
空空如也~
上传中..{{f.progress}}%
处理中..
上传失败,点击重试
等待中...
{{f.name}}
空空如也~
(视频){{r.oname}}
{{selectedResourcesId.indexOf(r.rid) + 1}}
处理中..
处理失败
插入表情
我的表情
共享表情
Emoji
上传
注意事项
最大尺寸100px,超过会被压缩。为保证效果,建议上传前自行处理。
建议上传自己DIY的表情,严禁上传侵权内容。
点击重试等待上传{{s.progress}}%处理中...已上传,正在处理中
空空如也~
处理中...
处理失败
加载中...
草稿箱
加载中...
此处只插入正文,如果要使用草稿中的其余内容,请点击继续创作。
{{fromNow(d.toc)}}
{{getDraftInfo(d)}}
标题:{{d.t}}
内容:{{d.c}}
继续创作
删除插入插入
插入公式
评论控制
加载中...
文号:{{pid}}
加载中...
详情
详情
推送到专栏从专栏移除
设为匿名取消匿名
查看作者
回复
只看作者
加入收藏取消收藏
收藏
取消收藏
折叠回复
置顶取消置顶
评学术分
鼓励
设为精选取消精选
管理提醒
编辑
通过审核
评论控制
退修或删除
历史版本
违规记录
投诉或举报
加入黑名单移除黑名单
查看IP
{{format('YYYY/MM/DD HH:mm:ss', toc)}}
ID: {{user.uid}}