业界动态
百度网盘搜索引擎(基于python)
2024-10-31 21:43
#! /usr/bin/env python

百度网盘搜索引擎(基于python)

#coding=utf-8 # import os from Queue import Queue import threading import time import urllib from urlparse import * from urlparse import urljoin import redis import pymongo import datetime import urllib2 import json import re import sys reload(sys) sys.setdefaultencoding('utf-8') def get_url(url): request = urllib2.Request(url) return urllib2.urlopen(request,timeout=20).read() # def get_count(url): # data = re.findall(r'totalCount:"(.+?)"', get_url(url)) # if len(data) == 0: # raise Exception('get_count err') # return data[0] # def get_count_all(uk): # follow_count = get_count('http://pan.baidu.com/wap/share/home/followers?uk='+str(uk)+'&start=0') # fan_count = get_count('http://pan.baidu.com/wap/share/home/fans?uk='+str(uk)+'&start=0') # return follow_count, fan_count def get_ren_info(url,neibie): data = get_url(url) matches = re.findall(r'parse("(.+?)"),totalCount', data) if len(matches) == 0: raise Exception('get_ren_info err') data_decode = matches[0].decode("unicode_escape") jsondata = json.loads(data_decode) rens = [] if len(jsondata) != 0: for i in jsondata: if neibie == 'follow': ren = {'fangwen':1,'uk':i['follow_uk'],'uname':i['follow_uname'],'avatar_url':i['avatar_url'],'intro':i['intro'],'fans_count':i['fans_count'],'follow_count':i['follow_count'],'pubshare_count':i['pubshare_count'],'album_count':i['album_count']} elif neibie == 'fans': ren = {'fangwen':1,'uk':i['fans_uk'],'uname':i['fans_uname'],'avatar_url':i['avatar_url'],'intro':i['intro'],'fans_count':i['fans_count'],'follow_count':i['follow_count'],'pubshare_count':i['pubshare_count'],'album_count':i['album_count']} rens.append(ren) return rens def get_uk_all(url): url.index('followers') return get_ren_info(url,'follow') url.index('fans') return get_ren_info(url,'fans') raise Exception('url str not found followers and fans') def ren_mongo(uk, number): db.ren.update({'uk':uk}, {'$set':{'fangwen':number}}) def url_mongo(url, number): db.url.update({'url':url}, {'$set':{'fangwen':number}}) def drop(): db.ren.drop() db.url.drop() def url_save(dics): db.url.save(dics) print pymongo.errors.DuplicateKeyError('url save suoying chongfu') def ren_save(dics): db.ren.save(dics) print pymongo.errors.DuplicateKeyError('ren save suoying chongfu') def init(): if not ren_one: url = 'http://pan.baidu.com/wap/share/home/followers?uk=657260084&start=0' url = 'http://pan.baidu.com/wap/share/home/followers?uk=657260084&start=24' print pymongo.errors.DuplicateKeyError('zai suoying chongfu') #queue for i in range(20): def check(): if ren_queue.qsize()<20: if url_queue.qsize() <20: def deal_ren(): # = '1' ren_one = ren_queue.get() uk = ren_one['uk'] print "["+datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S")+"]["+name+"号] "+str(uk)+"doing " follow_count = ren_one['follow_count'] fans_count = ren_one['fans_count'] print follow_count print fans_count for i in range(0,(24 if follow_count > 24 else follow_count),24): url_save({'url':'http://pan.baidu.com/wap/share/home/followers?uk='+str(uk)+'&start='+str(i),'fangwen':1}) for j in range(0,(24 if fans_count > 24 else fans_count),24): url_save({'url':'http://pan.baidu.com/wap/share/home/fans?uk='+str(uk)+'&start='+str(j),'fangwen':1}) ren_mongo(uk, 3) #db.ren.update({'uk':uk}, {'$set':{'fangwen':1}}) def deal_url(): #name = '1' url_one = url_queue.get() url = url_one['url'] #db.url.update({'url':url}, {'$set':{'fangwen':2}})    以上就是本篇文章【百度网盘搜索引擎(基于python)】的全部内容了,欢迎阅览 ! 文章地址:http://syank.xrbh.cn/news/9589.html 
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 迅博思语资讯移动站 http://kaire.xrbh.cn/ , 查看更多   
最新新闻
“刷抖音像小红书、外卖软件里看视频”,各大APP怎么越长越像了
本文来自公众号:Vista看天下(ID:vistaweek),惠通学子经授权转载这段时间上网冲浪的朋友们,沉浸式刷短视频的流畅体验经常被打
怎么提升淘宝店铺排名?店铺排名规则是什么?
随着电子商务的迅猛发展,越来越多的商家选择在淘宝平台上开设店铺。然而,在竞争激烈的市场中,如何提升淘宝店铺的排名成为了每
多模态数据融合深度学习模型的典型深度架构研究
1 介绍我们对世界的体验是多模态的 —— 我们看到物体,听到声音,感觉到质地,闻到气味,尝到味道。模态是指某件事发生或经历的
2024小学入学指南 | 青岛民办小学热度排行榜!
明悦给大家汇总了2023年比较热门的民办小学及部分公办学校排行,2024年小学入学的家长们可做参考哦~扫码进入2024年青岛小学入学
一站式数据智能平台概念及能力
导读:一站式数据智能平台依靠一体化管理,融合数智化工具,向不同行业用户提供专业的、覆盖数据全生命周期的
国内3大自助建站平台测评
​​国内3大自助建站平台测评:云梦微站(云梦网络)、建站快车(凡科)、建站之星(美橙互联)【前言】截至2016年底,根据CNNIC
《2020年直播带货趋势报告》发布:薇娅李佳琦辛巴销售超400亿
  来源:21世纪经济报道  直播行业站上风口,在电商消费领域有极大的消费者购买与转化空间。   以电商直播为代表的网络直
中央说的瞪羚企业、独角兽企业们
中央会议如此强调,要支持发展瞪羚企业,到底什么是瞪羚企业?什么是瞪羚企业?瞪羚是一种善于跳跃和奔跑,体质强壮,是非常敏捷
30个场景营销案例,绝对的干货(建议收藏)
“场景感”这个词成为如今最流行的词汇。产品要有场景感,这样才有故事、有个性,有温度,容易成为爆品。——产品即场景。制造场
乡镇统计工作总结汇报
工作总结是做好各项工作的重要环节。通过工作总结,可以明确下一步工作的方向,少走弯路,少犯错误,提高工作效益。下面是小编为
本企业新闻
推荐企业新闻

点击拨打: