展示数据 创建一个有个youyaoqi项目 项目自带文件 scrapy.cfg youyaoqi init.py items.py middlewa 2018-05-27 spider databases 超级鹰 使用验证平台 超级鹰(https://www.chaojiying.com/)字母数字验证码code import time fro 2018-05-24 spider code BeautifulSoup相关 #获取直接子节点:contents、children #获取父节点:parent #获取兄弟节点:next_siblings、next_si 2018-05-24 spider beautifulSoup selenium from selenium import webdriver from selenium.common.exceptions import 2018-05-22 spider selenium youyaoqi 创建一个有个youyaoqi项目 项目自带文件 scrapy.cfg youyaoqi init.py items.py middlewa 2018-05-21 spider cartoon summary 选择器 一个标签有多个类属性时,取到这个标签的时候,多个类属性之间用不用空格隔开,正常表示result = soup.select('.-l 2018-05-19 spider 随机总结 kaisha密码 用来破解一些加密文件 import urllib from urllib import parse def str2url(s): 2018-05-15 spider urllib movie 爬电影获取的是电影的种子,将这个链接发给迅雷,可以直接下载 import json import re import requests 2018-05-12 spider movie novel novel爬取到小说的具体内容,要进行滤除处理,完整的代码# -*- coding:UTF-8 -*- from bs4 impor 2018-05-11 spider novel practice——jd 数据库字段创建 create database jddb default character set=utf8; use jddb; c 2018-05-11 spider sqlalchemy shop_mo 蘑菇街agent_list.py import random def get_random_agent(): agent_lis 2018-05-09 spider agent music_wy # coding=utf-8 ''' 爬取wy音乐榜单 ''' # 导入需要使用的模块 import os import csv impor 2018-05-07 spider music