符伟鹏

导航

2020年4月16日 #

爬取豆瓣电影TOP250

摘要: 一.主题式网络主题式网络爬虫设计方案 1.主题式网络爬虫名称:爬取豆瓣电影 Top 250 数据 2.主题式网络爬虫爬取的内容:爬取电影排名,电影评分,电影打分,电影评价人数 3.主题式网络爬虫设计方案概述:分析网页源代码,找出数据所在的标签,通过爬虫读取数据存入excel,对数据清洗分析 二、主题 阅读全文

posted @ 2020-04-16 15:56 符伟鹏 阅读(627) 评论(0) 推荐(0) 编辑

2020年3月21日 #

Python高级应用第5次作业---网络爬虫练习---百度搜索风云榜

摘要: 百度搜索风云榜的爬取 首先进入网站http;//top.baidu.com/ 对其进行分析 import requestsfrom bs4 import BeautifulSoupimport pandas as pdtitles=[]hots=[]url='http://top.baidu.com 阅读全文

posted @ 2020-03-21 01:16 符伟鹏 阅读(378) 评论(0) 推荐(0) 编辑