22306班
未读
39.6月3日 综合项目:ubuntu计划任务实现UP主粉丝增量分析
在之前的项目中,我们完成了UP主全数据爬取、基础数据分析、UP主选题分析、受众播赞比分析、视频封面画像拼图展示等。 相较于市面上的成熟商用网站,目前还欠缺一个重要功能,就是记录并分析UP主的粉丝增量数据。 有了这个数据,就可以更好的分析热点话题,新视频受众认可度等。对UP主的选题提供清晰的思路。 由
22306班
未读
38.5月30日 综合项目:用拼图制作UP主画像封面图(不做重点)
综合项目:用拼图制作UP主画像封面图 使用UP主本人的所有视频作品封面,为后续UP主画像制作封面图,效果图: 下载图片 在之前爬虫数据基础上,将封面图这列中所有图片进行下载并保存。
22306班
未读
37.5月29日 综合项目:爬取并分析知名B站UP主-2
火烧云数据-B站数据分析平台-B站营销增长 (hsydata.com) 没时间,未完成,需修改 以下代码跑不了 只是关键点参考 import pandas as pd
from collections import Counter
import ast
import matplotlib.pyplo
22306班
未读
36.5月22日 综合项目:爬取并分析知名B站UP主-1
综合项目:爬取并分析知名B站UP主-1 本项目为综合项目,本课内容主要实现: 对某up主的所有视频数据进行爬取 得到链接、标题、观看数量、点赞数、投币数、标签、封面图 存储到csv文件供后续分析 基本框架 本次以“百大UP”小约翰可汗的视频为例:https://space.bilibili.com/
22306班
未读
35.5月21日 项目:DrissionPage爬取图片网站
项目:DrissionPage爬取图片网站 我们之后的项目需要用到爬取图片,下载视频,下载文档等功能。 我们通过这个项目,简单介绍下如何使用DrissionPage的下载功能。 本次使用的网站是: 引入库 from DrissionPage import WebPage
22306班
未读
34.5月21日 项目:对招聘数据进行分析和可视化处理-技能词云
项目:对招聘数据进行分析和可视化处理-技能词云 依旧在之前作业的基础上,完成岗位技能分析。将结果进行词云可视化。 效果如图。 并为后续项目分析做准备。 模块引入 import pandas as pd
from collections import Counter
import ast
import
22306班
未读
类似案例:DrissionPage实现爬取51job
类似案例:DrissionPage实现爬取51job 逻辑与之前项目相似,不再赘述。 以下是基础代码框架
from DrissionPage import WebPage
from DrissionPage import ChromiumOptions
import time
path = r'
22306班
未读
33.5月20日 项目:对招聘数据进行分析和可视化处理-工资数据
项目:对招聘数据进行分析和可视化处理-工资数据 目标是在上节课爬虫基础上,利用爬取的csv格式文件中的数据进行工资数据分析。 效果图: 附加:饼图呈现“岗位所在行业(前10)” 步骤一:导入必要的库 import pandas as pd
import matplotlib.pyplot as pl
22306班
未读
32.5月15日 项目:使用DrissionPage爬取Boss直聘
本项目预期结果: 使用DrissionPage爬取Boss直聘 之前库的缺点和局限性 requests库 requests库效率很高,但有明显缺点: 需要手动处理heads和cookies 难以应对各个网站的反爬机制 获取网页元素的
Steam卡片