22306班
未读
6. 9月25日 泰坦尼克号生还预测1-数据预处理
6. 9月25日 泰坦尼克号生还预测1-数据预处理 项目背景 泰坦尼克号(Titanic),又称铁达尼号,是当时世界上体积最庞大、内部设施最豪华的客运轮船,有“永不沉没”的美誉,被称为“世界工业史上的奇迹”。1912年4月10日,她在从英国南安普敦出发,驶往美国纽约的首次处女航行中,不幸与一座冰山相
22306班
未读
40.6月5日 综合项目:flask 实现数据可视化
综合项目:Flask 实现数据可视化 效果: Flask介绍 Flask是一个用Python编写的轻量级Web应用框架。它被设计为易于使用,同时提供强大的功能,以便开发者可以快速地开发Web应用程序。以下是Flask的一些关键特点: 轻量级:Flask没有默认的数据库、表单验证或任何其他特定的工具。
22306班
未读
39.6月3日 综合项目:ubuntu计划任务实现UP主粉丝增量分析
在之前的项目中,我们完成了UP主全数据爬取、基础数据分析、UP主选题分析、受众播赞比分析、视频封面画像拼图展示等。 相较于市面上的成熟商用网站,目前还欠缺一个重要功能,就是记录并分析UP主的粉丝增量数据。 有了这个数据,就可以更好的分析热点话题,新视频受众认可度等。对UP主的选题提供清晰的思路。 由
22306班
未读
38.5月30日 综合项目:用拼图制作UP主画像封面图(不做重点)
综合项目:用拼图制作UP主画像封面图 使用UP主本人的所有视频作品封面,为后续UP主画像制作封面图,效果图: 下载图片 在之前爬虫数据基础上,将封面图这列中所有图片进行下载并保存。
22306班
未读
36.5月22日 综合项目:爬取并分析知名B站UP主-1
综合项目:爬取并分析知名B站UP主-1 本项目为综合项目,本课内容主要实现: 对某up主的所有视频数据进行爬取 得到链接、标题、观看数量、点赞数、投币数、标签、封面图 存储到csv文件供后续分析 基本框架 本次以“百大UP”小约翰可汗的视频为例:https://space.bilibili.com/
22306班
未读
35.5月21日 项目:DrissionPage爬取图片网站
项目:DrissionPage爬取图片网站 我们之后的项目需要用到爬取图片,下载视频,下载文档等功能。 我们通过这个项目,简单介绍下如何使用DrissionPage的下载功能。 本次使用的网站是: 引入库 from DrissionPage import WebPage
22306班
未读
34.5月21日 项目:对招聘数据进行分析和可视化处理-技能词云
项目:对招聘数据进行分析和可视化处理-技能词云 依旧在之前作业的基础上,完成岗位技能分析。将结果进行词云可视化。 效果如图。 并为后续项目分析做准备。 模块引入 import pandas as pd
from collections import Counter
import ast
import
22306班
未读
类似案例:DrissionPage实现爬取51job
类似案例:DrissionPage实现爬取51job 逻辑与之前项目相似,不再赘述。 以下是基础代码框架
from DrissionPage import WebPage
from DrissionPage import ChromiumOptions
import time
path = r'
22306班
未读
33.5月20日 项目:对招聘数据进行分析和可视化处理-工资数据
项目:对招聘数据进行分析和可视化处理-工资数据 目标是在上节课爬虫基础上,利用爬取的csv格式文件中的数据进行工资数据分析。 效果图: 附加:饼图呈现“岗位所在行业(前10)” 步骤一:导入必要的库 import pandas as pd
import matplotlib.pyplot as pl
22306班
未读
32.5月15日 项目:使用DrissionPage爬取Boss直聘
本项目预期结果: 使用DrissionPage爬取Boss直聘 之前库的缺点和局限性 requests库 requests库效率很高,但有明显缺点: 需要手动处理heads和cookies 难以应对各个网站的反爬机制 获取网页元素的