python

22306班未读

6. 9月25日泰坦尼克号生还预测1-数据预处理项目背景泰坦尼克号（Titanic），又称铁达尼号，是当时世界上体积最庞大、内部设施最豪华的客运轮船，有“永不沉没”的美誉，被称为“世界工业史上的奇迹”。1912年4月10日，她在从英国南安普敦出发，驶往美国纽约的首次处女航行中，不幸与一座冰山相

python 机器学习 2024-09-25

22306班未读

综合项目：Flask 实现数据可视化效果： Flask介绍 Flask是一个用Python编写的轻量级Web应用框架。它被设计为易于使用，同时提供强大的功能，以便开发者可以快速地开发Web应用程序。以下是Flask的一些关键特点：轻量级：Flask没有默认的数据库、表单验证或任何其他特定的工具。

22306班未读

在之前的项目中，我们完成了UP主全数据爬取、基础数据分析、UP主选题分析、受众播赞比分析、视频封面画像拼图展示等。相较于市面上的成熟商用网站，目前还欠缺一个重要功能，就是记录并分析UP主的粉丝增量数据。有了这个数据，就可以更好的分析热点话题，新视频受众认可度等。对UP主的选题提供清晰的思路。由

22306班未读

综合项目：用拼图制作UP主画像封面图使用UP主本人的所有视频作品封面，为后续UP主画像制作封面图，效果图：下载图片在之前爬虫数据基础上，将封面图这列中所有图片进行下载并保存。

python 大数据 22036 2024-05-30

22306班未读

综合项目：爬取并分析知名B站UP主-1 本项目为综合项目，本课内容主要实现：对某up主的所有视频数据进行爬取得到链接、标题、观看数量、点赞数、投币数、标签、封面图存储到csv文件供后续分析基本框架本次以“百大UP”小约翰可汗的视频为例：https://space.bilibili.com/

22306班未读

项目：DrissionPage爬取图片网站我们之后的项目需要用到爬取图片，下载视频，下载文档等功能。我们通过这个项目，简单介绍下如何使用DrissionPage的下载功能。本次使用的网站是：引入库 from DrissionPage import WebPage

DrissionPage python 22036 大数据 2024-05-22

22306班未读

项目：对招聘数据进行分析和可视化处理-技能词云依旧在之前作业的基础上，完成岗位技能分析。将结果进行词云可视化。效果如图。并为后续项目分析做准备。模块引入 import pandas as pd from collections import Counter import ast import

python 22036 wordcloud 2024-05-22

22306班未读

类似案例：DrissionPage实现爬取51job 逻辑与之前项目相似，不再赘述。以下是基础代码框架 from DrissionPage import WebPage from DrissionPage import ChromiumOptions import time path = r'

22306班未读

项目：对招聘数据进行分析和可视化处理-工资数据目标是在上节课爬虫基础上，利用爬取的csv格式文件中的数据进行工资数据分析。效果图：附加：饼图呈现“岗位所在行业（前10）” 步骤一：导入必要的库 import pandas as pd import matplotlib.pyplot as pl

22306班未读

本项目预期结果：使用DrissionPage爬取Boss直聘之前库的缺点和局限性 requests库 requests库效率很高，但有明显缺点：需要手动处理heads和cookies 难以应对各个网站的反爬机制获取网页元素的