Python如何实现爬取B站视频

5⽉3⽇晚，央视在《新闻联播》前播放了B站青年宣⾔⽚《后浪》，这是B站⾸次登陆央视黄⾦时段，今天在朋友圈陆续看到相关的视频。最早⽤B站的同学都知道，B站是和A站以异曲同⼯的⿁畜视频及动漫，进⼊到⼤众视野的⾮主流视频⽹站。哔哩哔哩现为国内领先的年轻⼈娱乐、⽂化社区，该⽹站于2009年6⽉26⽇创建，被粉丝们亲切的称为“B站”。

B站之所以⽕，是因为趣味与知识并存。它是⼀个重度宅腐⼆次元集结地。B站包含动漫、漫画、游戏，也有很多由繁到简、五花⼋门的视频，很多冷门的软件和绘画技巧在B站都可以到完整的教学视频。正如⼀句“你在B站看番，我在B站学习”，B 站还是有⼀些质量⽐较好的学习视频。当你在B站上看到喜欢的视频想保存下来时，怎么办呢？

转⼊正题，本篇推⽂主要介绍如何将B站上把喜欢的视频下载下来，帮助更多需要学习的⼩伙伴，详细步骤如下：

⽹页分析

视频下载⽅法

成果展⽰

视频号的加⼊，再度引燃了短视频领域，今天我们爬取B站的每天播放量最多的⼩视频，其他类型的视频可以参考这个⽅法。

⽹页分析

⽹址为：

'vc.bilibili/p/eden/rank#/?tab=全部'

我们可以看到Request URL这个属性值，我们向下滑动加载视频的过程中，发现只有这段url是不变的。next_offset 会⼀直变化，我们可以猜测，这个可能就是获取下⼀个视频序号，我们只需要把这部分参数取出来，把 next_offset 写成变量值，⽤JSON 的格式返回到⽬标⽹页即可。

视频下载⽅法

金子涵个人资料

盾山的祝福上⼀部分已对⽹页进⾏了分析，现在我们可以利⽤⽅法来获取B站上的⼩视频。

扫黑风暴主演员表

核⼼代码

def get_json(url):佟丽娅辞演三十而已

headers = {

'User-Agent':

'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36'

}

演员蒋欣

params = {

'page_size': 10,

'next_offset': str(num),

'tag': '今⽇热门',

'platform': 'pc'

}

try:

html = (url, params=params, headers=headers)

return html.json()

except BaseException:

print('request error')

pass

def download(url,path):

start = time.time() # 开始时间

size = 0

headers = {

'User-Agent':

'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36'

}

response = (url,headers=headers,stream=True)

chunk_size = 1024

content_size = int(response.headers['content-length'])

if response.status_code == 200:

with open(path,'wb') as file:

for data in response.iter_content(chunk_size=chunk_size):

file.write(data)

祝福爸爸的简单句子size += len(data)

成果展⽰

上⼀部分我们已经展⽰了如何⽤Python下载视频的⽅法，下⾯我们进⾏效果展⽰以上就是本⽂的全部内容，希望对⼤家的学习有所帮助，也希望⼤家多多⽀持。

Python如何实现爬取B站视频

发布评论取消回复

最近发表

热门文章

标签列表