許多小伙伴在看到一些優(yōu)秀的抖音視頻的時(shí)候會(huì)萌生搬運(yùn)的想法,這時(shí)候就需要下載這個(gè)視頻了,然而抖音上下載的視頻都是有水印的,那么怎么用python下載抖音無(wú)水印視頻呢?接下來(lái)的這篇文章帶你了解。
抖音上的視頻是有版權(quán)的,在未與創(chuàng)作者協(xié)商的情況下搬運(yùn)對(duì)方的視頻是一種侵權(quán)行為。保護(hù)版權(quán)從你我做起!
抖音平臺(tái)是以視頻內(nèi)容為主要運(yùn)營(yíng)內(nèi)容的,這類網(wǎng)站一般都不允許別人爬取他們網(wǎng)站的內(nèi)容,該篇文章稍作修改就可以變成爬蟲,特此說(shuō)明,小伙伴們不要去隨意爬取別人網(wǎng)站的內(nèi)容。
一、獲取抖音視頻連接
得到如下信息: “5.1 HV:/ 守門員戴手套沒法系鞋帶這種體育精神,值得尊敬%遇見足球 %足球 %精彩進(jìn)球 %意甲 %唯有足球不 https://v.douyin.com/eDFd28P/ 復(fù)制此鏈接,打開Dou音搜索,直接觀看視頻!”
通過正則取到信息中的地址:
share_url='5.1 HV:/ 守門員戴手套沒法系鞋帶這種體育精神,值得尊敬%遇見足球 %足球 %精彩進(jìn)球 %意甲 %唯有足球不 https://v.douyin.com/eDFd28P/ 復(fù)制此鏈接,打開Dou音搜索,直接觀看視頻!'
short_url = re.findall('(https?://[^s]+)', share_url)[0]
二、訪問地址對(duì)返回的數(shù)據(jù)進(jìn)行分析
通過訪問得到的短連接,請(qǐng)求的地址會(huì)變成下面的
然后分析返回的數(shù)據(jù):
對(duì)返回的數(shù)據(jù)逐個(gè)篩選,發(fā)現(xiàn)這個(gè)連接可以直接訪問到視頻
對(duì)請(qǐng)求的地址重新整理獲取源視頻的地址:
headers = {
"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.93 Safari/537.36",
}
# 通過分享連接獲取跳轉(zhuǎn)的地址
url = requests.get(url=short_url,headers=headers).url
# 通過跳轉(zhuǎn)的地址找到item_id
item_id = re.findall('https://www.iesdouyin.com/share/video/(d+)',url)[0]
# 請(qǐng)求地址獲取數(shù)據(jù)
rel_url = requests.get(url="https://www.iesdouyin.com/web/api/v2/aweme/iteminfo/?item_ids="+item_id,headers=headers).text
# 篩出視頻地址
video_rul = json.loads(rel_url)['item_list'][0]['video']['play_addr']['url_list'][0]
三、如何去除水印
以上步驟中可以得到視頻的地址:https://aweme.snssdk.com/aweme/v1/playwm/?video_id=v0300fg10000c29ouk4guk3mmkooa0r0&ratio=720p&line=0
將其中的playwm
替換為play
就可以得到?jīng)]有水印的地址
video_rul = json.loads(rel_url)['item_list'][0]['video']['play_addr']['url_list'][0].replace('/playwm/', '/play/')
四、整合代碼
import requests
import re
import json
down_load_path = 'E:下載的MP4\'
class D_y():
headers = {
"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.93 Safari/537.36",
}
def __init__(self,share_url):
self.share_url = share_url
def get_rel_url(self):
# short_url = re.findall('(https?://[^s]+)', self.share_url)[0]
short_url = re.findall('(http[|s]?://[^s]*/)', self.share_url)[0]
url = requests.get(url=short_url, headers=self.headers).url
# item_id = re.findall('https://www.iesdouyin.com/share/video/(d+)', url)[0]
item_id = url.split('/')[5]
rel_url = requests.get(url="https://www.iesdouyin.com/web/api/v2/aweme/iteminfo/?item_ids=" + item_id,headers=self.headers).text
video_rul = json.loads(rel_url)['item_list'][0]['video']['play_addr']['url_list'][0].replace('/playwm/','/play/')
video = requests.get(url=video_rul,headers=self.headers).content
video_name = json.loads(rel_url)['item_list'][0]['share_info']['share_title'].split('#')[0].split('@')[0].replace(' ','')
with open(down_load_path+str(video_name)+'.mp4','wb') as f:
f.write(video)
f.close()
print("【抖音短視頻】: {}.mp4 無(wú)水印視頻下載完成!".format(video_name))
if __name__ == '__main__':
a = input("url:")
D_y(a).get_rel_url()
大功告成!??!
到此這篇教你用Python下載抖音無(wú)水印視頻的文章就介紹到這了,更多Python學(xué)習(xí)內(nèi)容請(qǐng)搜索W3Cschool以前的文章或繼續(xù)瀏覽下面的相關(guān)文章。