本文實例講述了python實現去除下載電影和電視劇文件名中的多余字符的方法,是一個非常實用的技巧,分享給大家供大家參考。具體如下:
有時候我們討厭下載電影和電視劇文件名中的多余字符(如網址和廣告字樣),搞得文件名好長!不便于查看,這時候就可以使用下面的Python代碼,自行修改即可.
具體實現代碼如下:
#!\usr\bin\env python # -*- coding: utf-8 -*- # Author: 吳徐平 # FileName: RefineFileName.py # Function: # 下載的電影電視文件名太長, # 常常含有多余的字符,如'中英雙字幕', # 可以使用本Python代碼去掉 # Using python 2.7.X,win xp sp3 import sys import os import re # 文件夾目錄列表 FileDirectoryList=[\ u"E:\\電視電影\\都市俠盜.Leverage",\ u"E:\\電視電影\\犯罪心理.Criminal.Minds",\ u"E:\\電視電影\\海軍罪案調查處.NCIS",\ u"E:\\電視電影\\警察世家.Blue.Bloods"\ ] #文件名開頭處是否需要添加的字符串 #不需要添加字符時,留空(或空白)字符來表示 AddStringList=[\ u'Leverage',\ u'Criminal.Minds',\ u'NCIS.',\ u'Blue.Bloods.' ] # 文件名中必須去掉的字符 MustReplaceStringList=[\ u'都市俠盜',\ u'犯罪心理',\ u'海軍罪案調查處',\ u'警察世家',\ u'人人影視',\ u'SFiles',\ u'YYeTs',\ ] # 去掉所有不必要的字符 NewString=u''; # 自定義重命名文件的函數 def RenameFileName(OldFileName,NewFileName): oldpath,oldfn = os.path.split(OldFileName) newpath,newfn = os.path.split(NewFileName) print(oldpath.encode('ascii','ignore')) os.rename(OldFileName, NewFileName) #print (oldfn.encode('ascii','ignore')+' --> '+newfn.encode('ascii','ignore')) #正則表達式替換,最多一次,忽略大小寫 def StringRegexReplace(pattern,repl,string): return re.sub(pattern, repl, string, count=1, flags=re.I) # 循環#硬盤的電影電視劇所有目錄下的文件 for FileDirectory in FileDirectoryList: FileNamesList=os.listdir(FileDirectory) # 循環重新命名文件 for filenamei in FileNamesList: # 首先去掉文件名中的空格字符 RefinedFileName=filenamei.replace(u' ',NewString) # 循環必須去掉的文件名列表 for MustReplaceString in MustReplaceStringList: RefinedFileName=RefinedFileName.replace(MustReplaceString,NewString) #去掉錄制信息 RefinedFileName=StringRegexReplace(u'(?<=[\.\-_])[^.]*rip(?=[\.\-_])','',RefinedFileName) RefinedFileName=StringRegexReplace(u'(?<=[\.\-_])xvi[^.]*(?=[\.\-_])','',RefinedFileName) #去掉分辨率 RefinedFileName=StringRegexReplace('\d{1,4}X\d{1,4}','',RefinedFileName) #去掉[*]里面的所有內容 RefinedFileName=StringRegexReplace(u'\[.*\]','',RefinedFileName) #去掉網址 RefinedFileName=StringRegexReplace(u'www\..*\.((com)|(net)|(cn)|(org))','',RefinedFileName) #去掉字幕(組)的字樣 RefinedFileName=StringRegexReplace(u'(?<=[\.\-_])[^.]*字幕組?','',RefinedFileName) #去掉出品和作品字樣 RefinedFileName=StringRegexReplace(u'(?<=[\.\-_])[^.]*[出作]品','',RefinedFileName) #去掉開頭的點.下劃線_連接符-等 RefinedFileName=StringRegexReplace(u'^[._\-]','',RefinedFileName) # 經常出現兩個點以上,直接替換成一個點 RefinedFileName=RefinedFileName.replace(u'...',u'.') RefinedFileName=RefinedFileName.replace(u'..',u'.') # 可以重新命名了 OldFileName=os.path.join(FileDirectory,filenamei) NewFileName=os.path.join(FileDirectory,RefinedFileName) RenameFileName(OldFileName,NewFileName) ####下面的代碼在文件頭添加字符串 #判斷是否已經添加了字符串 def HasAddString(AddString0,FileNameString0): if (len(AddString0.strip())<1):#AddString0為空字符不需要再添加任何字符了 print('Empty AddString,No need to add to : '+ FileNameString0.encode('ascii','ignore')) return True else: AddString=AddString0.strip().lower() FileNameString=FileNameString0.strip().lower() if(len(FileNameString)<=len(AddString)): return False else: if(FileNameString[0:(len(AddString)-1)]==AddString[0:(len(AddString)-1)]): return True else: return False DirCounter=0; # 循環#硬盤的電影電視劇所有目錄下的文件 for FileDirectory in FileDirectoryList: FileNamesList=os.listdir(FileDirectory) AddString =AddStringList[DirCounter] DirCounter=DirCounter+1 # 循環重新命名文件 for filenamei in FileNamesList: #已經加過的文件名不再添加字符了 if HasAddString(AddString,filenamei): print(filenamei.encode('ascii','ignore')+' : ALready Added Header String!') else: # 首先連接字符串 RefinedFileName=AddString+filenamei # 可以重新命名了 OldFileName=os.path.join(FileDirectory,filenamei) NewFileName=os.path.join(FileDirectory,RefinedFileName) RenameFileName(OldFileName,NewFileName) print(filenamei.encode('ascii','ignore')+' : Add Header String, OK!')
對文件名的修改有特殊要求的,可以將StringRegexReplace函數用上.
運行本文實例后可以看到下面的電視劇文件名看起來就舒服多了:
希望本文所述實例對大家的Python程序設計能有所幫助。
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
