前言:大家跟我一起念,Python大法好,跟著本寶寶用Python搶火車票
首先我們需要splinter
安裝:
pip install splinter -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
然后還需要一個(gè)瀏覽器的驅(qū)動,當(dāng)然用chrome啦
下載地址:
http://chromedriver.storage.googleapis.com/index.html?path=2.20/
根據(jù)下載的自己的電腦系統(tǒng)選擇下載包,我的windows就用win32了
解壓后直接放到C:\Windows\System32目錄下,你當(dāng)然也可以給這個(gè)驅(qū)動程序弄個(gè)環(huán)境變量。
注意:我下的驅(qū)動版本是2.19的,根據(jù)自己需要下載相應(yīng)版本,我的2.20版本有報(bào)錯(cuò)
首先簡單的測試一下吧,推薦ipython代替python自帶的交互界面
from splinter.browser import Browser b = Browser(driver_name="chrome") b.visit("http://www.baidu.com") ###注意不要去掉http://
然后牛刀小試一下吧,用百度搜索一些東西。比如splinter
在上面我們已經(jīng)打開百度的網(wǎng)址了
?然后我們輸入一些像搜索的內(nèi)容吧
由上可以發(fā)現(xiàn),該輸入框的name=wd,通過fill似乎只能通過name填充
官方說明: Fill the field identified by ``name`` with the content specified by ``value``.
那就在輸入框搜索splinter,當(dāng)然也可以輸入中文,但是最好指定Unicode編碼,如u”我”
b.fill("wd","splinter")
有意思的事,你會發(fā)現(xiàn)你都不需要點(diǎn)擊“百度一下”就到搜索頁面了
但是,如果多次搜索,我們還是需要點(diǎn)擊“百度一下”的
下面就不在帶著大家找這些元素的id,value什么的了,通過chrome的F12找自己需要的吧
那么把點(diǎn)擊欄find出來吧
我們發(fā)現(xiàn),百度搜索欄的value=”百度一下”,id=”su”
所以把這個(gè)按鈕提取出來
button = b.find_by_value(u"百度一下") 或者 button = b.find_by_id(u"su")
怎么點(diǎn)擊呢?簡單如下
button.click()
這有什么用?
我們找找頁面里有沒有我想找的東西吧,比如找找有沒有這個(gè)地址“splinter.cobrateam.info”
b.is_text_present("splinter.cobrateam.info")
如果該頁面存在,則返回True,反之亦然
怎么退出呢?
b.quit()
好吧,上面就是參照官方文檔寫的一個(gè)簡單的入門教程了,下面我們進(jìn)入正題吧~~~
個(gè)人是覺得授人以魚不如授人以漁的,所以我盡量講解所有的內(nèi)容,而非發(fā)個(gè)代碼,讓大家copy一下,然后不求甚解。
值得注意的是,我不會去說什么怎么破解驗(yàn)證碼以及有什么漏洞可以利用什么的,搶過票的都知道,快一點(diǎn)是一點(diǎn),而我要做的是就能將機(jī)器能做的交給機(jī)器做,比如點(diǎn)擊,查詢,選擇等,所以希望必中的還是繞過此文吧。筆者水平也就這么一點(diǎn)點(diǎn)。
首先我們用ipython講解一下思路
開始當(dāng)然是導(dǎo)入啦。。
from splinter.browser import Browser b = Browser(driver_name="chrome") url = “https://kyfw.12306.cn/otn/leftTicket/init” b = Browser(driver_name="chrome") b.visit(url)
第一步手動登陸,能通過下面的代碼填充表單,但是我跳不過驗(yàn)證碼,暫時(shí)沒有精力去研究那東西,多多見諒,所以還是等手動選擇驗(yàn)證碼的。
b.find_by_text(u"登錄").click() b.fill("loginUserDTO.user_name","xxxx") b.fill("userDTO.password","xxxx")
第二部選擇出發(fā)地點(diǎn)日期等
通過cookies選擇出發(fā)地點(diǎn),日期及目的地
首先瞧瞧我們的cookies當(dāng)然是沒有的出發(fā)日期什么的
至于你的出發(fā)地點(diǎn)及目的地對于的cookies值是什么,就得靠自己去copy了,我?guī)筒涣?
怎么有的這些值?
先將地點(diǎn)日期輸進(jìn)去查詢一下,然后chrome按F12? 找到這一部分即可
打開瀏覽器跳到這個(gè)頁面當(dāng)然是沒有我們需要的信息的,比如下面這樣
b.cookies.all() {u'BIGipServerotn': u'1977155850.38945.0000', u'JSESSIONID': u'0A01D97598F459F751C4AE8518DBFB300DA7001B67', u'__NRF': u'95D48FC2E0E15920BFB61C7A330FF2AE', u'current_captcha_type': u'Z'}
然后我們需要添加出發(fā)地,這個(gè)得自己去查了,是簡單的url加密
b.cookies.add({"_jc_save_fromStation":"%u4E0A%u6D77%2CSHH"})
添加出發(fā)日期
b.cookies.add({"_jc_save_fromDate":"2016-01-20"})
添加目的地
b.cookies.add({u'_jc_save_toStation':'%u6C38%u5DDE%2CAOQ'})
注:如果是修改的話,還是調(diào)用add方法,如果傳入的字典key值已存在則替換
比如,將目的地改為其他地方xxxx,如下即可
b.cookies.add({u'_jc_save_toStation':'xxxxxx'})
然后在看看現(xiàn)在的cookies值
b.cookies.all() {u'BIGipServerotn': u'1977155850.38945.0000', u'JSESSIONID': u'0A01D97598F459F751C4AE8518DBFB300DA7001B67', u'__NRF': u'95D48FC2E0E15920BFB61C7A330FF2AE', u'_jc_save_fromDate': u'2016-01-20', u'_jc_save_fromStation': u'%u4E0A%u6D77%2CSHH', u'_jc_save_toStation': u'%u6C38%u5DDE%2CAOQ', u'current_captcha_type': u'Z'}
既然cookies已經(jīng)準(zhǔn)備完畢,reload一下,開始查詢吧
b.reload() b.find_by_text(u"查詢").click()
是不是發(fā)現(xiàn),地點(diǎn)日期都填上了,很酷有木有
到這一步我們得確認(rèn)的是,自己已經(jīng)登錄了。一切準(zhǔn)備就緒了,就可以刷票了。
值得說明的是,上面的步驟都能手工完成。
下面我們需要用組合BeautifulSoup來判斷預(yù)訂可不可以點(diǎn),當(dāng)然你也可以選擇單點(diǎn)某一趟
反正我只想買高鐵的,既然這樣,下面兩種方法,一是單點(diǎn)一趟,而是輪循著點(diǎn)很多趟,不放過任何機(jī)會。
先說第一個(gè)方法吧,這個(gè)比較簡單,不需要用到其他庫,單用splinter就夠了,就先從簡單的說起吧。
從我自己坐的火車線路來看,一共六趟,我只想做高鐵,那么我一直點(diǎn)高鐵的那一趟預(yù)訂是不是就夠了,當(dāng)然是!!
一共六個(gè)預(yù)訂,我的預(yù)訂在第二個(gè),索引值自然在1了啦。(會python的不會問我為什么的吧!!!)
b.find_by_text(u"預(yù)訂")[1].click()
然后如果預(yù)訂成功
應(yīng)該跳轉(zhuǎn)到選擇乘客的位置,
我們就需要按需選擇乘客了
b.find_by_text(u"你的姓名")[1].click()
然后第一種方法基本講解完畢。
上面的步驟摞在一起其實(shí)不過100行。
然后應(yīng)該有第三種方法,就是利用默認(rèn)的自動查詢,默認(rèn)是5秒刷新一次,但是大家都知道,春運(yùn)期間5秒的區(qū)間太長了,怎么辦呢?
Chrome的F12一下,點(diǎn)擊Console
輸入autoSearchTime=xxx
默認(rèn)是毫秒為單位也就是說,默認(rèn)5000ms,但是不要修改太小,會被偵測到然后報(bào)網(wǎng)絡(luò)繁忙!!!我改成1000ms似乎只能刷十到十五次就報(bào)網(wǎng)絡(luò)繁忙了。
其實(shí),用Python刷票也是為了,沒搶到,把刷新頁面定向搶票的進(jìn)程掛起,我們就不用時(shí)時(shí)刻刻去刷了,至于源碼,留驅(qū)動都在下面的鏈接了~~代碼還有很多不足,以及寫的不夠優(yōu)雅,大家可以參考一下,根據(jù)實(shí)際情況隨便修改~留下的郵箱應(yīng)該都發(fā)完了,一個(gè)個(gè)發(fā)真的發(fā)不過來~~
需要源碼的朋友可以點(diǎn)擊下載了:http://pan.baidu.com/s/1gdTu7cR
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯(lián)系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長非常感激您!手機(jī)微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
