點擊上方“ 碼農(nóng)突圍 ”,馬上關(guān)注,每天早上 8:50 準(zhǔn)時推送
真愛,請置頂或星標(biāo)
摘要 :分享個 Python 神工具。
長時間使用瀏覽器會積累大量瀏覽器歷史記錄,這些是很隱私的數(shù)據(jù),里面甚至可能有一些不可描述的網(wǎng)站或者搜索記錄不想讓別人知道。不過,我們自己可能會感興趣,天天都在上網(wǎng),想知道長期下來是都在摸魚還是有認(rèn)真工作。
其次,了解下自己每天打開多少次網(wǎng)頁、哪些網(wǎng)站上的最多、常搜哪些關(guān)鍵詞,這些也很有趣。
下面就來給大家介紹一款 Python 編寫的神工具,可以一鍵分析你的上網(wǎng)行為。我用了后發(fā)現(xiàn)了很多不可思議的結(jié)論。
比如訪問次數(shù)最多的網(wǎng)站居然是微信公眾號,7000 多次,看來弄自媒體占了大量上網(wǎng)時間。

看到了每天打開網(wǎng)站的次數(shù),平均都有好幾百次,8 月 8 號那天發(fā)生了什么,竟打開了 1600 多次!

然后又統(tǒng)計了停留時間最長的網(wǎng)頁頁面,在 http://md.aclickall.com/ 這個網(wǎng)站居然停留了 660 小時,這是個文章排版網(wǎng)站,因為經(jīng)常要排版所以把該頁面固定了起來。

然后統(tǒng)計出了搜索最多的十個關(guān)鍵詞,python 居然是第一位!前十中基本都是數(shù)據(jù)編程相關(guān)的,沒想到自己這么愛學(xué)習(xí)。

最后統(tǒng)計出了各大搜索引擎的使用率。google 的使用率達(dá)到了 97.3%,而百度只有不到 3%,大概是偶爾無法科學(xué)上網(wǎng)的時候用了下百度。

怎么樣是不是挺有意思?下面就來說說怎么用這款工具,讓你也可以分分鐘了解自己的上網(wǎng)行為,非常簡單。
這款 Python 工具其實就是分析瀏覽器的歷史記錄數(shù)據(jù)庫文件然后可視化。這里的瀏覽器只支持 Chrome 和以 Chrome 為內(nèi)核的瀏覽器,比如 Centbrower 、360極速瀏覽器等,其他瀏覽器比如 ie、Firefox 不支持。如果有登陸賬號,桌面端和電腦端會一起分析,更全面。
第一步,打開網(wǎng)站:(公眾號后臺回復(fù) 813 得到)

接著上傳你的瀏覽器歷史記錄文件,這個歷史記錄文件怎么獲得呢?
新建一個標(biāo)簽頁,輸入
chrome://version/
回車,可以打開你的瀏覽器詳細(xì)信息:

復(fù)制「個人資料路徑」到資源管理器打開,然后找到 history 文件復(fù)制一份到桌面。

接著就在剛才的網(wǎng)站中上傳該文件(我的文件有 15MB 大),稍等片刻就可以得到上門的那些可視化分析結(jié)果。
你可能會擔(dān)心上傳瀏覽器歷史記錄是否安全,盡管放心,這個程序是開源的。
下面再簡單說下如何用 python 一步步實現(xiàn)的這個程序功能的,這是一個很棒的 python 練手項目,涉及到了前后端的知識,整個程序包含多個文件:
Code
├─?app_callback.py??????????????????????????回調(diào)函數(shù),實現(xiàn)后臺功能
├─?app_configuration.py?????????????????????web服務(wù)器配置
├─?app_layout.py????????????????????????????web前端頁面配置
├─?app_plot.py??????????????????????????????web圖表繪制
├─?app.py???????????????????????????????????web服務(wù)器的啟動
├─?assets???????????????????????????????????web所需的一些靜態(tài)資源文件
│??├─?css???????????????????????????????????web前端元素布局文件
│??│??├─?custum-styles_phyloapp.css
│??│??└─?stylesheet.css
│??├─?image?????????????????????????????????web前端logo圖標(biāo)
│??│??├─?GitHub-Mark-Light.png
│??└─?static????????????????????????????????web前端幫助頁面
│??│??├─?help.html
│??│??└─?help.md
├─?history_data.py??????????????????????????解析chrome歷史記錄文件
└─?requirement.txt??????????????????????????程序所需依賴庫
每個程序?qū)崿F(xiàn)的功能:

具體實現(xiàn)思路大致分為下面幾點:
-
解析歷史記錄文件數(shù)據(jù)
歷史記錄 history 是一個 sqllite 數(shù)據(jù)庫文件,連接數(shù)據(jù)庫查詢?nèi)缓笳{(diào)用數(shù)據(jù)庫中的信息并存儲。
-
配置 web 服務(wù)器和前端頁面
-
可視化繪圖函數(shù)
可視化圖形使用的是可交互式的 plotly 庫。
小結(jié)
上網(wǎng)記錄是很重要的隱私數(shù)據(jù),平常自己可能無法從中直接發(fā)現(xiàn)什么,使用 Python 簡單一分析就可以發(fā)現(xiàn)很多東西,所以平時盡量注重隱私保護(hù)。
全部源碼 上傳到文末公號,回復(fù)「? 上網(wǎng)記錄 」即可獲得 。
推 薦閱讀:
向Excel說再見,神級編輯器統(tǒng)一表格與Python
東半球最強Python新手100天學(xué)習(xí)計劃開源,這次再學(xué)不會算我輸!
如何從海量抖音視頻上找高顏值小姐姐,難嗎!直到我發(fā)現(xiàn)了這個Python庫
我用Python爬了點你們需要的電影,這些電影真的很不錯~
再推薦23個Python爬蟲開源項目代碼:微信、淘寶、豆瓣、知乎、微博(已開源)
深夜,我用python爬取了整個斗圖網(wǎng)站,不服來斗
Python爬蟲44萬條數(shù)據(jù)揭秘:如何成為網(wǎng)易云音樂評論區(qū)的網(wǎng)紅段子手
18個Python爬蟲實戰(zhàn)案例(已開源)
更多爬蟲,關(guān)注下面公號,后臺回復(fù): “ 爬蟲實戰(zhàn) ” ,獲取獨家整理的一份爬蟲匯總。
好文和好朋友一起看~
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯(lián)系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機(jī)微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
