日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

python snownlp情感分析簡易demo(分享)

系統(tǒng) 1895 0

SnowNLP是國人開發(fā)的python類庫,可以方便的處理中文文本內(nèi)容,是受到了TextBlob的啟發(fā)而寫的,由于現(xiàn)在大部分的自然語言處理庫基本都是針對(duì)英文的,于是寫了一個(gè)方便處理中文的類庫,并且和TextBlob不同的是,這里沒有用NLTK,所有的算法都是自己實(shí)現(xiàn)的,并且自帶了一些訓(xùn)練好的字典。注意本程序都是處理的unicode編碼,所以使用時(shí)請自行decode成unicode。MIT許可下發(fā)行。

其 github 主頁

我自己修改了上文鏈接中的python代碼并加入些許注釋,以方便你的理解:

            
from snownlp import SnowNLP
# SnowNLP庫:
# words:分詞
# tags:關(guān)鍵詞
# sentiments:情感度
# pinyin:拼音
# keywords(limit):關(guān)鍵詞
# summary:關(guān)鍵句子
# sentences:語序
# tf:tf值
# idf:idf值
s = SnowNLP(u'這個(gè)東西真心很贊')
# s.words     # [u'這個(gè)', u'東西', u'真心', u'很', u'贊']
print(s.words)
s.tags # [(u'這個(gè)', u'r'), (u'東西', u'n'), (u'真心', u'd')
# , (u'很', u'd'), (u'贊', u'Vg')]
print(s.sentiments)
# s.sentiments  # 0.9769663402895832 positive的概率
# s.pinyin    # [u'zhe', u'ge', u'dong', u'xi', # u'zhen', u'xin', u'hen',
# u'zan']4
s = SnowNLP(u'「繁?w字」「繁?w中文」的叫法在?_?騁嗪艸R?。')
# s.han      # u'「繁體字」「繁體中文」的叫法在臺(tái)灣亦很常見。'
print(s.han)
          
            
from snownlp import SnowNLP
text = u'''
自然語言處理是計(jì)算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個(gè)重要方向。
它研究能實(shí)現(xiàn)人與計(jì)算機(jī)之間用自然語言進(jìn)行有效通信的各種理論和方法。
自然語言處理是一門融語言學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)于一體的科學(xué)。
因此,這一領(lǐng)域的研究將涉及自然語言,即人們?nèi)粘J褂玫恼Z言,
所以它與語言學(xué)的研究有著密切的聯(lián)系,但又有重要的區(qū)別。
自然語言處理并不是一般地研究自然語言,
而在于研制能有效地實(shí)現(xiàn)自然語言通信的計(jì)算機(jī)系統(tǒng),
特別是其中的軟件系統(tǒng)。因而它是計(jì)算機(jī)科學(xué)的一部分。
'''
s = SnowNLP(text)
print(s.keywords(6)) # [u'語言', u'自然', u'計(jì)算機(jī)'] 不能用tags輸出關(guān)鍵字.
s.summary(3) # [u'因而它是計(jì)算機(jī)科學(xué)的一部分', u'自然語言處理是一門融語言學(xué)、計(jì)算機(jī)科學(xué)、
# 數(shù)學(xué)于一體的科學(xué)', u'自然語言處理是計(jì)算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個(gè)重要方向']s.sentences
# print(s.sentences)
print(s.sentiments) # 1.0
s = SnowNLP([[u'這篇', u'文章'],
       [u'那篇', u'論文'],
       [u'這個(gè)']])
# print(s.tf)
# print(s.idf)
# print(s.sim([u'文章'])) # [0.3756070762985226, 0, 0]
          

在編譯運(yùn)行之前,先得安裝snownlp包,后續(xù)還有pylab,pandas模塊:
在VS Code終端(查看->集成終端)里面輸入:
pip install snownlp

pip install pylab

pip install pandas

前提是你安裝了pip,若是pip沒有安裝可以查看我之前的 文章

在VS Code中我們可以右鍵模塊名查看定義,便能看到模塊的實(shí)現(xiàn)了.不得不說VS Code很強(qiáng)大,希望微軟能這么一直走下去,走向開源走向跨平臺(tái)!!

然后我隨便提取了《心靈捕手》豆瓣網(wǎng)評(píng),放在了txt中:

其實(shí)大多數(shù)情況下,大陸的譯名比港譯要更有味道。

It is not ur fault!

我是在電視上偶爾才看到這個(gè)電影的,當(dāng)時(shí)看的時(shí)候真的很感人。 為什么會(huì)有這么天才的人,卻有著這樣子曲折的人生。
是認(rèn)為劇本很好卻沒有被完全拍出來:) 對(duì)演員的表演還是心存質(zhì)疑一點(diǎn)點(diǎn)~ 呵呵

好評(píng)

前幾日剛剛看過,一部觸動(dòng)心靈的電影,尋找真正的人生

這篇影評(píng)寫的很棒,我的眼睛濕潤了

很好的片子

最后就是處理的程序了:

            
from snownlp import SnowNLP
import pandas as pd
import pylab as pl
txt = open('F:/_analyse_Emotion.txt')
text = txt.readlines()
txt.close()
print('讀入成功')
sentences = []
senti_score = []
for i in text:
  a1 = SnowNLP(i)
  a2 = a1.sentiments
  sentences.append(i) # 語序...
  senti_score.append(a2)
  print('doing')
table = pd.DataFrame(sentences, senti_score)
# table.to_excel('F:/_analyse_Emotion.xlsx', sheet_name='Sheet1')
# ts = pd.Series(sentences, senti_score)
# ts = ts.cumsum()
# print(table)
x = [1, 2, 3, 4, 5, 6, 7, 8]
pl.mpl.rcParams['font.sans-serif'] = ['SimHei']
pl.plot(x, senti_score)
pl.title(u'心 靈 捕 手 網(wǎng) 評(píng)')
pl.xlabel(u'評(píng) 論 用 戶')
pl.ylabel(u'情 感 程 度')
pl.show()
          

最后的效果:

python snownlp情感分析簡易demo(分享)_第1張圖片

可能有些不準(zhǔn)確,我也是隨便提取的數(shù)據(jù),不過snownlp還是號(hào)稱情感分析準(zhǔn)確很高的!

以上這篇python snownlp情感分析簡易demo(分享)就是小編分享給大家的全部內(nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號(hào)聯(lián)系: 360901061

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長非常感激您!手機(jī)微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對(duì)您有幫助就好】

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會(huì)非常 感謝您的哦!!!

發(fā)表我的評(píng)論
最新評(píng)論 總共0條評(píng)論
主站蜘蛛池模板: 扶绥县| 马公市| 大田县| 凤阳县| 英德市| 孟村| 武冈市| 新沂市| 思南县| 稻城县| 宕昌县| 临潭县| 大宁县| 桓台县| 怀柔区| 衡阳市| 土默特左旗| 鞍山市| 襄汾县| 文化| 高青县| 绩溪县| 噶尔县| 金湖县| 清水县| 南开区| 宁南县| 伽师县| 东辽县| 保靖县| 永顺县| 乐陵市| 甘谷县| 抚州市| 普格县| 自治县| 山西省| 七台河市| 霞浦县| 雷州市| 称多县|