日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

python調(diào)用hanlp進(jìn)行命名實體識別

系統(tǒng) 1779 0
閱讀更多

?

?

本文分享自 ?6 丁一的貓 的博客,主要是 python 調(diào)用 hanlp 進(jìn)行命名實體識別的方法介紹。以下為分享的全文。

1 python jdk 版本位數(shù)一致

2 pip install jpype1 python3.5

3 、類庫 hanlp.jar 包、模型 data 包、配置文件 hanlp.properties 放在一個新建目錄

4 、修改 hanlp.properties root 根目錄,找到 data

?

?

代碼調(diào)用如下:

?

1| #coding:utf-8

2| '''

3| Created on 2017-11-21

4|

5| @author: 劉帥

6| '''

7|

8|

9| from jpype import *

10|

11| startJVM(getDefaultJVMPath(), "-Djava.class.path=D:\hanlp\hanlp-1.3.4.jar;D:\hanlp", "-Xms1g", "-Xmx1g") # 啟動 JVM Linux 需替換分號 ; 為冒號 :

12| HanLP = JClass('com.hankcs.hanlp.HanLP')

13| # 中文分詞

14| print(HanLP.segment(' 你好,歡迎在 Python 中調(diào)用 HanLP API'))

testCases = [

15| ????" 商品和服務(wù) ",

16| ????" 結(jié)婚的和尚未結(jié)婚的確實在干擾分詞啊 ",

17| ????" 買水果然后來世博園最后去世博會 ",

18| ????" 中國的首都是北京 ",

19| ????" 歡迎新老師生前來就餐 ",

20| ????" 工信處女干事每月經(jīng)過下屬科室都要親口,交代 24 口,交換機等技術(shù)性器件的安裝工作 ",

21| ????" 隨著頁游興起到現(xiàn)在的頁游繁盛,依賴于存檔進(jìn)行邏輯判斷的設(shè)計減少了,但這塊也不能完全忽略掉。 "]

22| for sentence in testCases: print(HanLP.segment(sentence))

23| # 命名實體識別與詞性標(biāo)注

24| NLPTokenizer = JClass('com.hankcs.hanlp.tokenizer.NLPTokenizer')

25| print(NLPTokenizer.segment(' 中國科學(xué)院計算技術(shù)研究所的宗成慶教授正在教授自然語言處理課程 '))

26| # 關(guān)鍵詞提取

27| document = " 水利部水資源司司長陳明忠 9 29 日在新聞辦舉行的新聞發(fā)布會上透露, " \

28| ???????????" 根據(jù)剛剛完成了水資源管理制度的考核,有部分省接近了紅線的指標(biāo), " \

29| ???????????" 有部分省超過紅線的指標(biāo)。對一些超過紅線的地方,陳明忠表示,對一些取用水項目進(jìn)行區(qū)域的限批, " \

30| ???????????" 嚴(yán)格地進(jìn)行水資源論證和取水許可的批準(zhǔn)。 "

31| print(HanLP.extractKeyword(document, 2))

32| # 自動摘要

33| print(HanLP.extractSummary(document, 3))

34| # 依存句法分析

35| print(HanLP.parseDependency(" 徐先生還具體幫助他確定了把畫雄鷹、松鼠和麻雀作為主攻目標(biāo)。 "))

36| shutdownJVM()

?

結(jié)果如下:

?

1| [ 你好 /vl, /w, 歡迎 /v, /p, Python/nx, /f, 調(diào)用 /v, HanLP/nx, /ude1, API/nx]

2| [ 商品 /n, /cc, 服務(wù) /vn]

3| [ 結(jié)婚 /vi, /ude1, /cc, 尚未 /d, 結(jié)婚 /vi, /ude1, 確實 /ad, /p, 干擾 /vn, 分詞 /n, /y]

4| [ /v, 水果 /n, 然后 /c, /vf, 世博園 /n, 最后 /f, /vf, 世博會 /n]

5| [ 中國 /ns, /ude1, 首都 /n, /vshi, 北京 /ns]

6| [ 歡迎 /v, /a, /a, 師生 /n, 前來 /vi, 就餐 /vi]

?

?


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯(lián)系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發(fā)表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 英超| 革吉县| 高州市| 新安县| 资溪县| 江西省| 龙口市| 彩票| 江油市| 中山市| 任丘市| 平昌县| 景德镇市| 阳原县| 五大连池市| 施秉县| 江达县| 辽源市| 小金县| 陇川县| 凌源市| 禹城市| 武川县| 安阳市| 蓝山县| 临高县| 中西区| 扎鲁特旗| 望江县| 蒙阴县| 浦江县| 洮南市| 平乡县| 福海县| 富民县| 兴宁市| 卓资县| 江口县| 宝应县| 古浪县| 正阳县|