国产成人AV无码一二三区,少女1到100集,国产精品久久久久精品综合紧,巜公妇之诱感肉欲HD在线播放

文章 > Python基础教程 > Python如何使用Spacy进行分词

Python如何使用Spacy进行分词

Python Spacy

头像

小妮浅浅

2021-07-29 09:42:355802浏览 · 0收藏 · 0评论

说明

1、Spacy语言模型包含一些强大的文本分析功能,如词性标记和命名实体识别。

2、导入spacy相关模块后,需要加载中文处理包。然后读小说数据,nlp处理天龙八部小说,包括分词、定量、词性标注、语法分析、命名实体识别,用符号/分隔小说。最后,通过is_stop函数判断单词中的单词是否为无效单词,删除无效单词后,将结果写入txt文件。

实例

import spacy
import pandas as pd
import time
from spacy.lang.zh.stop_words import STOP_WORDS
 
nlp = spacy.load('zh_core_web_sm')
 
def fenci_stopwords(data,newdata1):
    fenci = []
    qc_stopwords =[]
 
    article = pd.read_table(data,encoding="utf-8")
    start1 = time.time()
    with open(newdata1,'w',encoding='utf-8') as f1:
        for i in article["天龙八部"]:#分词
            doc = nlp(i)
            result1 = '/'.join([t.text for t in doc])
            fenci.append(result1)
 
  for j in fenci:#去除停用词   
            words = nlp.vocab[j]    
            if words.is_stop == False:        
                qc_stopwords.append(j)
                result2 = '/'.join(qc_stopwords)
                f1.write(result2)
    end1 = time.time()
    return end1-start1

以上就是Python使用Spacy进行分词的方法,希望对大家有所帮助。更多Python学习指路:python基础教程

本文教程操作环境:windows7系统、Python 3.9.1,DELL G3电脑。

关注

关注公众号,随时随地在线学习

本教程部分素材来源于网络,版权问题联系站长!

CSGO暴躁少女高清大片| 东北老肥熟口味重的原因分析| 老公把舌头放进我B里揽拌| 妈妈叫我老公我叫妈妈的名字| 吻戏高潮| 窝窝影院在线观看免费播放电视剧| 50多岁熟妇泻火原因处理方法| 他扒开我小流添我三男一女视频| 青丝影院大全免费2023年新版| 《被夫の上司持久侵犯》| 美国色情巜做爰4| 麦子交换2免费完整版| 傲娇受| 健身教练压腿压进去会怎么样| 已满十八岁免费观看电视剧| 美丽小洞5荷尔蒙| 一字马扣出水来的下一句怎么接| 《尼姑春心荡漾》大结局| 15岁女初中生免费观看电视剧| 巜催情精油按摩2高潮| 《请好好疼爱里面》免费观看| 白日梦我小说全文免费阅读| 羞答答在线观看免费高清电视剧 | 把老婆闺蜜干了俩次| 绝色儿媳在线观看免费版电视剧| 《肉体暴力强伦轩》| 女性一晚上3次纵欲导致不孕| 禁忌1蜜桃熟了| 姐姐片多多免费高清电视剧叶玉卿| 大度亲吻原声视频| 巨乳娘| 异界茅山学徒| 小婕子太紧了太深了| 入室强伦轩人妻电影| 7777777亚洲和欧洲尺码表| 妻子在厨房被三个男人欺负的后果| 孕妇| 拍美女屁股| 深度开发1V6笔趣阁金银花露| 啵啵浏览器| 被灌满精子的女人会得白血病吗