国产成人AV无码一二三区,少女1到100集,国产精品久久久久精品综合紧,巜公妇之诱感肉欲HD在线播放

文章 > Python基础教程 > Python中Tf-idf文本特征的提取

Python中Tf-idf文本特征的提取

Python Tf-idf

头像

小妮浅浅

2021-09-15 09:25:473836浏览 · 0收藏 · 0评论

说明

1、TF-IDF是如果词或词组出现在文章中的概率较高,而在其他文章中很少出现,那么它就被认为具有很好的类别区分能力,适合进行分类。

2、提取文本特征,用来评估字词对文件集或某个语料库中文件的重要性。

实例

def tfidf_demo():
    """
    用tfidf的方法进行文本特征提取
    :return:
    """
    # 1.将中文文本进行分词
    data = ["一种还是一种今天很残酷,明天更残酷,后天很美好,但绝对大部分是死在明天晚上,所以每个人不要放弃今天。",
            "我们看到的从很远星系来的光是在几百万年之前发出的,这样当我们看到宇宙时,我们是在看它的过去。",
            "如果只用一种方式了解某样事物,你就不会真正了解它。了解事物真正含义的秘密取决于如何将其与我们所了解的事物相联系。"]
    data_new = []
    for sent in data:
        data_new.append(cut_word(sent))
    # print(data_new)
    # 2.实例化一个转换器类
    transfer = TfidfVectorizer(stop_words=["一种", '因为'])
    # 3.调用fit_transform
    data_final = transfer.fit_transform(data_new)
    print("data_new:\n", data_final.toarray())
    print("特征名字:\n", transfer.get_feature_names())
    return None

以上就是Python中Tf-idf文本特征的提取,希望对大家有所帮助。更多Python学习指路:python基础教程

本文教程操作环境:windows7系统、Python 3.9.1,DELL G3电脑。

关注

关注公众号,随时随地在线学习

本教程部分素材来源于网络,版权问题联系站长!

坤坤寒进桃子里在线看歌词| 姐姐片多多免费高清电视剧叶玉卿| 老人玩小处雌女视频的意义| 亚洲人成色777777在线播放| 入室強暴強焱人妻| 女性抹胸开襟哺乳衣的注意事项| BUBBLE| 少女与狗2在线观看免费版高清| 他扒开我小流添我三男一女视频| 免费视频在线观看人数在哪直播| 绝色儿媳在线观看免费版电视剧| 首长在书房含我奶头高H漫画| 腹肌体育生导管网站| 女的高潮过后第二次需要多久恢复| 法国色情《宝贝宝贝3| 妈妈的闺蜜韩剧结局原声在线观看..| 黑料门今日黑料最新| 好闺蜜4| 他的大手在秘密花园小说免费阅读 | 刘老汉的儿媳小雪的背景资料| 小说适合晚上看的书| 双乳压在落地窗前做H| 强伦轩特级A片免费播放女的老师| 法国《监狱伦理3》| 下面的小嘴又饿了| 雨后小故事GIF| 针锋对决小说未删减全文阅读| 门卫秦大爷1-42章免费阅读| 麻豆精品无码少妇久久爽爽网站| 洪真英| 《医务室上垒》动漫全集在线观看| 法国人妻亂伦| 咬女生小头头视频| 国产老熟妇精品观看| 已满十八岁从进入戴好耳机的| 麻花星空天美MV免费观看电视剧| 茉莉花| 亚洲美女| 400部精品国偷自产在线| 班长哭了能不能再抠游戏里面的钱 | 《厨房激战5》完整版在线观看