永发信息网

如何利用Python对中文进行分词处理

答案:2  悬赏:60  手机版
解决时间 2021-12-31 20:48
如何利用Python对中文进行分词处理
最佳答案
pip install -U textblob#英文文本的情感分析
pip install snownlp#中文文本的情感分析

from snownlp import SnowNLP
text = "I am happy today. I feel sad today."
from textblob import TextBlob
blob = TextBlob(text)
TextBlob("I am happy today. I feel sad today.")
blob.sentiment
Sentiment(polarity=0.15000000000000002, subjectivity=1.0)


s = SnowNLP(u'这个东西真心很赞')

s.words         # [u'这个', u'东西', u'真心',
                #  u'很', u'赞']

s.tags          # [(u'这个', u'r'), (u'东西', u'n'),
                #  (u'真心', u'd'), (u'很', u'd'),
                #  (u'赞', u'Vg')]

s.sentiments    # 0.9769663402895832 positive的概率

s.pinyin        # [u'zhe', u'ge', u'dong', u'xi',
                #  u'zhen', u'xin', u'hen', u'zan']

s = SnowNLP(u'「繁体字」「繁体中文」的叫法在台湾亦很常见。')

s.han           # u'「繁体字」「繁体中文」的叫法
                # 在台湾亦很常见。'
全部回答
1、全局变量在函数中使用时需要加入global声明 2、获取网页内容存入文件时的编码为ascii进行正则匹配时需要decode为gb2312,当匹配到的中文写入文件时需要encode成gb2312写入文件。 3、中文字符匹配过滤正则表达式为ur'[\u4e00-\u9fa5]+',使用findall找到所有的中文字符存入分组 4、key,value值可以使用dict存储,排序后可以使用list存储 5、字符串处理使用split分割,然后使用index截取字符串,判断哪些是名词和动词 6、命令行使用需要导入os,os.system(cmd)
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
孩子今年初二,数学跟不上,怎么办
扇字部首是什么
蘑菇卫星天线可以用到家里吗
钟山县财政局办公位置在哪啊?好找么?
问道法金怎么加点我 现在是70及 60前是3灵一
黑色衬衣配什么裤子好啊?
五十铃钥匙打开一直报警什么情况
昭平县财政局办公地址在什么地方?我要处理点
据中国旅游研究院最新统计数据显示,今年中秋
下列实验操作中正确的是A.蒸发操作时,应使混
能量高的食物容易胖吗
判断题能够运动的物体就一定是生物.
八步区财政局地址在哪?我要去那里办事
淘宝联盟本月结算预估收入什么时候能提现
高中语文必修一、必修二文言文一词多义、重点
推荐资讯
雅思备考经验
农行胜利支行地址在哪?我要去那里办事
将乐县黄潭派出所在什么地方啊,我要处理点事
把多项式:x2y-1+2xy2-3x3按x的升幂排列为___
怎样理解 二极管类相关 的共阴极 和 共阳极
阿拉伯男子的传统打扮是身着白色宽大的长袍、
担挑是哪的方言
小米手机的私密相册怎么看
为什么不同电脑2010CAD上画的100的直线不一样
三星帐户会话己过期,除了wifi其他都不能用怎
单选题导致我国南北方耕作制度不同的主要因素
熙可以组词春风和熙吗?
正方形一边上任一点到这个正方形两条对角线的
阴历怎么看 ?