永发信息网

python 或c++ 中文命名实体识别开源工具有哪些??

答案:2  悬赏:40  手机版
解决时间 2021-11-09 21:35
python 或c++ 中文命名实体识别开源工具有哪些??
最佳答案
一、NLTK进行分词

用到的函数:

nltk.sent_tokenize(text) #对文本按照句子进行分割

nltk.word_tokenize(sent) #对句子进行分词

二、NLTK进行词性标注

用到的函数:

nltk.pos_tag(tokens)#tokens是句子分词后的结果,同样是句子级的标注

三、NLTK进行命名实体识别(NER)

用到的函数:

nltk.ne_chunk(tags)#tags是句子词性标注后的结果,同样是句子级

上例中,有两个命名实体,一个是Xi,这个应该是PER,被错误识别为GPE了; 另一个事China,被正确识别为GPE。

四、句法分析

nltk没有好的parser,推荐使用stanfordparser

但是nltk有很好的树类,该类用list实现

可以利用stanfordparser的输出构建一棵python的句法树
全部回答
“命名实体”是named entity吗?追问是呀,您知道有哪些开源工具吗?针对中文的追答似乎python的NLTK可以胜任,题主可以再仔细查一下。
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
恰秀路派出所15号六方城警务站办公地址在什么
午山子向风水详解
k丨w一tlo0荣耀手机多少钱
西安到府谷的汽车票需要提前买吗
钻井液失水量大对切力有什么影响
一次性补缴9年的养老金, 应选高、中、底哪一
津南区怡泽轩怎么去坐130
为什么佛教重视母亲节
看透人情却不世故,褪去稚嫩仍旧单纯什么意思
shmily的情侣英文名
尿道损伤怎么办?急!!!
明源交规培训中心地址好找么,我有些事要过去
是牛筋底耐磨,还是橡胶底的鞋更耐磨?
带有廊字的四字词语
亲水性铝箔能用水洗吗?
推荐资讯
求解这条方程
“声音在空气中传播的速度是340m/s”这种
转基因大豆与非传基因大豆从外观上如何区别?
美丽联盟加盟电话
matlab里怎样把1以转换成浮点数3F 80 00 00或
runningman金钟国和宋智孝两个人一起赢了的有
神舟笔记本电脑综合品质如何?有哪些优缺点?
数码印花车间操作规则
中鲁时空网吧地址好找么,我有些事要过去,
(2011?贵阳)清晨,我们常会看到一些晶莹剔
连城县行政学校地址好找么,我有些事要过去,
右脚背莫名疼痛,时不时会这样,绷紧或按一下
正方形一边上任一点到这个正方形两条对角线的
阴历怎么看 ?