永发信息网

如何用python为一个文章打标签

答案:1  悬赏:40  手机版
解决时间 2021-11-30 09:59
如何用python为一个文章打标签
最佳答案
所以说你真的就把pandas 当读取数据的工具了吗..
增加了一列is_tobacco 作为你说的标记
filter_query 返回含有这些词的列表 效率有一定提升
其次你可以分割后用 multiprocessing 执行 这个加速起来不止一点半点

import pandas as pd
word = pd.read_table('test.txt', encoding = 'utf-8', names = ['query'])

def signquery(word):
tobacco = [u'烟', u'白沙', u'黄金叶', u'利群', u'南京九五', u'黄鹤楼软', u'黄鹤楼硬', u'娇子', u'钻石荷花', u'玉溪', u'七匹狼尚品', u'七匹狼软灰']
word['is_tobacco'] = word['query'].apply(lambda name:name in tobacco)
return word

def filter_query(word):
tobacco = [u'烟', u'白沙', u'黄金叶', u'利群', u'南京九五', u'黄鹤楼软', u'黄鹤楼硬', u'娇子', u'钻石荷花', u'玉溪', u'七匹狼尚品', u'七匹狼软灰']
return word[word['query'].apply(lambda name:name in tobacco)]['query'].to_dict().values()

result = filter_query(word)

print result
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
在文山白色反毛的乌骨土鸡哪卖
寻仙财产密码怎么重新设置
男人一生只能买一枚的真爱戒指是什么样子
推荐一本有关澳洲留学的书,要实用的。
写给劳教所的一封信
歌手杨坤现在多少岁
经常熬夜或睡眠不好的人,煲什么汤滋补下比较
本田concept c概念车会不会上市
后人有诗曰:魏吴争斗______,_________,烈火
家庭的“资产负债”是多少才合理
能连接手机的微型监控
奉祀官的中兴南宗
淘宝早就已经卖空的商品,早就已经下架了,怎
最强复活尸体复活的是谁
静静地享受午后一个人独自的时光用英语怎么说
推荐资讯
家里的百兆路由器跟电脑之间的跳线用的超六类
宁波江北万达广场的地理位置
房子一共24层,是买20层好还是22层好,一样的价
玉米什么时候种
钢筋笼的图纸怎么看,刚学制作请指教指教
如何在eclipse中使用mvn clean install?
世界最贵的导弹多少钱
为什么内网的人用网络管理软件可以禁止我上网
房屋已建一层,防雷设施可否补救安装
牙疼。给我开了醋酸氯已定溶液
杰尼华菲羽绒服男装最大码是多少
非法居留阿根廷拿到上诉白条主动回国会被吊销
正方形一边上任一点到这个正方形两条对角线的
阴历怎么看 ?