如何用python为一个文章打标签
答案:1 悬赏:40 手机版
解决时间 2021-11-30 09:59
- 提问者网友:遁入空寂
- 2021-11-30 06:09
如何用python为一个文章打标签
最佳答案
- 五星知识达人网友:拾荒鲤
- 2021-11-30 07:35
所以说你真的就把pandas 当读取数据的工具了吗..
增加了一列is_tobacco 作为你说的标记
filter_query 返回含有这些词的列表 效率有一定提升
其次你可以分割后用 multiprocessing 执行 这个加速起来不止一点半点
import pandas as pd
word = pd.read_table('test.txt', encoding = 'utf-8', names = ['query'])
def signquery(word):
tobacco = [u'烟', u'白沙', u'黄金叶', u'利群', u'南京九五', u'黄鹤楼软', u'黄鹤楼硬', u'娇子', u'钻石荷花', u'玉溪', u'七匹狼尚品', u'七匹狼软灰']
word['is_tobacco'] = word['query'].apply(lambda name:name in tobacco)
return word
def filter_query(word):
tobacco = [u'烟', u'白沙', u'黄金叶', u'利群', u'南京九五', u'黄鹤楼软', u'黄鹤楼硬', u'娇子', u'钻石荷花', u'玉溪', u'七匹狼尚品', u'七匹狼软灰']
return word[word['query'].apply(lambda name:name in tobacco)]['query'].to_dict().values()
result = filter_query(word)
print result
增加了一列is_tobacco 作为你说的标记
filter_query 返回含有这些词的列表 效率有一定提升
其次你可以分割后用 multiprocessing 执行 这个加速起来不止一点半点
import pandas as pd
word = pd.read_table('test.txt', encoding = 'utf-8', names = ['query'])
def signquery(word):
tobacco = [u'烟', u'白沙', u'黄金叶', u'利群', u'南京九五', u'黄鹤楼软', u'黄鹤楼硬', u'娇子', u'钻石荷花', u'玉溪', u'七匹狼尚品', u'七匹狼软灰']
word['is_tobacco'] = word['query'].apply(lambda name:name in tobacco)
return word
def filter_query(word):
tobacco = [u'烟', u'白沙', u'黄金叶', u'利群', u'南京九五', u'黄鹤楼软', u'黄鹤楼硬', u'娇子', u'钻石荷花', u'玉溪', u'七匹狼尚品', u'七匹狼软灰']
return word[word['query'].apply(lambda name:name in tobacco)]['query'].to_dict().values()
result = filter_query(word)
print result
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
推荐资讯