永发信息网

如何评价今日头条研发的写稿机器人Xiaomingbot

答案:2  悬赏:30  手机版
解决时间 2021-11-26 12:30
如何评价今日头条研发的写稿机器人Xiaomingbot
最佳答案
看了一下这个项目团队发表在ACL2016论文,其实是一个句子选取(sentence selection)的问题,主要工作是从体育赛事的文字直播中选取重要的句子组合成一篇针对该场比赛的新闻报道。
实验数据集:150场足球赛事的新浪和网易文字直播(live text commentary scripts)+对这150场比赛正式的新闻报道(gold-standard news)
数据特点:文字直播部分,单场比赛平均242句,计4590字;正规新闻部分,单场比赛平均32句,1185字
实验过程:该问题是一个有监督学习的过程,文字直播部分作为训练集和测试集的输入,输入特征向量x是人工设定的若干维数值,用于对每一句话的向量表示,标签y由正规新闻产生。所以由此训练出一个learning to rank模型,可以对文字直播中的每一句话生成一个分值代表其重要性,根据分值选出一定数量的句子,再经过去冗余过程组合成一则新闻。
所以那句“失败女神朝其抛出了橄榄枝”确实是有问题的。首先,文字直播是人写的,人肯定不会写出这种句子,其次,既然AI写新闻本质上是从直播中选句子,那肯定也不会包含这句没有来由的话。
这是仅根据该论文的一点想法,也许他们在实际应用中加了一些别的方法,但目前所谓“人工智能取代编辑或者取代记者”都是新闻界的朋友自己吓自己,毕竟训练出来的智能还只是对已有材料的二次加工而已。
全部回答
看了一下这个项目团队发表在ACL2016论文,其实是一个句子选取(sentence selection)的问题,主要工作是从体育赛事的文字直播中选取重要的句子组合成一篇针对该场比赛的新闻报道。

实验数据集:150场足球赛事的新浪和网易文字直播(live text commentary scripts)+对这150场比赛正式的新闻报道(gold-standard news)
数据特点:文字直播部分,单场比赛平均242句,计4590字;正规新闻部分,单场比赛平均32句,1185字
实验过程:该问题是一个有监督学习的过程,文字直播部分作为训练集和测试集的输入,输入特征向量x是人工设定的若干维数值,用于对每一句话的向量表示,标签y由正规新闻产生。所以由此训练出一个learning to rank模型,可以对文字直播中的每一句话生成一个分值代表其重要性,根据分值选出一定数量的句子,再经过去冗余过程组合成一则新闻。

所以那句“失败女神朝其抛出了橄榄枝”确实是有问题的。首先,文字直播是人写的,人肯定不会写出这种句子,其次,既然AI写新闻本质上是从直播中选句子,那肯定也不会包含这句没有来由的话。
这是仅根据该论文的一点想法,也许他们在实际应用中加了一些别的方法,但目前所谓“人工智能取代编辑或者取代记者”都是新闻界的朋友自己吓自己,毕竟训练出来的智能还只是对已有材料的二次加工而已。
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
宝宝眼睛为什么会这样
什么东西和白色有关
新村地址在什么地方,我要处理点事!
在潍坊开间酒吧要花多少钱?
外研社的专八复习系列有谁用过么?比起星火系
怎么能用全站仪测得附合导线的左角?请高手指
81年的木女,84年的金男结婚好吗
有一个中文歌,歌词是love you beby,在街上
给亡妇的赏读
太谷简单装修下多少钱,85平米下来5万足够了
乒乓球中调高球加转怎么接
特陶卫浴(广汉南门店)地址好找么,我有些事要
k8287次列车04车厢座位表
我从未当过班干部,说明我没有这方面的能力。
东升村地址在什么地方,我要处理点事!
推荐资讯
韩山林的字多少钱一平尺啊
陕西咸阳市北塬一路以北的经一路经二路在什么
鹤湖老年协会地址在什么地方,想过去办事,
请问这个紫砂壶的底款是什么!
我有脚拇外翻,不大,可以每天晚上按摩吗
烧烤牛肉筋和牛外脊哪个好吃?
你对全科教师有什么看法?
中华钙果是不是骗人的
中国的国际邮政编码是多少?
十八个房间宾馆每月用七十吨水生意怎么样
求延世韩国语电子版
沉香和丁香哪个顺气好些
正方形一边上任一点到这个正方形两条对角线的
阴历怎么看 ?