如何评价今日头条研发的写作机器人Xiaomingbot?

看看这个项目组在ACL2016发表的论文,其实就是一个选句问题。主要工作是从体育赛事的文字直播中选取重要的句子,组合成一篇比赛的新闻报道。

实验数据集:150场足球比赛的现场文字解说脚本)+150场足球比赛的官方新闻报道。

数据特点:在直播文本部分,单场比赛242句,占4590字;常规新闻板块,单场平均32句,1185字。

实验过程:这个问题是一个有监督的学习过程。实时文本部分被用作训练集和测试集的输入。输入的特征向量X是手动设置的多个维度,用于每个句子的向量表示,标签Y由常规新闻生成。因此,训练了一个学习排序模型,它可以为文字直播中的每一句话生成一个分数来代表其重要性,根据分数选择一定数量的句子,然后通过去除冗余的过程组合成一条新闻。

所以“失败女神向其抛出橄榄枝”这句话确实有问题。首先,文字直播是人写的,人肯定不会写这样的句子。其次,AI既然本质上是通过从直播中选句来写新闻,当然不会无缘无故地收录这句话。

这只是基于本文的想法。也许他们在实际应用中加入了一些其他方法,但目前所谓的“人工智能取代编辑或记者”都是新闻界的朋友自己吓唬自己。毕竟训练出来的智能只是对现有材料的二次加工。