文/水哥
过去两年里人工智能显然成了计算机科学领域的落地大户,尤其是在消费级市场,越来越多的AI产品为大众用户所体验和认知,写稿机器人就是一个最招人热议的话题。
说起让AI写稿,一开始大多数小编是拒绝的,但是越来越多的写稿机器人投入一线运作的事实让媒体工作者不得不承认这一领域正在发生的变化。比如国外的雅虎、福布斯、纽约时报等早早启用了机器写稿,国内的AI写稿虽然姗姗来迟但落地迅速,其写稿速度、稿件质量丝毫不逊色于前者。
AI的新闻生产并不依赖现场采集取材成稿,而主要通过数据挖掘、逻辑分析、模板框架的组合优化生成。从机器写稿的表现来看,尽管目前AI尚不具备人工编辑的深度和个性化写作,但是机器的学习能力很强,AlphaGo的迭代速度大家有目共睹,由此延伸出的问题是,未来写稿AI的能力进化会上升到什么程度?写稿机器人会否彻底取代人工编辑?
是什么让写稿机器人大行其道?
众所周知,人工神经网络和深度学习是当下人工智能技术的研究前沿,而目前的产品落地也主要聚焦二者。大多数写稿机器主要采用NLP(自然语言处理)技术与深度学习,前者擅长文本处理和语言逻辑,后者则是机器学习的主要实现工具。
现代人工智能往往由早期专家系统过渡而来,但其实质早已天差地别。专家系统在上世纪80年代曾一度风靡,它能够依据知识库经规则计算推演解决专业领域的问题,因而极度依赖逻辑编程语言Prolog,其本身并不具备学习能力。写稿机器的NLP借鉴了专家系统的算法,在自然语言的结构生成、摘要构建、文本推荐和文档规划方面效果明显,然而,若没有深度学习的加持,写稿AI的智商将被拉低数个档位。
深度学习的一个优点是非监督式学习或半监督式学习,它可以从更多的无标签数据中提取特征,相对于手工输入特征的监督式学习,其算法更高效,应用也更广泛。事实上深度学习兼用了非监和监督式学习,前者是自下而上的学习,后者用于自上而下的调整。
深度学习的另一个优点是它的“深度”构建了神经网络的多隐层,就像人脑神经结构那般,不同的神经元处理不同的任务,神经元之间有逻辑,有层次,有分工,从信息输入到信号抽象,抽象的程度从低级传导向高级。深度学习的中间网络有赖于此,没有足够的“深度”就不能完成足够复杂的任务。这就解释了为什么近几年深度学习兴起之后AI的智商成指数级增长,以至于写稿机器人有能力体面地工作在大众的眼皮底下。
还有什么是写稿机器人不能做的?
写稿机器人目前主要专注的领域多为财经、体育和一般的新闻报道,而且稿件文档结构简单,注重数据表现和客观的文本摘要。由此我们可以轻易发现其弱点:缺乏主观分析和深度的逻辑思维。
由此我们重新捋一遍写稿机器的优缺点。AI写稿在速度上占优,擅长撰写简讯,比较适合层次低、重复性高的编辑劳动;缺点是不具备人工记者、编辑的主观能动,难以完成富有创造性的工作。
我们知道信息学里有一种熵值,它反映信息的不确定程度。自然语言作为信息的载体都有一个平均熵值,特别是中文在所有自然语言中的熵值还是名列前茅的。从写稿机器人当前的撰稿局限来看,AI的算法与算力仍有较大空间尚未被拓展,对于稍稍复杂的写作比如行业分析、小说、脚本之类仍然难以胜任。
机器与人工作者的差异仍然在于人工智能的历史疑问——“我们能否创造一个像人一样思考的机器”。人工智能科学家关于该问题的纠结由来已久,历史上该领域为此甚至分裂成“简约”与“芜杂”两个学派。
机器与人天然有别。人脑的信息输入源于感官,经人体神经系统传导至大脑,机器智能的发展多参照于此。但是人脑具备更加复杂的意识机制,包括激素影响情绪的产生,极其擅长非线性演绎的想象力和跳跃性思维等等,这也是机器难以企及的地方。
写稿机器人的未来进化
我们领教了AlphaGo的进化速度,在写稿机器人身上是否也会得到同样体现?以人类可以预见的未来而言,AI的进化空间非常之大,但与人脑所具有的高层次智能相比,仍然相去甚远。举例来说,2012年Google Brain项目所使用的深度神经网络内部共计10亿个节点,而人类大脑中的神经元则多达150亿之巨,其间互相连接的节点突触更是瀚若星辰。
人工智能发展历经多次起落,历史上的每次低潮都与算法的缺陷与算力的瓶颈有关,尤其是后者影响更甚。尽管如今的分布式计算解决了一些算力上的问题,但是并行计算仍不可或缺。算法可以改进,算力只能依赖周期提升,也就是说,未来人工智能发展瓶颈将逐渐消除算法上的障碍,而集中体现在算力局限上。可喜的是,GPU在AI领域的定制化异构计算同样进步很快,这为算力的持续上行给出了可靠预期。
在算力有所保障的前提下,算法将迅速作为,人工神经网络的复兴和深度学习的崛起就是最好的例证。如今互联网发展和开源社区协作加强,开发者数量剧增,这些良好的条件让人工智能的发展进程大为加速,关于AI未来发展佳况,或将产生媲美于计算机领域的摩尔定律。
文/水哥 高级工程师,科技专栏作者,中国计算机学会会员。IT评论、业界分析,不一而足。
举报/反馈

水哥

4672获赞 1万粉丝
高级工程师,科技专栏作者
CCF十二届会员代表大会代表,陈徐毅,优质科技领域创作者
关注
0
0
收藏
分享