扫码手机阅读

穿越:2014

作者:猪熊 | 分类:都市 | 字数:119.8万

第271章 曲高和寡也是一种无奈

书名:穿越:2014 作者:猪熊 字数:2220 更新时间:2024-12-20 20:49:00

在今生复刻人工智能,因为人工智能所具备的深度学习、跨界融合等特征。

同样在今生人工智能依旧有可能在对经济发展、社会进步、国际政治格局等方面产生重大而深远的影响。

总之,人工智能即将到来的新浪潮不至于技术革新。

某种程度上,将人工智能即将到来的新浪潮称作是一场另类的革命也是不过分的。

这样的一场另类的革命显然不是仅靠林灰自身就推得动的。

仅仅是林灰本人的话。

或许林灰能不断的搬运技术。

但技术落地什么的仅靠林灰自己可是不行的。

技术落地的话还是需要很多志同道合的人。

甚至是后期的一些技术搬运除非林灰有足够的学术地位。

否则即便是搬运可能也需要一些帮手才能增强技术本身的说服力。

毕竟很多时候技术层面的事情并不是搞出来就有人知道其相应的含意。

曲高和寡有时也是一种无奈。

尽管这些都是以后的事情了。

但林灰相信这一天终将到来,甚至是未来已经在来的路上了。

那是一个值得期许的未来。

就尹芙·卡莉所表述的内容。

说实话无论是尹芙·卡莉就林灰对论文中补充内容表露出的浓厚兴趣还是对人工智能未来的期许和担忧,这些都不怎么出乎林灰的预料,倒是尹芙·卡莉对于此前林灰收购她专利的用途所进行的猜测让林灰稍稍有点意外。

按照尹芙·卡莉的猜测,林灰之所以收购她搞出的《文本判断甄别比较的一种新方法》这项专利是想在自动文本摘要框架(涵盖内容表示、权重计算、内容选择和内容组织四部分任务)之下的内容表示方面做文章。

呃,不得不说,尹芙·卡莉还真是一个聪明的人。

居然这么快就能够意会到林灰为什么要进行这样的一项收购。

林灰还以为他身后那些追赶者还要很久才能领悟呢。

没想到居然这么快就被尹芙·卡莉领悟了一部分。

不过尹芙·卡莉尽管猜对了,但却只是猜对了一部分,并没完全对。

林灰为什么给出这样的评价呢?

尹芙·卡莉所谓的“内容表示”指的是在自动文本摘要的流程中将原始文本划分为文本单元的过程。

这一过程包含有分字、词、句等预处理工作;

其主要目的是通过预处理将原始文本处理成算法容易进行分析的形式。

传统的抽取式摘要这样传统自动文本摘要不怎么注重内容表示这一环节。

生成式文本摘要和传统的抽取式摘要关于这部分则稍稍有些不同。

生成式文本摘要还是比较注重内容表示这一环节的。

尤其是应用了词嵌入技术和预训练机制的生成式文本摘要更是格外注重“内容表示”这一环节。

没办法,不得不重视,传统的文本摘要各步骤的重要程度其实是差不多的。

但应用了词嵌入技术和预训练机制的生成式文本摘要的工作很多时候都是“头重脚轻”的。

即开始的环节在整个环节中权重是最高的。

或者说在实际构建生成式文本摘要模型的时候,虽然要设计到很多的步骤。

但通常情况下越靠前的工作也往往更重要。

就以“内容表示”来说吧,在构建生成式文本摘要模型的时候。

很多时候内容表示的完成水平的高下将直接影响到后续的步骤。

而尹芙·卡莉所搞得《文本判断甄别比较的一种新方法》这项专利在内容表示方面确实有一定的价值。

借助于该专利所提供的价值,林灰以后在进行文本摘要的后续升级换代的过程中可以少一些逻辑层面的漏洞。

但如果仅仅是因为这点价值,还不足以让林灰大费周章进行一项跨国专利的收购。

林灰之所以煞费苦心将尹芙·卡莉搞出的《文本判断甄别比较的一种新方法》这项专利最最根本的原因还是因为林灰比较在意尹芙·卡莉在这一专利中所应用的模型。

在《文本判断甄别比较的一种新方法》这项专利中就文本甄别尹芙·卡莉极其有创意地鼓捣出一个用于文本判断甄别的模型。

如果仅仅就自然语言处理机器学习方面来看,这不过只是一个平平无奇的用于文本判别的模型。

但当思维跳脱出自然语言处理这个小领域之后,这个模型可不能够等闲视之。

当初在翻阅这个时空的学术方面的一些资料时,林灰敏锐地注意该专利所蕴含的价值。

尽管专利所提供的技术路线很多时候都是概要性的。

一些后来者在按照这些技术路线去体悟技术的时候往往只能盲人摸象般的探索。

在拥有前世信息的情况下,林灰相当于站在巨人的肩膀上,

虽然偶尔会有些高处不胜寒的感觉,但具体到技术方面的时候林灰往往系统概念更强。

很多时候,林灰只消看到一些公开的技术路线就能了解到其背后所蕴含的价值。

并且这种判断基本是八九不离十。

当初接触到尹芙·卡莉搞得这个专利时。

林灰发现根据该专利已经公开的一些资料尤其是该专利公开提及的技术路线。

林灰很快捕捉到这个专利的价值。

林灰料定利用这个模型几乎稍加变形就能在此基础上形成一种颇为高效的判别式模型。

雅文库

事实是后来进行的收购进一步了解了专利信息后更是印证了此前林灰对之的猜测。

仅仅是判别式模型即便是效率高或许没啥意义。

但是稍微做点小改动那事情就不一样了。

当高效的判别式模型邂后高效的生成式模型。

此二者进行有机结合,并在此基础上再继续进行一定的专门架构之后。

完全可以藉此搞出全新的效率颇高的深度学习模型。

这个深度学习模型在前世有个大名鼎鼎地称呼:

——生成对抗网络(GAN)

生成对抗网络由一个生成网络与一个判别网络组成。

生成网络从潜在空间中随机取样作为输入,其输出结果需要尽量模彷训练集中的真实样本。

判别网络的输入则为真实样本或生成网络的输出,其目的是将生成网络的输出从真实样本中尽可能分辨出来。