华裔女性钱璐璐:用 DNA 开发人工智能神经网络,识别手写数字!

百家 作者:AI100 2018-07-22 12:14:31


“既然要学人脑的思维方式,为什么不去研究人脑?”霍金斯在《论智能》中说道。


如今,不少生物学研究者正朝着这个方向努力。


不过,请注意:这不是一次传统意义上的生物实验。


近日,据 Motherboard 等多家外媒报道,来自加州理工学院生物工程助理教授 Lu-lu Qian(钱璐璐)和她的学生 Kevin Cherry 共同开发出了一种由 DNA 制成的人工神经网络,可以正确识别分子数字。这项工作是人工智能与合成生物分子电路成功“合体”的重要里程碑。


“尽管科学家刚刚开始探索在分子机器搭载人工智能,但其潜力已无可否认,”钱璐璐说。“类似电子计算机和智能手机为人类带来了远超过去百年的影响力,人造分子机器可以让所有由分子组成的物体,甚至可能包括油漆和绷带,比未来一百年更有用,有益于环境保护。”


据了解,该论文已于 7 月 19 日发表在《Nature》纸质版杂志上。



以下为论文摘要:


从细菌沿化学梯度运动,到大脑对复杂气味信息进行区分,识别分子模式是生物有机体的重要技能。这种类型的信息处理方式已经能由基于 DNA 制成的神经网络完成,不过,这仅限于 4 种 4 位的不同 DNA 分子。“赢者通吃”(winner takes all)的竞争策略被认为有望提高 DNA 神经网络的能力。与之前使用的线性阈值和 Hopfield 网络相比,“赢者通吃”的计算能力更强,可由单一分子完成,且不受模型数量和复杂性的影响。所以,无论是大量的单一模型,还是少量的复杂模型都能被识别。


据介绍,


Lu-lu Qain 和 Kevin Cherry 将这一数字增加到 9 种 100 位的图案,研究小组设计的人工神经网络能正确识别 10×10 像素网格内的 1到9 的数字。该神经网络采用“赢家通吃”来优化输出,识别数字。研究人员通过模拟手写字体的变化,倒转了 100 位中的 30 位,神经网络仍能准确“记住”图案并识别出数字。这一结果表明,分子计算电路拥有类似记忆力的能力,能够对高度复杂、杂乱的信息进行分类。


以DNA和试管为“硬件”


这里不得不提一下神经网络之父 Geoffrey Hinton 老爷子的贡献。在他看来,通过模仿人类大脑,对其大脑中神经元如何运作进行了理想化实现,并将 HintonBack Propagation(反向传播)算法应用到神经网络。目前,机器学习中的大多数前沿技术都涉及人工神经网络。


而钱璐璐实验室的工作目的就是让 DNA 构建的人工神经网络来模仿和挑战大脑神经元的能力。


简单来讲,所谓的 DNA 神经网络就是将 DNA 和试管作为构建的物理基础,就相当于我们通常所见的硅和晶体管。


众所周知,所有 DNA 都由四种碱性核苷酸组成:腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)和胸腺嘧啶(T)。一条核苷酸链与另一条链结合形成 DNA 双链,但只能以特定方式结合(即 A-T 或 C-G)。这种可预测的组合模式使得这些核苷酸成为理想的计算设备,经过设计后,它们在各种分子形态下产生特定的化学反应。


这时,通过特定化学反应产生的现象,研究人员就可以判断出该 DNA 神经网络是否正确进行了识别。这次,钱璐璐实验室挑战的是如何教人工神经网络识别手写数字。


通常情况下,这对计算机来说很难。例如,人类在写数字 4 时都会略有不同。一般人都很容易看出不同的 4 写出来的时候会有哪些相似点,机器则没有这种生物识别性。不过,要是向人工神经网络提供大量 4 的书写示例呢?算法会“学习”并对每个示例进行抽象,然后形成对 4 这个数字写法的大致概念。下一次,算法在遇到类似 4 的事物时,它会将其自己形成对 4 的概念进行比较,如何匹配度足够高,就会得出 4 的结论。



据了解,早在 2011 年,钱璐璐就用 DNA 创造了第一个人工神经网络,但它只能识别出少数模式。而此次,钱璐璐的一位研究生 Kevin Cherry 通过将其应用于手写“分子数字”的识别,大大提高了这项技术。


用合成 DNA 构建人工神经网络,能够识别分子编码的“数字”。这是经典机器学习测试的又一次创新实验。“人脑中大多有超过 800 亿个神经元,能够让人类做出非常复杂的决定。像蛔虫这样的小动物有几百个神经元,只能做出简单的决定。在这项工作中,我们设计了一套生物化学模式,其作用类似于一个小的神经元网络,对分子信息进行分类,实质上比之前更复杂。”钱璐璐说。


未来,钱璐璐实验室希望通过这种形成的记忆将有助于 DNA 神经网络执行不同任务,并改变医学测试。


实验过程


首先,每个“分子数字”是由 20 个 DNA 链构成,这些 DNA 链选自 100 个分子,每个分子代表 10×10 像素网格中任一位置。


然后,在试管中将这些 DNA 链混合在一起。试管中的 DNA 链由于全部混合在一起,因此分子在网格上呈现的位置完全靠浓度决定。当分子浓度达到一定阶段时,DNA 链就会产生特定的反应,并在 10×10 网格上形成相应的数字,这一过程即为 DNA 神经网络识别过程。


按照手写数字从 1 到 9 的样本,DNA 神经网络也分类为 9 个类别。


以数字 6 和 7 的识别过程为例。


他们测试了 36 个不同版本的手写数字,DNA 神经网络正确识别出来这些数字。



这一过程中,他们利用了 DNA 分子编码“赢者通吃”的竞争策略——DNA 神经网络通过合成所谓的“歼灭者”来区分数字。


“歼灭者与来自一个竞争者的一个分子和来自不同竞争者的一个分子形成复合物,并反应形成惰性物质,无法产生化学反应。歼灭者迅速吞噬所有竞争者的分子,直到剩下一个竞争者。然后,获胜的竞争者恢复到高浓度并产生荧光信号,表明神经网络的决策。”Cherry 表示。


重要的是,获胜者采取的方法将用于区分 DNA 试管中 1 到 9 的单个数字。例如,反应后,试管将显示两个荧光信号,绿色和黄色荧光代表 5,绿色或红色代表 9。


钱璐璐本人


早在去年,钱璐璐实验室就曾利用DNA打造了一个“小机器人”:对 DNA 进行“编程”,控制 DNA“走”到特定区域,“捡起”特定的分子,并把它们搬运到另一个地方。


据了解,钱璐璐本科研究生期间,先后在东南大学、上海交通大学就读,随后考入加州理工学院,从此开始了她长达 10 年的学习与研究生涯。


附上钱璐璐实验室链接:http://www.qianlab.caltech.edu


相关链接:

  • https://www.nature.com/articles/s41586-018-0289-6

  • https://motherboard.vice.com/en_us/article/594mvz/ai-made-from-human-dna



——【完】——


在线公开课NLP专场

精彩继续


时间:7月26日 20:00-21:00

扫描海报二维码,免费报名

添加微信csdnai,备注:公开课,加入课程交流群


关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接