IBM实验室:集成光子神经网络的新机遇

文章正文
发布时间:2024-07-27 02:32

原创 长光所Light中心 中国光学 收录于话题#集成光学11个

撰稿人 | Fortuner(西湖大学 博士生)

在过去的二十年里,计算领域发生了巨大的变化,硅技术扩展的饱和开始削弱摩尔定律,因此,必须开发新的架构和集成方案来维护计算性能发展的路线图。

超高带宽互联网的出现促进了一种新的“计算即服务(Computing-as-a-Service,CaaS)”云服务计算模型,并启用了新的应用程序和服务,例如视频流,社交网络和数据驱动的商业智能。从此类服务以及针对此类服务的大量数据的可用性自然产生了从中获取价值的愿望。

然而,由于这些数据中有很大一部分是有噪声的、非结构化的或不完整的,传统的统计方法很难正常工作。这重新点燃了人们对可训练算法甚至是自学习算法的兴趣。利用当下硅技术的计算能力,人们可以设计、优化和执行大型复杂的大脑架构。人工智能(AI)已经成为研发的主要领域和我们日常生活的重要组成部分。

艺术插图/来源:长春光机所,Light学术出版中心,,新媒体工作组

当今,硅基CMOS工艺被认为是实现AI硬件的基础。为了克服冯诺依曼架构的基本内存瓶颈, CMOS需要被推进到一个新的架构,并且以“超越摩尔”的方式提高其功能性。后者的一个关键方面是将大量并行的突触互连层和非线性激活函数等基本神经网络构建模块深度嵌入到基础平台中。

神经形态计算的主要任务是计算和优化神经网络中的突触,其中传入神经元的信号通过多次乘法累加(multiply-accumulate,MAC)进行加权和求和。如果我们考虑两个网络层之间的所有突触连接,这个运算最终可以表述为一个大的向量-矩阵乘法。

为了加快在深度神经网络(deep neural network,DNNs)训练和推理过程中大量矢量-矩阵乘法的计算速度,研究人员引入了硬件加速器。例如图形处理单元(graphics process units,GPUs),张量处理单元(tensor processing units,TPUs)。这样的加速器支持对MAC操作进行并行和流水线处理,从内存中获取数据并返回结果。

数据结果在不同内存位置和实际计算引擎之间来回移动,这构成了经典的冯诺依曼瓶颈,并归因于总体大量的能耗,产生大量二氧化碳(图1)。

图1. 最先进的几种用于自然语言过程的深层神经网络训练(蓝色条形图)和各种日常活动(红色条形图)的二氧化碳等效排放量的比较

图源:Nanophotonics

随着处理单元的距离的增加,内存访问变得越来越耗电,并且通过更大的访问延迟降低计算速度。此外执行算术运算的能量很大程度上取决于计算精度。

为了降低当前系统的巨大能耗,目前主要有两种解决方案:

1. 数据必须尽可能的保持在本地。

2. 操作必须以最低的可行精度进行。

因此,一个技术改善平台必须做到:

1. 克服过多的数据移动。

2. 减少信号处理开销。

3. 提供类似神经网络结构的突触连接。

近日,来自瑞士苏黎世IBM研究中心的Bert Jan Offrein等人在Nanophotonics期刊上发表综述:评述了集成光学解决方案在加速推理和人工神经网络训练方面的前景。

计算突触功能,在计算上是非常昂贵的,并且不能很好的在先进的计算平台上规模化。利用集成光学器件的线性和非线性来进行模拟信号处理,可以大幅度提高这些人工智能工作负载的性能和功率效率。集成光子学的高速运行能力为时间实时应用提供了机会,而芯片级集成为制造和封装成本效益的铺平了道路。

集成光学器件为神经形态计算提供了一些性能优势,如:形状因素、可制造性、成本、机械稳定性和可高速调制。

集成光子神经网络有哪些新机遇?

一、集成光子学RC系统

储备池计算(reservoir computing,RC)是其中一种非常适合顺序数据处理的计算概念(图2)。输入数据流被耦合到一个库,它由递归链接的神经元组成。输入信号和存储信号之间以及存储信号内部的突触连接是随机分配并保持固定的。因此RC系统构成了一种特殊类型的递归神经网络(RNN)。

图2. 储备池计算方法

图源:Nanophotonics / 图译:Fortuner(撰稿人 )

为了避免信号在库中的指数增长,对库中的权值进行了缩放,使系统满足回波状态特性。在训练过程中,只学习输出层的权值。

RC系统因其相比于一般的RNNs大大简化了训练而引起人们的兴趣。虽然简单的训练方法仍然是有益的,但在过去的几年里,深度学习方法取得了巨大的进步,使得RNNs在RC系统难以解决的复杂任务上得到了非常有效的应用。然而,RC对于神经形态系统仍然是一个有趣的概念,因为固定权重很好的映射到各种冯诺依曼器件的实现。

从电子到光学,机械以及生物,作者对块体,光纤以及集成光子RC系统进行了详细的研究。在本文,作者对集成系统进行概述。

集成光子存储系统,它的一些早期概念是围绕半导体光放大器(SOAs)所开展的。每个SOAs由于其功率饱和行为展现了一个光学非线性的性质,并具有丰富的内部动态行为。改进的体系结构在各种任务的数值模拟中展现出比传统软件更佳的性能。然而,由于SOA的功耗较大,因此这些网络的功率效率有限。

多年来,研究人员对架构进行了各种改进,通过向多个节点注入输入信号,优化输入方案,实现了更好的网络功率分配(图3)。然而,储层内的非线性,在电子域内检测和加权输出信号所带来的带宽限制和延迟,以及并行操作所需的大量光电探测器,将极大的限制这些系统的实际适用性。

图3. 两种集成的光子储层计算架构

图源:Nanophotonics / 图译:Fortuner(撰稿人 )

二、用于神经网络训练的集成光子设备

集成光学技术的第二个令人兴奋的机会与人工神经网络训练有关,建立一个增强的神经网络训练技术平台是非常重要的。最近的出版物显示了当今技术在神经网络训练中的巨大环境进展。

优化光子神经网络的训练有两种基本方法:

1. 训练方法适应匹配系统兼容性。

2. 在一般的训练方法中,如随机梯度和反向传播的运算是通过光硬件来加速的。

将两个神经层间突触连接的推理计算扩展到一个技术平台,其中反向传播和权值更新步骤也通过光信号处理以完全并行的方式进行。

在基于马赫-曾德尔干涉计的向量矩阵乘法概念中,矩阵元素值由外部子系统设置。因此,在优化过程中改变这些值将需要信号从神经网络输出流到控制系统。针对这种结构人们提出了一种支持反向传播算法的训练算法。

它基于在该器件中进行强度测量并存储所获得的值以供后续步骤处理。该通信路径仍然会带来信息流瓶颈,从而限制了训练算法的性能和功耗。需要一种局部权值更新机制,直接在网络中获取信号。

为了训练前馈的DNN,可以使用随机梯度下降和反向传播,作者对反向传播算法的训练方法步骤进行了总结,以帮助读者理解随后提出的光信号处理器的优点:

步骤1:用目标响应tk正向传播训练输入样本xk,并存储相应输出y。

步骤 2:对于每个训练样本,使用一个损耗函数计算目标输出和获得的输出之间的损失。通常,平方误差用作损耗函数。

步骤3:对于每一个训练样本,找到错误信号,错误信号代表在一个神经元上的输入对总损耗的影响有多大。这种误差信号可以通过权值矩阵转置后通过网络向后传播,并使用激活函数的导数来获得。

步骤4:利用(步骤3)中得到的误差信号,更新权重使损耗最小化。

最后,反复重复(1-4)的步骤,直到损耗达到最小值。

图4. 利用具有两层隐含层的前馈神经网络进行前向和后向传播,用于网络权重训练。

图源:Nanophotonics/图译:Fortuner(撰稿人 )

早在20世纪90年代,一个光子系统就已经被证明,在这个系统中,加权元素被存储在一个光折变材料的体材料中。MAC操作是通过两束光折变晶体中形成的折射率光栅的衍射效率来实现的。图5描述了单个权重和两个突出权重的形成和工作原理。

图5. 权重的形成和工作原理

图源:Nanophotonics

硅光子学的可用性和像钛酸钡,Ⅲ-Ⅴ族薄层材料等材料的整合性为实现模拟芯片级光子突触处理单元提供了机会。作者展示了一个基于光折变效应实现神经网络操作的器件布局(图6)。

图6. 用于推理和训练的集成光子突触处理器的示意图。

图源:Nanophotonics / 图译:Fortuner(撰稿人 )

将一薄层光折边材料键合在硅光芯片上。电光调制器将电输入矢量转换为光束所需的功率和相位。探测器阵列将矢量矩阵输出信号转换回电域。

从本质上讲,光折变效果可以很好地控制和调整权重值。这对于有效的训练很重要,为定期更新矩阵元素的模拟矢量矩阵乘法提供了机会。

总结

神经形态计算技术催生的光子发展在带宽、处理速度和可控性方面展现了出色特性。集成光子学在神经网络推理和训练中的潜力巨大。训练人工神经网络的新概念等仍旧需要进一步的技术发展。将光子神经形态计算的结果与其他平台技术进行比较,这对于将研究工作导向最有前景的应用是很重要的。

文章信息

Pascal Stark, Folkert Horst, Roger Dangel, Jonas Weiss,Bert Jan Offrein,Opportunities for integrated photonic neural networks,Nanophotonics 2020; 9(13): 4221–4232

文章地址

https://doi.org/10.1515/nanoph-2020-0297

【】

欢迎课题组投递成果宣传稿

转载/合作/课题组投稿,请加微信:447882024

往期推荐

走进新刊

开 放 投 稿:Light:Advanced Manufacturing

ISSN 2689-9620

期 刊 网 站:

开 放 投 稿:eLight

CN 22-1427/O4

ISSN 2662-8643

期 刊 网 站:elight.springeropen.com

这是中国光学发布的第1610篇,如果你觉得有帮助,转发朋友圈是对我们最大的认可

【】

原标题:《IBM实验室:集成光子神经网络的新机遇》

首页
评论
分享
Top