《自然•通讯》刊发柔性电子全国重点实验室黄维院士团队凌海峰/解令海教授课题组在类脑计算器件领域的研究进展

发布者：麻豆传媒、麻豆传媒发布时间：2026-04-08浏览次数：10

持续学习是人类认知系统的重要能力，其核心在于能够在动态环境中持续获取、整合并更新知识。近年来，强化学习被认为是实现持续学习的重要算法框架。然而，在硬件层面实现类似生物系统的时间自适应调控机制仍面临挑战。传统忆阻器在离子迁移过程中往往缺乏稳定的内在梯度结构，容易产生随机且突变的电导变化，难以形成稳定且具有时间关联性的内部状态，从而限制了其在持续强化学习中的应用。

近日，柔性电子全国重点实验室（麻豆传媒）、类脑电子材料与器件江苏高校重点实验室黄维院士团队、凌海峰/解令海教授课题组在该领域取得了新进展。研究团队基于本征氧浓度梯度调控设计策略，成功实现了具有长时间动态演化特性的二阶忆阻器，并进一步用于实现持续强化学习任务。

研究团队通过引入分子配位层设计并制备了结构为ITO/ZnTPP/ALD-AlO_x/Al的二阶忆阻器。在该结构中，卟啉锌（ZnTPP）分子层在原子层沉积（ALD）过程中能够诱导形成稳定的氧浓度梯度，并在器件工作过程中通过分子配位作用与界面电场共同稳定这一梯度结构，显著延长了界面势垒的动态恢复过程，使器件表现出持续超过百秒的二阶忆阻行为，实现了稳定且可调的电导演化特性。进一步地，研究团队提出了一种单极性脉冲调控机制（U-SVDP），通过不同幅值的单极性电压脉冲精确调控氧离子的迁移与扩散过程，在器件中构建出多达40个可区分的伪非易失（Pseudo-Nonvolatile, PNV）电导状态。这些PNV状态能够形成具有时间相关性的电导演化轨迹，并被映射为强化学习算法中的动态学习率，从而实现器件动力学与算法学习过程之间的协同演化。在路径规划强化学习任务中，该器件驱动的学习率调控策略显著提升了学习效率。在静态环境下，训练迭代次数减少约68.75%；在动态多阶段环境中，训练回合数减少约35.65%，同时有效避免了学习过程中的震荡和局部最优问题。

该研究构建了一种由器件物理动力学驱动学习过程的新型类脑计算范式，为未来忆阻器在持续学习、类脑计算以及具身智能系统中的应用提供了重要思路。相关研究成果以“Intrinsic gradient oxygen-driven second-order memristors for continual reinforcement learning”为题发表于国际学术期刊Nature Communications。凌海峰教授、解令海教授以及黄维院士为论文通讯作者，博士生明建宇为第一作者。

国际知名科技网站Tech Xplore以Feature story形式对本工作进行了专题报道。美国物理学家组织网Phys.org、人工智能领域全球科技社区HyperAI等科技新闻媒体以“New memristor design uses built-in oxygen gradient to bring stability to reinforcement learning”为题予以转载报道。

该研究获得了国家重点研究计划青年科学家项目、江苏省杰出青年基金项目、国家自然科学基金面上项目以及江苏省研究生科研创新计划等项目的联合资助。

具备本征浓度梯度的二阶忆阻器实现持续强化学习任务

原文链接：//doi.org/10.1038/s41467-026-70014-0

报道链接：//techxplore.com/news/2026-04-memristor-built-oxygen-gradient-stability.html

（撰稿：明建宇编辑：陈宁娜审核：凌海峰）