湖南大学在“存算一体”分子动力学高速芯片领域取得进展

发布:cyqdesign 2022-05-18 11:42 阅读:875
近日,湖南大学电气与信息工程学院刘杰教授课题组自主研制出了“存算一体”非冯·诺依曼类脑芯片架构,用于加速分子动力学高性能科学计算。相较主流Intel CPU、NVIDIA GPU芯片,在保持计算高精度前提下,实现了约2个数量级提速。研究成果以“Accurate and efficient molecular dynamics based on machine learning and non von Neumann architecture”为题,发表在《npj Computational Materials》期刊。第一作者为电气院博士生莫平辉,通讯作者为刘杰教授。 In;z\"NN4  
[7s5Vt|  
自1946年发明至今,冯·诺依曼架构一直占据统治地位,是CPU、GPU等主流芯片的基础,也是手机、台式机、笔记本、计算服务器、超级计算中心的底层基础架构。目前,需要运行分子动力学等高性能科学计算时,使用冯·诺依曼架构的计算机是几乎所有研究人员的唯一选择,这已成为一种“固有范式”(paradigm)。遗憾的是,冯·诺依曼架构中,计算单元(例如CPU/GPU)和存储单元(例如内存)是互相独立的(即“存算分离”),导致计算总耗时和计算总功耗中的绝大部分(>90%)消耗于存储单元、计算单元之间的频繁数据搬运,俗称“存储墙(memory wall)”和“功耗墙(power wall)”瓶颈。这严重制约了计算性能的提升。 &gEu%s^wR  
CWN=6(y  
为解决该问题,刘杰教授团队自主设计了“存算一体”的类脑芯片架构,并基于FPGA研制出了基于新型非冯·诺依曼芯片架构的分子动力学计算系统“NVNMD”(第一版),实现了从传统冯·诺依曼芯片架构向新型非冯·诺依曼芯片架构的“范式转移(paradigm shift)”。NVNMD的核心计算模块中,存储单元和计算单元紧密融为一体(即“存算一体”),避免了频繁的数据搬运,极大缓解了计算中的“存储墙”和“功耗墙”瓶颈。实测表明,相较主流CPU、GPU等传统冯·诺依曼架构芯片,可将计算速度提升大约2个数量级;并可将计算功耗降低大约3个数量级。 *<A;jP  
=k/n  
长期以来,受制于冯·诺依曼芯片架构内禀的“存储墙”等瓶颈,在“速度”和“精度”这两个核心指标上,分子动力学存在“鱼与熊掌不可兼得”的问题——经典分子动力学(classical molecular dynamics, CMD)速度快,但精度低,难以满足高精度计算要求;第一性原理分子动力学(ab-initio molecular dynamics, AIMD)精度高,但速度慢,难以计算大系统。该成果提出的新型NVNMD兼具AIMD级别的高精度、CMD级别的高速度,在物理、化学、生物、制药、地质、材料半导体纳米技术等领域有广泛应用前景。 Xs`:XATb/  
f@/qW!o  
F9+d7 Y$  
该成果得到了中组部海外高层次人才计划、国家自然科学基金、湖南省委组织部百人计划、湖南省科技厅、长沙市科技局、华为技术有限公司等经费支持。目前,该团队正在基于高端工艺节点,设计非冯·诺依曼架构ASIC芯片的NVNMD(第二版),旨在实现单节点(平方cm量级芯片、百瓦量级功耗、新型非冯·诺依曼芯片架构)分子动力学算力大致相当于美国最强超算中心Summit算力总和(占地一栋楼、十兆瓦量级功耗、传统冯·诺依曼芯片架构)的研究目标。 *r% mqAx(  
_fyw  
论文链接:https://www.nature.com/articles/s41524-022-00773-z
关键词: 芯片
分享到:

最新评论

我要发表 我要评论
限 50000 字节
关于我们
网站介绍
免责声明
加入我们
联系我们
服务项目
稿件投递
广告投放
人才招聘
团购天下
帮助中心
新手入门
发帖回帖
充值VIP
其它功能
站内工具
清除Cookies
无图版
手机浏览
网站统计
微信
扫一扫,关注光行天下的微信公众号!
微博
扫一扫,关注光行天下的新浪微博!
手机APP
扫一扫,下载安装光行天下的手机APP!
9652202 cyqdesign
主办方:成都光行天下科技有限公司
Copyright © 2005-2024 光行天下 蜀ICP备06003254号-1