《电子技术应用》
您所在的位置:首页 > 其他 > 业界动态 > 赛灵思Alveo助力生命科学和医疗应用加速创新

赛灵思Alveo助力生命科学和医疗应用加速创新

2021-07-06
来源:与非网

  今年的5月10日,首届《中国生物计算大会暨数字医学创新峰会》围绕“如何定义生物计算”这一主题展开,来自百度、百图生科、生命医疗大公司以及产业链上的合作伙伴都进行了分享。此次大会表明,生物计算作为跨界融合和与人类命运息息相关的技术产业,正在成为科技业的一个新热点,“生物计算 = 新数据 *新算法”成为大会公认的观点。

  生物计算赛道下的数据中心正在面临怎样的挑战?

60e2ebce413e1-thumb.png

  图 | 面向数据中心的灵活应变加速器

  由于数据大爆炸,特别是大量的非结构化数据的产生,应用场景的不同,工作负载的不同,带来了对加速需求也各不相同,数据中心正在经历一次技术转型,从以CPU为中心转向定制的分布式计算,同时多种不同的应用、不同的工作负载及相应的算法更新迭代很快,远远超出芯片的发展速度,现有芯片架构无法满足上述更新迭代的速度与需求。

  什么样的芯片架构才能解决硬件拖后腿的现状呢?

  赛灵思大中华区数据中心业务销售总监钟屹表示,“当一种加速卡可以适配从云到端各种不同的工作负载,比如数据库、视频和金融,集成存储和网络的控制器,拥有强大的集成度,同时性能和能耗比在运营和成本上,能给客户带来前所未有的价值的时候,这款产品就能满足当下市场的需求。”

  “以赛灵思为例,我们的自适应加速平台——Alveo卡,就可以在三个方面很好的满足数据中心不同应用的要求。第一个,得益于DSA ( Domain Specific Architecture)专用架构的使用,Alveo具有高性能、高吞吐量和超低延时的特性。第二个,自适应能力,可以满足不断变化的工作负载。第三个,Alveo卡集成存储和网络控制器,在加速方面,不仅仅能够加速计算,同时还能加速存储、网络,通过单卡满足客户多样化要求。”

60e2ebce42ed8-thumb.png

  图 | AI加速器横评

  “上图展示了赛灵思自适应加速平台给客户带来的性能在不同应用上的一个对比,以illumina为例,这是美国的一家做基因测序的公司,我们可以看到,用CPU做基因测序要30个小时,而基于FPGA的解决方案则只要20分钟,有90倍的性能提升。” 钟屹补充道。

  Alveo适用于“生物计算”中的哪些应用领域?

  根据赛灵思数据中心加速系统架构师傅垚的介绍,赛灵思FPGA及自适应计算加速平台Alveo适合用于基因组学分析、图形数据库、医疗影像的处理分析,以及基于视频影像监控类型的应用。

  傅垚强调,“赛灵思的Alveo加速平台,最大的一个特点就是它能够加速的计算类型理论上是不受限制的,不像GPU对于浮点的高密度的矩阵或者是矢量运算比较强,但其他的就会有限制,或者CPU基本上能做的事情比较多,但是他的性能也是有限的。”

60e2ebce4493c-thumb.png

  图 | 第二代基因测序流程

  他举例道,“以第二代基因测序为例,基本流程就是基因短序列测序、序列对比拼接、预处理、变体识别以及解码/注释。在序列对比拼接过程中,主要是一些字符串模式的比对,像GPU就很难做很高效的处理,但FPGA针对这种字符串模式的加速效果很好。此外,在变体识别过程中,会引用到很多统计算法之类的技术,Alveo搭载了高性能的DSP,可以满足高密度的计算需求。最后,在做生物医学分析时,会有很大的数据库的处理或者是自然语言处理的一些工作量,Alveo的加速能力也不错。”

  “应用落地方面,以人和未来的基因测序分析项目为例,如果是用CPU来做的话,基本上24小时没有办法完成一个样本的处理;用GPU来做,用8张英伟达的V100加速卡,可以完成32个样本的处理;但是同样的样本处理,我们用Alvoe加速卡在基本标准的服务器上,单张Alveo加速卡就可以实现超过46个样本的处理。”

  “生物计算”落地者有话说

60e2ebce464f1-thumb.png

  图 | 人和未来基因顺序分析框图

  针对傅垚的描述,来自人和未来的首席医学官王益民表示,“围绕加速这一需求我们一直在寻找一些可能的解决方案,经过很长时间的对比,我们最终选定了赛灵思高性能的FPGA作为我们硬件。因为这样的平台有很多非常现实的优势,除了性能,还有其特有的软硬件全部可重新编程的优势等。基于这个平台我们开发了围绕大数据基因组这样的存储传输计算,以及后续的解读大数据基因组相关的分析方案和平台,从而使得我们快速推出了基因组分析平台,并已经在科研和临床等各个领域开始部署和应用。”

  “在加速效果方面,经过FPGA的加速,我们把原先大概需要30-40小时的分析时间,压缩到了短短的20分钟以内。” 王益民如是说。

  除了基因测序,来自雪湖科技的生命科学计算首席科学家盛楠表示,“药物研发最重要的两点就是药效和安全性,从整个药物发现和新药研发流程中,计算占的比重还是比较大的。特别是在中间:靶点发现,化合物发现,以及先导化合物优化方面。”

  “以常见的抗流感病毒药物——奥司他韦为例,从研发到上市只用了7年时间,这款药物就是通过计算机辅助药物设计算出来的。首先获取靶点蛋白的三维结构,并数字建模,然后通过计算机计算与靶点结构匹配的药物分子。类似给锁建立数字模型,配钥匙。这样做的好处是能够大幅提高研发成功率,但数据量增加了数百万倍。”

60e2ebce44929-thumb.jpg

  图 | 新冠病毒表面刺突蛋白的动态结构变化模拟耗时

  “此外,分子动力学计算消耗算力也是非常巨大,例如对新冠病毒表面一个刺突蛋白的动态结构变化,需要对100万个原子之间的相互作用计算10亿次。要完成这一模拟,一台传统CPU服务器需耗时8年。因此,往往需要大型超级计算机才能承担。美国DEShaw研制了分子动力学专用超算ANTON2,搭载了分子动力学专用计算架构的ASIC,对于刚才提到的百万原子体系,每天能够计算9.5微秒的运动轨迹。这台机器服务于Relay医药,为Relay医药提供算力支持,基于蛋白动态行为研发抗癌新药。在新冠疫情爆发之后,这台机器快速反应,公开了大量新冠病毒的分子动力学计算数据。”

  据悉,雪湖科技基于赛灵思 Alveo 加速卡的分子动力学专用计算的性能优异,对于百万原子体系100纳秒的模拟,只需要8小时就可以完成。

  结语

  目前人类与疾病的斗争已经进入到算力的时代,需要更强算力与这些病毒,比如说新冠病毒进行抗争。




mmexport1621241704608.jpg


本站内容除特别声明的原创文章之外,转载内容只为传递更多信息,并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题,请及时通过电子邮件或电话通知我们,以便迅速采取适当措施,避免给双方造成不必要的经济损失。联系电话:010-82306118;邮箱:aet@chinaaet.com。