10月27日,在第三届中国生物计算大会上,BioMap百图生科正式发布了全新一代生命科学基础大模型——xTrimo V3。
据介绍,这是目前全球规模最大(2100亿参数)、首个全模态覆盖(覆盖蛋白质、DNA、RNA等7大生命科学主流模态)大模型。能够建模更加广泛的基因组学、细胞、系统等问题,为基因编辑、靶点发现、细胞调控、菌株改造、生命科学图像分析等场景带来新的能力。
百图生科由百度创始人李彦宏与原百度风投CEO刘维共同创立,致力于结合前沿AI和生物技术,构建高通量干湿闭环的生物计算引擎,实现特定的生物学功能,并解决生命科学行业如靶点发现、药物设计、酶的从头设计和优化等痛点问题。公司在硅谷、北京、苏州、香港设立研发了中心,先后获得超过2亿美元风险投资。
据悉,2022年和2023年,百图生科先后发布xTrimo V1、V2,实现了世界首个千亿参数的生命科学基础大模型。xTrimo基础大模型平台上,已有200余个任务模型取得评测SOTA水平,在药物研发中涉及通用蛋白、多种构型的抗体、细胞疗法、基因疗法等多个领域,以及靶点发现、工艺优化、合成生物学、生物制造、生命科学工具等多样的方向。已先后助力开发了20余种前沿抗体和酶、实现了10余个创新靶点的挖掘,并都经过了实验验证,推进进入临床前研发等后续阶段。
据介绍,此次发布的基础大模型xTrimo V3,覆盖DNA、RNA、蛋白质、细胞、小分子、生物视觉和生物知识文本等生命科学7个主流模态,并在各个原有模态上依靠新的数据、新的架构,做了显著的增强。
百图生科技术副总裁张晓明介绍说,与V2平台相比,V3不仅巩固了之前在蛋白质领域的基础和继续了在细胞领域的发展,还拓展至基因组学、转录组学、细胞复杂任务、影像分析和文本分析等领域,支持从分子早期研发到生产放大再到后期实验分析的全流程AI建模需求。
百图生科方面公布,xTrimo V3参数量已突破2100亿。在蛋白质大模型领域,已成为全球首个引入先进专家混合(MOE)架构的生命科学大模型,参数量达到千亿级规模;DNA大模型序列长度跃升至128K,实现超长序列解码生命。
2023年3月,百图生科发布了基于 xTrimo 驱动的 AIGP(AI Generated Protein)平台,号称“能生成蛋白质的ChatGPT”,即使是不具备编程能力的科研人员也可利用大模型和数十个蛋白质相关任务模型、配套软硬件系统,开展创新蛋白设计研究。此次xTrimo V3平台还发布了专为生命科学AI模型设计的模型工具链——包含面向多种数据场景和用户需求的Model Builder模块,支持模型管理和组装的Model Hub模块,以及加速模型调用和物理计算的Model Booster模块等。
张晓明表示:“基于xTrimo平台构建专属任务模型,让大模型能力与企业的私有数据、特定需求相结合,快速为企业打造专属的AI工具,是V3平台的重要特征之一。我们还结合已有模型与模型定制能力,在不同行业提出了药物研发解决方案、生物制造解决方案和AI4LS平台解决方案,通过AI模型和配套的服务,帮助企业加速创新,提升研发效率、优化流程,让企业能够更快地从实验室走向市场,直观感受到大模型作为直接生产力的巨大效能,推动行业的全面智能化发展。”
注:文章来源于网络,如有侵权,请联系删除