面向新药研发的高质量药物数据集及智能服务
申报单位:北京市计算中心有限公司
浏览量: 发布时间:2024-07-12
案例背景

新药研发的整个周期包括候选药物研发、临床前实验、临床试验和批准上市,其中候 选药物研发阶段包括药物靶点的选择与确认、候选化合物的选定等。在候选药物研发阶段 可以通过人工智能的算法提高准确性,然而高质量的药物数据集是人工智能算法辅助药物 发现的基础。 目前存在的问题,一是数据流通不畅、资源分散,关键药物数据被隔离在不同的平台中, 缺乏集中管理和整合,导致信息共享困难。二是标准不统一,不同来源的数据标准不一致, 增加了数据处理和分析的复杂性。三是研发效率受限,在数据获取、处理和分析上耗费大 量的时间和资源,使新药研发成本增加,影响了新药研发的效率。

解决方案

为解决新药研发中的药物数据问题,通过多渠道收集药物数据,建立高质量药物数据 集,通过计算机辅助和人工校验确保数据质量可靠,利用人工智能算法对数据进行深度分 析和挖掘,提高数据的应用价值。 方案针对案例核心业务问题的满足情况: 1. 数据流通不畅、资源分散:通过多渠道策略广泛收集药物研发关键数据,确保从不 同来源获取数据,建立一个高质量数据集,将分散的资源集中管理,促进数据流通。 2. 标准不统一:在数据集构建过程中,实施统一的数据治理,通过计算机辅助和人工 校验确保数据质量可靠。 3. 研发效率受限:基于人工智能算法对药物数据集进行数据挖掘和药物特征提取,形 成疾病相关的药物有效特征,为新疾病靶点和对应药物研发提供更加准确、个性化、智能 化分析服务。 方案在数据协同、数据复用、数据融合创新应用情况, 一是建立了标准数据集,定 期更新,促进了数据共享。二是涵盖了中药、天然化合物、化药、农药等多种所有已知 的药物类型,为药物研发和应用提供了全面的数据支持。三是数据融合创新应用,利用 人工智能算法对数据进行深度分析和挖掘, 不仅提高了数据的应用价值,还促进了新药 研发的创新。

创新点

技术创新方面,利用人工智能算法,对药物数据进行自动化和规模化处理。 应用创新方面,通过构建一个集中的高质量的药物数据集,解决了数据流通不畅和资 源分散的问题。这个数据集不仅整合了来自不同来源的关键药物数据,还通过计算机辅助 和人工校验确保了数据的质量和一致性。此外,智能化分析工具的应用,使得从数据集中 提取有价值信息变得更加高效。 模式创新方面,通过建立高质量药物数据集,不同团队能够共享,提高了研发效率。 可通过数据交易的方式,获取数据集的使用。使用人工智能算法的深度分析和挖掘,不仅 提升了数据的应用价值,还为新药研发带来了创新的视角。

应用成效

经济效益方面,与全国 30 余所高校和科研院所合作,利用高质量药物数据集和智能 服务,开展 100 余项新药研发项目,项目收入达千万余元。 社会效益方面,研发人员仅需要关注的药物研发问题,通常只需几个工作日即可拿到 计算结果进行实验验证,大大降低了研发成本,提升了研发效率。例如,我们通过蛋白靶 标数据集应用到药物吡斯的明的靶标筛选中,筛选出潜在的结合靶点。通过将小分子药物数据集,应用到 SARS-Cov-2 靶点的中药筛选研究中,筛选出了潜在的治疗新冠的中药成分。

image.png