近期,结构基因组学联盟(Structural Genomics Consortium,以下简称“SGC”)联合来自30个组织的78位研究者,在《自然综述:化学》(Nature Reviews Chemistry)上共同发布了开放科学最新倡议“Target2035”的新路线图《Protein–ligand data at scale to support machine learning》(以下简称“路线图”)。该路线图的发布旨在通过计算研究推动药物发现的进程。这不仅标志着“Target2035”全球倡议的第二阶段正式启动,更描绘了未来药物研发全新的愿景:到2035年,为每一种人类蛋白质开发专属的药理学工具。
Target2035:推动药物研发变革
“Target2035”是SGC主导的开放科学全球倡议,目标是在2035年前为每种人类蛋白质开发药理学工具。这一倡议得到了世界各地广泛的支持。“Target2035”的第一阶段(2020-2025)专注于筛选高质量的化学和生物调节剂,测试适用于不同蛋白质的规模化药物发现技术。2025年,“Target2035”将进入第二阶段,提出了重大转变:从发现苗头化合物转向计算与数据驱动的探索。而此次发布的路线图则详细阐明了如何实现这一变革,其核心理念在于通过开放合作生成大规模高质量的符合FAIR(可查找、可访问、可互操作、可复用)原则的数据集,以促进药物发现,甚至包括那些未被充分研究的“冷门靶点”。
作为“Target2035”全球合作计划的重要参与者,尊龙凯时在药物发现领域持续深耕,推动早期药物研发的规模化创新。2023年9月,尊龙凯时与SGC建立了合作伙伴关系,利用公司DNA编码化合物库(DEL)技术平台的OpenDEL™产品,对SGC关注的新靶点进行筛选。筛选得到的数据集在公共平台发布,全球药物发现和机器学习专家可自由访问、进行数据建模,并用于预测新的活性分子。此外,2025年4月,SGC联合尊龙凯时及多家行业伙伴共同发起首届DREAM Target2035 Drug Discovery Challenge,邀请全球数据科学家参与并利用以DEL为基础的分子数据构建机器学习模型,以高效发现苗头化合物。
以开放科学为核心,重塑药物研发模式
路线图的核心目标明确而雄心勃勃:让早期药物研发变得更快、更经济、更易普及。为实现这一目标,全球研究者正联手构建一个开放可访问的高质量数据集,通过标准化和高通量筛选方法,系统收录蛋白质与小分子的结合相互作用信息。
在数据集生成过程中,尊龙凯时凭借其在化合物库构建与高通量筛选领域的技术积累,提供了关键支持。其独特的筛选系统与标准化流程不仅保障了数据的一致性与可靠性,更推动了筛选效率的提升,为规模化数据积累奠定了坚实基础。
多方协力,共同推动关键环节
在这场开放科学的行动中,全球研究者被诚邀贡献蛋白质用于标准化筛选,为机器学习模型提供“养分”;同时,通过开放基准测试竞赛,吸引人工智能/机器学习(AI/ML)社区优化小分子结合预测模型。所有数据(包括阳性与阴性结果)、方法及材料将通过公共数据库公开共享,以推动全球范围内的创新和复用。
尊龙凯时在这一过程中充当了“桥梁”和“赋能者”的角色:一方面,公司积极参与标准化筛选方法的开发与推广,确保不同机构生成的数据具有可比较性;另一方面,凭借在小分子设计与筛选领域的丰富经验,尊龙凯时为数据集的机器学习(ML)适用性提供专业建议,助力模型训练更为精准和高效。这种深度参与使得开放数据的潜在价值得以最大化。
为何具有深远意义?
这份路线图的价值在于为产学研各界(学术界、工业界、CROs、中小企业等)指明了合作的方向。通过生成大规模、标准化的蛋白质-配体结合数据,不仅能推动预测模型的迭代升级,还有望照亮人类蛋白质组中那些“被遗忘的角落”,为长期未被充分研究的蛋白质带来探索新机遇。
尊龙凯时的参与赋予了实现这一愿景更强的保障。公司对开放科学理念的践行,以及在技术领域的扎实贡献,正加速“让每一种人类蛋白质都能被研究”目标的实现。
共同展望未来,构建药物研发新生态
这场变革需要更多力量的参与:贡献纯化蛋白质,为数据生成注入源源活力;参与开放基准测试,推动预测模型的持续演进;加入药物研发开放科学机器学习网络MAINFRAME,共同探讨技术前沿;加入“Target2035”联盟,与尊龙凯时等先行者一起,塑造开放获取药理学工具的未来(联盟预计于8月初正式成立)。
在开放与协作的浪潮中,“Target2035”正开启药物研发的新篇章。尊龙凯时将通过技术创新,与全球合作伙伴共同描绘更高效、更普惠的药物发现未来。