开题报告内容:(包括拟研究或解决的问题、采用的研究手段及文献综述,不少于2000字)
- 课题研究的背景和意义
人工智能(Artificial Intelligence, AI)指的是分析、学习和解释与制药相关的大数据以发现新药的算法的应用,以更加集成和自动化的方式结合机器学习的发展。近年来,由于机器学习理论的发展和药理学数据的积累,人工智能技术作为一种强大的数据挖掘工具,已经在药物设计的各个领域崭露头角,例如虚拟筛选、活性评分、定量结构-活性关系(QSAR)分析、从头药物设计以及吸收、分布、代谢、排泄和毒性(ADME/吨)特性的计算机评价。作为药物研发的上游阶段,如何通过药物分子设计获得先导化合物并对其进行优化改造,是药物化学家们所面临的关键问题之一。而通过人工智能手段进行自动化药物分子设计与优化是一种高效的药物开发手段,可以有效地解决上述问题。
人工智能需要数据支持,而新药研发领域正是大数据的丰富宝库。例如,1959年《Journal of Medicinal Chemistry》杂志创刊至今,至少发表了45万种化合物作为药物的研究对象,对于这样的大数据,人工智能可以发挥它独特的作用。自20世纪60年代以来,药物化学领域就开始将人工智能应用于新化合物的设计,其中有标记训练数据集的训练模型被广泛应用于分子设计中。属性预测机器学习中的一个重要方面是可以访问大型数据集,这是应用人工智能的先决条件。在制药工业中,化合物优化过程中收集了许多不同性质的大数据集,这种有针对目标和反目标的大型数据集可用于不同的化学系列,并系统地用于训练机器学习模型,以驱动化合物优化。
本课题将检索含有药物设计策略的数据库,收集药物设计策略数据并进行分类归纳,最后尝试用人工智能方法对收集到的药物设计策略进行学习,并构建模型。该模型可实现人工智能药物设计与优化,提高药物设计的成功率,供机器来学习药物和药物靶点的结合特点,从而让机器来进行药物设计,大大提高成功设计的概率。
- 课题研究内容
基于片段的药物发现( fragment-based drug discovery,FBDD)已成为近年来发现先导化合物的主流方法之一。它利用核磁共振技术(NMR)、表面等离子共振技术(SPR)、X-射线单晶衍射(X-ray)以及热迁移分析(TSAs)等方法筛选出与靶蛋白有弱相互作用的小分子片段,之后基于其结构信息对活性片段进行优化,进而得到更高活性的先导化合物进行新药的研发。
人工智能技术,尤其是深度学习模型,可以从输入数据中自动学习特征,通过多层特征提取将简单特征转化为复杂特征。因此可通过对已有药物设计策略的学习,对活性片段的结构优化直至得到先导化合物。深度学习方法主要包括深度神经网络(DNN)、卷积神经网络(CNN)、递归神经网络(RNN)、自动编码器、受限玻尔兹曼机(RBN)。
1.分子优化改造策略的收集以及数据化保存。
(1)医药信息检索,从JMC、EJMC、ACSL化学期刊上,收集2000-2019.10的小分子片段的改造、优化方式。用ChemDraw将改造过程记录下来,每种改造途径都保存为.cdx、.rxn、.mol三种文件。
(2)数据收集,对数据进行核对、清洗、整理。考虑采用编程软件降低数据收集的工作量,更大程度确保数据的统一适用性、有效性与完整性。
2.对所收集的到药物设计策略进行分类归纳
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。