[科学和技术创新的世界潮流]◎记者张王(Zhang Jiaxin)于2003年首次遵循人类基因组,揭示了所有构成我们生活中“蓝图”的DNA。尽管98%的基因组并未直接专用蛋白质,但它们仍然深深影响基因调节和细胞功能。这些非编码区域曾经考虑过“垃圾DNA”,但现在被认为包含重要的生物学秘密,例如遗传世界中的“黑暗事物”。今年6月25日,一个深刻的想法宣布,他们开发了一种名为Alphagenome的人工智能模型(AI),预计将在破译这个“深色物体”中取得突破。 Nature Magazine报告说,“子被关注” Modelo可以预测一系列分子过程中部分DNA变化的影响,从而提供了读取人类基因调节机制的新途径。解释DNA序列的“集成”工具在2020年“ Alphafold 2”发起的深刻思想,成功地破解了科学界数十年来发生的问题:如何基于蛋白质的氨基酸顺序准确预测三维结构。这一突破不仅改变了结构生物学的研究方法,而且促进了新的研究和药物开发的过程。相反,了解DNA的功能更为复杂,因为它没有像蛋白质那样具体的“正确答案”。这些功能主要是在DNA基因表达的调节表达中观察到的,例如确定何时打开或打开基因,细胞具有作用以及表达的强度。如果蛋白质结构的预测是沿海沿岸“部分”的三维模型,那么DNA功能的DNA功能是了解每个符号的真实含义,注释,开关命令甚至手册中的“暗对象”区域。 t涉及的信息水平更为复杂,并且具有更广泛的关联,并且相同的DNA片段可以在不同的时间和不同类型的细胞中起不同的作用,因此建模比蛋白质更困难。几十年来,生物学家一直试图使用各种计算工具来揭示DNA调节的复杂和秘密机制,但是这些模型倾向于关注IS IS单个功能。科学家们渴望使用“综合”工具来照亮DNA的依从性,因此“ alpha基因组”已经存在。根据美国Fun Engineering网站的说法,与以前的模型不同,该模型需要在“序列长度”和“预言精度”之间进行权衡,“ Alpha Genome”也取得了相同的成就。根据官方网站深思熟虑,该模型可以在一个小时内最多处理100万对碱基,并预测一千次对,并预测和预测一次性分子特征,以及基因表达,分裂模式,蛋白质结合位点,占用不同类型的不同类型的细胞。这是AI系统首次可以成为如此广泛的监管特征的联合模型。用于多个公众的“ Alpha基因组”培训的数据集揭示了超尺度数据资源。令人惊讶的是,完整模型的培训仅需4个小时,计算资源只是上一代模型的一半。在26个基准测试中,其中24个表现要比专用模型更好或更平坦。新模型的亮点是变体标记系统,它可以很好地比较突变前后的DNA依从性,并评估其对许多生物途径的影响。 “ alpha基因组”还具有分裂位点的操作,第一次是一个可以预测与囊性纤维化和脊柱肌肉萎缩等疾病有关的RNA异常的模型。在合成生物学领域,“α基因组”可用于设计特定的法规,例如仅在神经细胞中激活某些基因,同时使它们平静为肌肉细胞。同时,预计还将使用具有强大生物学作用的稀有遗传变异,例如导致门德尔遗传疾病的突变。在验证中,研究人员将“α基因组”应用于先前研究中发现的特定白血病相关突变。结果,该模型准确地预测某些非编码区域变体不会直接激活附近的TAL1致癌代,该机制称为致病性PTELL T细胞慢性淋巴细胞性白血病。该模型尚不适用于个人诊断。尽管“ alpha基因组”的表现令人惊讶,但深思熟虑的团队说该系统仍然存在许多局限性。它不是为单个基因组解释而设计的,也不是为祖先(例如23andMe或临床遗传检查)预测疾病或信息的风险。也就是说,该模型不适合个人诊断或医疗决策。当前的“α基因组”训练数据仅限于人类和大鼠,并且尚未覆盖其他物种,其跨物种的灵活性仍有待证明。同时,确定调节元件和目标目标之间关系的能力(超过100,000个基碱基)仍然很弱,并且它不是完全调节不同状态和组织中细胞的动态调节机制的模型。彼得·库(Peter Ku)是美国冷春港实验室中的一名计算生物学家,他指出:“这些模型通常在固定状态下训练,但现实中的细胞是动态的,蛋白质水平,DNA化学变化,转录状态,ETC。 - 两个DNA的接触。 “因此,未来的模型需要将更多的“多模式”和“多时间尺度”因素引入更现实的模拟生物学过程。