今天看了一个新工具——Squidiff。
Nature Methods刚发的,用扩散模型做虚拟细胞。给一个细胞的转录组数据(起点),加一个扰动信号(基因敲除/药物),就能预测它会变成什么样(终点)。不用养细胞,不用做实验,纯计算模拟。
看起来很新,但用369的框架一看——这本质上是一个频率翻译过程。
Squidiff的核心技术是一个条件扩散模型。简单说:
它把生物信息编码到一个潜空间(z_sem),然后在这个空间里做向量加减:
z_终点 = z_起点 + Δz_扰动
就是这个加法,暴露了它的本质。
Squidiff的架构,恰好对应369的三层结构:
| Squidiff组件 | 369层 | 生物对应 |
|---|---|---|
| 输入细胞状态 | 147 | 细胞当前是什么——它的物质结构层 |
| 扰动/药物/敲除 | 258 | 你给细胞加了什么信号——关系/能量层 |
| 预测的分化方向 | 369 | 细胞要去哪——方向/归处层 |
Squidiff的扩散模型,就是从147出发,通过258的扰动,到达369的终点。
正向扩散(加噪声)是把有结构的147层打散成混沌。反向去噪(重建)是从混沌中重新组织出有意义的369层。
这不是类比——这是同一个数学结构在生物信息学里的具体表现。
Squidiff目前有一个假设:扰动是线性的。加一个向量就够了。
但真实的生物系统不是线性的。同一个药物,在细胞分化的不同阶段加进去,效果完全不同。因为细胞的"频率接收窗口"在变化。
369说:扰动不是加一个向量,是调整一个频率通道。
如果Squidiff的潜空间改成三层频率空间——147子空间(物质结构)、258子空间(信号关系)、369子空间(方向整体)——那扰动就不再是简单的向量加法,而是:
扰动信号必须跟细胞当前的频率对齐,才会产生效果。
这个改动会带来三个直接的应用:
Squidiff当前能预测基因敲除、药物处理的细胞状态变化。但如果加上频率对齐条件,就能回答一个它目前回答不了的问题:
为什么同一个CRISPR敲除,在某些细胞类型里有效,在另一些里无效?
现在的解释是"细胞类型特异性"——等于没解释。
369的解释是:敲除一个基因,本质上是改变了细胞在258层的频率通道。如果这个通道在某种细胞类型里恰好跟369层(分化方向)共振,效果就大。如果不共振,效果就小。
这在Squidiff的框架里是可验证的:把潜空间拆成三层,分别看扰动信号在每一层的变化量,有没有一层的变化跟最终效果的相关性最高——如果有,那就找到"频率通道"了。
Squidiff是一个非常好的工具。它不是369的竞争对手——369是给它一个坐标系。
Squidiff知道细胞从A到B怎么走。369告诉你:A是147层,B是369层,中间的路径是258层的频率通道。
一个是引擎,一个是地图。
两个合在一起,才能开得更远。