第1462章(第2页)
“接下来是不是提问环节?我已经嗅到评委席上飘来的硝烟味......”
第一个开口的是来自生命科学院的周士博周老,他曾主动向院方领导提出想带苏雨眠几人,结果没成。
虽有遗憾,不过他尊重几个孩子的选择。
甚至隐隐有种刮目相看的意味。
“不忘师恩”谁都会说,但真正落实到行动的,又有几个?
欧阳没看错人,也没等错人。
苏雨眠值得!
周士博:“既然大家都这么谦虚,那就由我来起这个头,权当抛砖引玉。苏同学,你刚才着重讲了MIDAS这种新算法的基础逻辑,以及具体运行思路和前端操作方式,却没提这种新算法出现的意义和可能带来的积极影响,可以大致说一说吗?”
苏雨眠:“众所周知,单细胞测序技术是近年来生命科学领域的突破性技术,能够检测单个细胞内的多种遗传物质与功能分子,比如RNA表达、蛋白质丰度和染色质可及性等等,从而揭示细胞在不同分子层面的异质性以及组学之间的关联,有助于更加深入地理解细胞功能,探索生命发育和疾病发生等机制。然而——”
她话锋一转,“随着测序技术的发展和测序数据的增长,不同组学组合、不同测序技术、不同测序样本的‘马赛克’式单细胞数据整合成为巨大的挑战。”
周士博点头:“确实如此。”
苏雨眠:“您问MIDAS出现的意义,我认为这应该是人类研究首次实现通用单细胞多组学马赛克数据的模态对齐、数据补全、批次校正等整合功能,为构建大规模多组学细胞图谱、实现大规模单细胞多组学分析与知识迁移提供了重要的原创技术......”
接着,是化学与分子工程学院的民受文,民教授——
“这种新算法对比从前的方法,有什么突出优势吗?”
这个问题很大,很泛泛,属于“万精油式”提问,套用到其他论文上也没毛病。
但苏雨眠还是想了想,认真答道:
“MIDAS假设每个细胞的多模态观测值是通过深度神经网络从两个与模态无关且解耦的隐变量生成......其输入由不同单细胞样本(批次)的表达矩阵和批次编号向量组成......因此可能存在不同的技术噪声、模态组合和观测特征......MIDAS的输出包括生物状态和技术噪声两种低维表示的矩阵,以及对缺失模态和特征进行了补全并消除了批次效应的表达矩阵。”