

周记 Week68
2025-10-13 ~ 2025-10-19.
前言#
这次又是很久之后的一次周记,不过倒也不是因为最近又特别忙,而是在珍惜好不容易的一段闲暇的时间,在推进需要做的主线的同时,也去额外关注一下生活。
科研#
因为大多数课都已经结课的原因,所以在课内的学习上就不用付出什么时间了,而是主要还是在科研这部分做一些探索。
一方面还是积极展开了一些合作,目前细数下来可能能同时进行的有三四个项目,和实验室的一位学长一起做的项目可能是重中之重,某种程度上也是在 GenManip 上进行更进一步的迭代,来满足更多的需求。
另一方面我也在积极补充一些论文的阅读,当然这里面可观的数量还是关于具身智能的。一个遗憾的发现是,目前整体 VLA 的领域还是偏向于非常浮躁的风格,基本上处理的还是那些陈词滥调的问题,以及不断做出一些不痛不痒的改进。其实我的一种看法在于,假如说我们已经拥有了在一些测评基础上面较为稳定的 baseline,那么按理来说就是时候在更深层面进行一些研究了,不过在这其中显然有两个关键问题没有解决。其一,目前大多数的更大规模预训练的模型并不具有稳定的性能,尤其在当下的 Benchmark 中,5% 的绝对性能的差异甚至都可能是噪声的一环,这使得留给我们进行消融的性能波动空间并不大;其二,不同于传统的图像或者文本模型,无论是 WM 还是 VLA,都涉及了在长时序下的任务,这些任务带来了更长的因果关系,甚至结果与环境反馈相关联,这使得一个对于模型内部有效的分析工具难以十分有效,我们只能根据现象来进行推测大多数内容。不过无论如何我已经开始尝试,包括完成一些项目相关的内容以及做出自己的一些探索。
生活#
生活上也是没有其他事情,依然是除了科研就和乐小姐二人世界的快乐日子。当然,另一件事情是我申请了实验室那边的宿舍,等什么时候通过了,或许就是动身的时候。