周记 Week68 • Axi's Blog

前言#

这次又是很久之后的一次周记，不过倒也不是因为最近又特别忙，而是在珍惜好不容易的一段闲暇的时间，在推进需要做的主线的同时，也去额外关注一下生活。

科研#

因为大多数课都已经结课的原因，所以在课内的学习上就不用付出什么时间了，而是主要还是在科研这部分做一些探索。

一方面还是积极展开了一些合作，目前细数下来可能能同时进行的有三四个项目，和实验室的一位学长一起做的项目可能是重中之重，某种程度上也是在 GenManip 上进行更进一步的迭代，来满足更多的需求。

另一方面我也在积极补充一些论文的阅读，当然这里面可观的数量还是关于具身智能的。一个遗憾的发现是，目前整体 VLA 的领域还是偏向于非常浮躁的风格，基本上处理的还是那些陈词滥调的问题，以及不断做出一些不痛不痒的改进。其实我的一种看法在于，假如说我们已经拥有了在一些测评基础上面较为稳定的 baseline，那么按理来说就是时候在更深层面进行一些研究了，不过在这其中显然有两个关键问题没有解决。其一，目前大多数的更大规模预训练的模型并不具有稳定的性能，尤其在当下的 Benchmark 中，5% 的绝对性能的差异甚至都可能是噪声的一环，这使得留给我们进行消融的性能波动空间并不大；其二，不同于传统的图像或者文本模型，无论是 WM 还是 VLA，都涉及了在长时序下的任务，这些任务带来了更长的因果关系，甚至结果与环境反馈相关联，这使得一个对于模型内部有效的分析工具难以十分有效，我们只能根据现象来进行推测大多数内容。不过无论如何我已经开始尝试，包括完成一些项目相关的内容以及做出自己的一些探索。

生活#

生活上也是没有其他事情，依然是除了科研就和乐小姐二人世界的快乐日子。当然，另一件事情是我申请了实验室那边的宿舍，等什么时候通过了，或许就是动身的时候。