Axi's Blog
月记·二零二六·四月Blur image

月记

相较于之前学术进展顺利的 3 月份,一系列当时在推进的项目陆续完结,产出了一系列的成果,4 月份其实并没有什么有趣的事情发生,几乎是平淡且索然无味的。

当然,各种进度上的停滞自然也伴随着更加深刻的焦虑,在没有量化成果体现我的进步的情况下,这段时间的努力几乎在我的潜意识中成为了一种空耗,我在浪费那些宝贵的时间,这简直是太糟糕了。

科研#

相较于之前一段时间的明确目标来说,现在的科研进度开始收敛,或者用更加通俗的话来说,就是没什么事情可以做了。

一方面,starVLA 现在又进入了新的一轮稳定的迭代时期,似乎并没有大的 feature 是我们需要做的,只要我们不想要做一篇新的论文,其实就是正常的日常交流以及讨论就可以了,而不会有任何的产出。在月末的时候我们参加了 RoboChallenge 的比赛,但是因为本身我们的项目也在迭代,所以手头没有很多卡的我也没有帮上很多忙,只能说在最后来看只在讨论上提供了一些思路。

另一方面,我们的 Benchmark 项目也已经几乎做完了全部需要做的事情,我们完善了文档,提供了 CLI 详细的说明以及任务的执行示例,在此之前的分工中,主要负责仿真搭建的我其实已经没有必要再参与到 baseline 测试中,有不少别的同学承担了这一职责,尽管我们全部的池子里面也是也没有那么多的卡。

不过从想要训练一下模型的角度,我还是想要尝试训练一下 starVLA,在我们自己的 Benchmark 上,或许因为目前 work 的模型都经过了预训练,相同的训练量似乎对于 starVLA 没有那么有效,模型还在进一步的迭代中。

在 4 月末的时候,也几乎是淼哥最后还在实验室的日子里,我们发布了 EBench,集成了半年来我们的一些心血,Isaac Sim 存在的一些 Bugs,需要完成的一些物理调试,一些数据采集的脚本,总归还是费了很多的时间,做了一个还算有趣的 Benchmark,包含了移动操作、长程操作以及精细操作,在此基础上还有一些多维的评价,还是很有意思的。

另外就是同实验室的合作者对于之前的工作,想要进行一些续作,我也在慢慢推进。相较于之前来说,实验室的方向正在不断变得确定,相较于之前在实验室的一段时间,我们的方向来说也有了比较大的调整。因此显然,本来对于仿真部分的规划的蓝图可能不再可以实现之前计划中。事实上,目前的仿真工作原本会是一系列的组合,并且形成一个综合的仿真平台,可以让社区共建非常不错的评测以及各种内容,然而伴随着一些变化,我们也不再可以去推进这个项目了。

就像上个月的月记中写的那样,似乎这也是一个足够好的切出点,可以暂时停下来思考一下,并且去做一些更不错的事情。不过就这个月的进度来说,确实是没有什么更多可以描述的了。

返校#

这个月另外可能算是有点意思的就是在月中的时候又回了一次西安。主要是因为学校要求的毕业信息采集必须要线下来拍照,所以说不得不从上海返回,来回的差旅钱需要我自己承担,虽然说现在工资也不少,但是总归还是很心疼的。好在可以回去多陪一陪乐小姐,这也使得一切还算有点意义。

如果读者在此之前有了解笔者之前做的一系列分享,包括说在这个博客中有记录一篇名为 致新生的你 的博客,讲述关于如何学习、保研以及科研的一些常识和技巧,笔者一向很热衷于这些事情。在大四上进行了第一次简要的分享之后,那时候主要讲的还是关于如何进行保研,其中的一些基础概念以及后续关于入门科研的一些常见的技巧和对于新生们的规划。这段时间从大四上到现在,笔者可以说认知又经过了新的一轮迭代。

遥想大四上开学的时候,当时可以说只是对于如何发论文、整个的科研流水线以及领域的基础概念有一个大概的了解,虽然说当时也有训练过一些模型,但是总归没有进行过更多大规模的训练,而在当时的听众也是一些可能更加 junior 的,比如说刚入学的新生,或者说刚刚开始进组的大二大三学生。对于他们来说一些事情固然可以听懂,但是未免也是有一些超前了。而绝大多数的听众可能都会不明所以。而如今半年已经过去,那些真正想要科研的人明确自己的目标,并且也有了更多的上手机会,似乎是一个更加恰当的时间去做更多的分享。因此在这次回西安的时候,还是和学组,也就是一种学生之间互助的学习小组,约了一次线下的讲座。

可以说讲座的受欢迎程度还是出乎了我的预料,大概是因为在此之前的一系列分享积累了在全校学生心目中的口碑。几乎绝大多数的低年级学生在此之前都或多或少看过我的教程或者听过我的分享,如果他们志在保研以及科研相关的话。因此这一次当我打着在 Agent 时代如何科研的噱头再次卷土重来的时候,整个一个大的阶梯教室还是座无虚席了。遥想刚刚踏入校园的时候,我也可能是他们之间的一个小透明,还是令人颇为感慨。

总体分享的内容其实还是大差不差。大概就是先介绍了一下科研的基本流程,一些如何自己借助 Agent 搭建科研流水线,通过算力以及 token 来去 scaling paper,并且花更多的时间去思考而不是像以前一样进行所谓单点的科研,渴望一些机缘巧合下的妙手偶得之。这些效率的增减带来了入门速度的差异,毕竟如果你确实在短时间内培养好了出色的科研 taste,还是可以发出不错的论文。但是除此之外,对于绝大多数的从事科研的同学来说,一个更具效率的方式依然是因为水平限制,所以只能做那些并非前 5% 而是前 45% 的水平的论文。这些论文在大多数会议中可能只是抽奖,而并没有稳定的中稿率,因此这时候往往还是需要通过更多的采样次数来增加论文中稿的期望。

当然同样必不可少的还有对于 Scaling Law 的传教,以及宣扬鼓励同学们去企业实习,接触更多的算力以及更加 scaling 的模型训练和更加工业化的生产流程。毕竟纵观当前,即使是 C9 甚至华五这样很不错的学府,事实上学院中绝大多数老师的算力依然非常有限,而一个并未经过泛化验证,仅仅处于在小规模算力和小数据集上进行实验的原型算法,只能作为简单的科研尝试,而很难培养个人品味或者进一步提升自己的代码或者学术水平。

小结#

除此以外,4 月份似乎并没有什么有趣的事情发生。毫无疑问,这是一个平淡的一个月,同样意味着一事无成和焦虑,时间就在这样悄然流逝,但是我还是最后鼓起勇气将它写了下来,希望作为读者的你看得开心

月记·二零二六·四月
https://axi404.top/blog/journal-2604
Author 阿汐
Published at June 1, 2026
Comment seems to stuck. Try to refresh?✨