Axi's Blog

Back

大二回忆录Blur image

随着今年的 CVPR 的投稿来到了尾声,随着补充材料的提交,可以说给这一段经历画下来一个短暂的逗号,之后,我还会继续在上海进行科研,但是至少在现在来看,还是可以终于有一点点时间,来记录一下很久就想做的大二回忆录。

前路茫茫#

在度过了繁忙的大一之后,相较于刚刚入学时候的我,我的个人水平可以说已经有了长足的进步。我现在不只是掌握了很多编程语言,同时也参与了 RM 这种中型体量的代码工程,而同时我也学习了机器学习和深度学习的常识知识,包括那几本脍炙人口的书籍,以及大约五十篇的论文。

在 WJH 学长的引领下,我认识了绿群,并且开始了新的一段水群之旅,开始有意识的规划自己将来的保研。一开始我的目的就是很明确的,在经历了一些论文阅读之后,加上和一些其他人的聊天,我可以确定一个初步的想法,那就是在短时间内我是喜欢科研的,并且打算将学术作为自己的第一发展方向,换句话说,对于我来说最好的途径,就是加入课题组并且参加科研,然后通过论文发表来获得清北华五级别学校的 PhD offer。

在和学长进行的简单的咨询之后,我就快速地选择了周三平老师作为我的第一位导师。

讲实话,我在当时有一些考量,从兴趣上来说,我之前是抽空看过 Games 101,对于计算机图形学非常感兴趣,然而这并非潮流,就像我对前端开发很感兴趣一样,我可以有很多感兴趣的事情,但是我需要从里面选择出来那一个,我又有兴趣,又可以给我带来更好的发展的方向。在西交人机所(也就是人工智能学院),做计算机图形学的只有一位老师,而我对于计算机学院也不太了解,所以也就放弃了选择。

通过和学长的交流,我了解到了人机所比较有潜力和水平的几位老师,我向其中的两位老师发了邮件,周三平老师立刻就回复我了,另一位老师则了无音讯(后面有一位同学委托班主任搭桥,进入了这名老师的课题组,结果却是做了标注数据集的杂活,也可以说,冥冥中都是命运的安排吧)。我按照学长交给我的办法,在谷歌学术上看了老师的发表,当时我其实还并不清楚,事实上挂了老师名字的论文,有很多都其实并不属于这位老师直属的课题组,所以看到了其中我比较感兴趣的图像修复(我实际上更加感兴趣的是图像生成,当时并不了解这方面详细的技术背景,但是类似于 DDPM 以及后续工作的一些论文倒是看过,对于那些算法十分感兴趣,但没有发现老师有相关的背景,就只能退而求其次)。

可以说当时我还是比较害怕,不知道自己是不是有资格进行科研,所以还是等到了奖学金的排名公布之后,我才好意思发出邮件,而这个时候已经十月初了。我和老师进行了一次快速的面试,或者说就是在一起聊了一下,我和老师说了我的兴趣,但老师告诉我这方面他已经不再做了,不过可以和另外两个已经大三的学长一起做医学影像相关的内容。我对医学影像并不是很感兴趣,不过感觉也是可以做一下的,就答应了下来。老师给了我一篇论文,让我看一看,并且之后和另外两名学长一起讨论一下。

RM 组长#

科研的故事暂时先讲到这里,接下来还是要花开两朵各表一支,讲讲其他的事情。就像上集说到的一样,我在 RM 里面已经成功担任了视觉组组长,也就承担了招新的工作。这一部分详细的故事在 RM 回忆录里面有说,在这里也就挑一些和比赛不太相关的事情来讲。

当时相较于之前的培训,我更加青睐于制作一系列的更合理的内容,将培训的知识和考核的内容结合在一起,所以也录制了一系列的视频,同时花了不少时间来去做准备。

与此同时,我依然展现了积极水群的品质,在新生来了的一段时间内,在新生群里面和大家处好关系,也因此认识了不少同学。在这里面可以说我加了不少大一同学的好友,也和一些目前在他们年级中影响力比较大的同学聊过一些,并且通过对于 RM 的宣传,将一些同学招募到了视觉组里面。

整个这一次的培训,总体上来说都显得我十分仁慈,没有做很高强度的抗压,而且最后在筛选的时候也没有非常严格,导致最后还有不少同学剩了下来。因为后面没有任务去给他们布置,使得这些人的积极性下滑,但这就又是后话了。

这一次主要是招募了两名让我印象比较深刻的同学,是我这个年级的同学,LXW,另外一个则是比我小一年的学弟,QZZ。QZZ 可以说是我在西交见过最具天赋的学弟了,估计在科研上的速度说不定可以超过我,后来他在大一下的时候就进入了课题组,并且参加了很多课题的科研,但是遗憾的是,他并没有主动去争取一些主导课题的地位,导致现在属于自己的工作还没有开始进行。按照常理来说,在西交的课题组中进行科研,产出的是正常且不是特别有影响力的工作,往往比较难以一次就中稿,因此他的才华是不是会被埋没,也就未可知了,说不定也不能超过我的论文发表速度。至于 LXW,那段时间大概我会把他视作我的朋友之一,这个人具有一些工程能力,但是课内成绩很低,也并没有科研相关的志向,可以理解为正常的技术爱好者类型的学生,因此我也推荐他来这个比赛去获得加分,这边的需求和他的能力也正好匹配。然而事实上是,我这个人通常与人相处存在一定的距离感,而 LXW 有的时候不打招呼就用我的东西或者吃我的零食,这实在是让我心生膈应,尽管大多数时候他还是作为一个好的朋友存在的。

讲实话,我在社团里面一直扮演的是一个亲民的角色,并非是一个铁血的领导者,导致了后面视觉组一些同学并不怎么做事情,当然最后而言,视觉组还是完成了大多数的目标,虽然因为一些客观问题没有发挥好,但是我认为还是达到了我的预期。

科研之二#

继续回到科研这一边,毕竟在整个大二生活中,除了正常的学习,就只剩下了参加 RM 以及科研。作为一种安全感的提供,以及对于社交的懒惰,我将社交圈缩小,并且大多数时候只和乐小姐一起,而其他的社交主要集中在了绿群的网上交流。

这些事情其实在第一次的周记里面都已经说过一些了,但是我还是愿意再讲一次。在老师给了我这篇论文之后,虽然说我之前自己已经有了很多相关的实践,但是正式的进行科研工作还是第一次,第二天我就在自己的电脑上下载了数据集并且进行了训练,将论文的成果进行了复现,并且大概将论文的思路和代码都看懂了。

在和老师以及两位师兄讨论的时候,我当时大概提出了自己的见解,对于论文 MCF:Mutual Correction Framework for Semi-Supervised Medical Image Segmentation,本身是在通过两个不同的网络之间的差异来进行半监督学习,从我当时的视角来看,半监督学习在这个语境下面,关键点就是如何维持两个模型之间的多样性。准确地说多个模型在这种协同训练的范式下,因为在此之间通过伪标签建立的损失,所以很快就会具有相同的表征,从而让伪标签不会太有意义。

当时其实我很快就想出来了第一个方法,其实也很显然,我只需要让模型迭代的速度慢下来,保留某一个模型的备份,从而模型依然具有之前的一些多样性的表征,一个明显的方法就是通过 Mean Teacher 来做这个事情。第一次的程序简单粗暴,我在原来协同训练的两个模型的基础上,额外增加了两个教师模型,他们不会在推理的时候使用,只提供伪标签,不参与反向传播。这样一个简单的框架,因为变得复杂,显而易见的达到了 SOTA,但是却缺乏创新性,并不理想。

在之后的一次组会中,我忽然灵光一现,想到了另一个切入点,也就是从模型的不平衡性角度来入手。在 MCF 里面有一个大概率不是原创性的设计,但是因为没有做相关的调查,他们也没有引用,也就不进行追根溯源了,大概的意思就是在协同训练的时候,比较两个模型在有监督数据中的性能,并且将性能高的模型作为教师提供伪标签,从而实现一种动态切换的教师学生关系。这种设计的好处是显然的,可以简单直接的 filter 掉一些不好的伪标签,虽然说在有监督数据上的性能并不是客观准确的,但是至少有一些参考价值。然而这也引发一种担忧,也就是假如我用两个不同结构的模型(MCF 的设计),这两个模型的性能天然就不一样,按理来说好一些的模型具有更大的获得性能的潜力,但是却因为他一直提供伪标签,而导致只具有更少的使用无监督数据的机会,最后让两个模型都趋于平庸。

那么有没有一种东西可以改变模型的性能,而且不是和模型或者损失函数绑定在一起,并且可以灵活变化的呢?假如可以找到这样一个属性,那就可以让模型之间进行平衡的切换,并且建立稳定的多样性,这种多样性不是一个模型始终领先另一个模型,或者在多数情况下领先,是两个模型平等的进行切换,从而都可以充分利用到无监督数据。答案显而易见,也就是迭代次数。

我在组会中提出了这个想法之后,老师也认为有一些希望,所以会之后我很快就搭建出来了第一版的代码框架,两个模型会进行交替训练,在后续的命名中,最后选择了 progressive 来形容这个现象,然后在数据集上进行了训练和测试,超过了 SOTA 两个点。

那时候大概从我开始科研过了两个多星期,而且距离 CVPR 截止大概还有四个星期,我自然是喜欢做很大的梦的,所以找老师说了一下这个现象,并且和老师聊了聊,决定投一下试一试。当天我就写了一些论文,主要还是仿照 MCF 的写作思路,现在来看这种思路十分奇怪,是从对另一篇论文的攻击开始的,也就是指出他的错误,并且说自己可以避免这一错误。我的论文仿照了这种写法,也指出了 MCF 的问题,并且提出了自己的解决方法以及贡献点,给老师看了之后被光速驳回了。毕竟 MCF 驳斥的是一篇知名的论文,所以说还站得住脚,但是假如我去驳斥 MCF,也就成为了一篇名不见经传的工作的后续改进了,自然也就差了点意思。接下来老师跟我讲了新的思路,怎么去组织这个故事线,然后我就开始一边跑实验一边画图一边写论文了。

周老师在我的整个科研经历里面,主要还是起到了口头指导以及论文写作上一些帮助的作用,然而并没有非常手把手的对我进行协助,然而我并不认为这有问题。事实上一方面老师比较忙,另一方面与老师的交流,我已经能学到许多东西,就在后面也会体现出来。

整体的论文思路改成了周老师认为比较合理的走向,也就是自顶向下的去讲述这个故事,从这个领域开始说,然后说为什么很重要,之前一些著名的工作以及最近的工作做了很多探索,但是还有缺陷,而我们的工作解决了这个缺陷。这种论文写作的思路的核心在于,不去讲述思考的过程,而是直接指出解决了问题,让方法有一种浑然天成的感觉。具体来说,我们不会说对于这个现象,观察到了某些结果,认为这是某种原因,并且构建了某个模块,甚至和其他模块进行了比较,选择了最合理的;而是直接说对于这个问题,我们设计了这个模块,从而在这个现象中避免这些结果,而且经过实验还发现我们的这个模块比别的模块要好。这种故事讲述顺序的颠倒,成就了自顶向下和自底向上的两种方式,而我通常更喜欢前者。

在跑了大量的实验,把之前的工作都亲自在服务器上重新跑了之后,我给出了论文的主要表格,同时因为缺乏一些贡献点,将 MCF 里面的 tricks 进行了一些包装,并且讲述了在我的框架下的效果,作为贡献点之一,并且进行了投稿。

投稿结束的几天,可以说那时候就是春风得意马蹄疾,自诩为是某一种天才少年,年纪轻轻就可以以第一作者投稿 CVPR,但是结果确实让我清醒了不少,311。

可以说两位审稿人都给出了十分负面的评价,一位指出了我使用的两个模块本质上和 MCF 相同,两个人更多的还是对性能进行了质疑。具体来说,我在测试的过程中,把每一个模型都在统一的环境里面进行了测试,同时还把 batch size 进行了对齐,但是确确实实有不少模型,在这些测试里面的性能十分差,甚至和原文相差了十多个点,在后续的分析里面,我其实注意到这个现象,大概原因是,我 follow 了 MCF 的 K 折划分,而之前的工作都是在 UAMT 的单一划分中进行的,我不太清楚这个划分是不是精心 pick 了一些数据,但是反正就差距很大,那些模型在这个好的划分上提了很多的点,虽然和原文中讲的还有不少差距。当然除此之外,论文内容也有很多没有仔细看清楚,包括残留了一些之前的模型命名,以及一些符号的使用错误,所以以毫无疑问的转投了 ECCV。

我总结了一下问题,大概就是几点,一方面我不能用自己测试的数据,而是需要使用他们自己汇报的内容,这是比较重要的第一点,也就是说我需要在他们或许有一定造假嫌疑的数据中获得 SOTA,这带来了比较大的调参工作;一方面模型的方法还需要一些调整,不能和 MCF 完全一致,虽然说它里面的这两个方法也大概率不是原创性的,毕竟他主打的其实是异构模型的协同训练,但是至少将这两个方法讲出了自己的故事,我也有必要做一些调整,无论是在方法上还是在故事上;最后就是论文的写作还需要提升,ECCV 的时间其实不算很充裕,但是也给了我一定的润色时间。

于是这条路又一次开始了,我现是在这些数据集上进行了调参以及消融实验的记录,之后将两个小的模块进行了略微的修改,将整个的故事的侧重点更多地放在 progressive 的模块设计以及故事,而去弱化这两个为了撑住贡献点而保留的模块。同时我也开始修改这两个模块,让他们看上去更具有一些符合我的框架的内容,并且在主体框架的设计上加入了更多的细节。

在最后的时间中,其实就是对于论文的打磨了,也就是之前我所讲到的那些关于论文方法的一些阐述。可以说在我目前所处的下游任务中,想要提出一些惊世骇俗的方法是天方夜谭的,然而而我的这个小的框架还算比较有趣,就能让当时的我比较知足了,更进一步就是故事的阐述,来让我的方法听起来确实有它的价值所在。

在改完论文之后,又一次将图做了一点点的修改,然后和老师讨论了一下,对于一些细节在再做了润色,就顺利投稿了。

在做完这一篇工作的同时,我也开始了下一段的内容。事实上我是对多模态或者具身智能很感兴趣的,但是当时确实也就只有成绩还拿得出手,没有论文的发表,想要去外校找一些厉害的老师,实在是心里没有底气,因此只能静静等待第二次的结果。

下一篇工作其实相当无聊,或者说当时我做这一方面的东西已经快做吐了,所以对应的 idea 也是实在难以让我兴奋起来,不过因为还没有发表,也就暂时不进行透露了。我个人感觉这篇工作是将一个正常的 trick 拓展成了一个方法,并且使用一贯的故事进行了一些修饰,相较于上一篇,好歹在时间这个维度开拓了一下,这一篇实在是没有什么贡献点,只做了一些实验,然后提了一些点,更多的时间在代码的修改过程中度过。在这个过程中其实我还有提过其他乱七八糟的 idea,但是一方面都只是存在于空想中,一方面确实也比较没有意思,所以这段时间内我可以说是沉寂了,只在默默地跑实验,然后准备将来写论文,为了打发时间,也是做进一步的积累,开始阅读更多的我感兴趣的领域的论文。虽然说当时我的心理相当没底,但是按照老师的意思来说,即使这篇论文不成功,将来也可以投一篇 PR,因为从写作的角度上已经足够了,所以当时我的心理预期是大三上快要结束的时候,可以有自己的一篇论文发表,这其实已经相当极限,和我一开始的预期大相径庭了,这些到后面再说。

平淡生活#

在进行科研之外,从开学到三月份结束 ECCV 投稿的这段时间里面,可以说没有发生什么大事情,而是只是在过着平平淡淡的生活。

乐小姐不是实验班,因此参与了大一结束的分流,在当时我的鼓励下,以及她自己的决心中,选择了比较喜欢的口腔医学,事实证明她的能力是够的,成功进入了喜欢的专业。

不过也是因为医学专业的原因,乐小姐不得不去雁塔校区生活,这是一个距离大多数同学在的兴庆校区很远的地方,打车可能要二十多分钟,至于汽车则一般没有考虑的必要。

公正地说,尽管雁塔校区看上去比较破败,但是实际上地理条件却非常得好。我经常和人抱怨西安的环境,这并非某一种出于“京爷”的傲慢,而是从宣传和实际中确实有着很大的区别。按照官方的宣传口径来说,西安应该是西北地区唯一的新一线城市,这个世界上不存在超一线这种说法,所以我认为的一线城市,一般来说指的是北上广深这种大都市,假如不算“新”这种说法,像是南京这种城市算得上二线,西安可能只能算三线城市了,说是十三朝古都,但是貌似只有陕西历史博物馆和兵马俑名不虚传。所谓的西安城墙,感觉和北京的建德门城楼子也没什么区别,而对于旅游属性的重复利用,也造就了一系列的模板化小吃街,里面动不动就是肉夹馍、烤肉、碳烤大鱿鱼、炸串、竹筒冰激凌、拉面,这些可以说除了肉夹馍都是各地小吃街都有的东西,也没有什么可以说道的。

在这里插一嘴的是,尽管这么说,但是之前在学习巷吃的烤肉(或许是西安烤肉的特色,店家都是烤完一大把之后在店里巡回,然后顾客吃多少要多少,最后按照签子收费,确实过瘾)以及之前吃到的不少肉夹馍,确实是味道不错。

我几乎可以这么说,在西安市内比较好的一处商圈,只有小寨附近那一片,而雁塔校区就坐落在那里,可以说坐享地利。甚至说,雁塔校区的生活区和教学区隔着马路相望,路口居然还有一个麦当劳。麦门,在兴庆就没有这样的待遇,而一份热气腾腾的麦辣鸡翅实在是令人嘴馋。

无论如何,尽管女朋友的校区还很不错,但是因为这种机缘巧合,我们还是被迫在同一所学校也异地恋了,好在那时候还有几个闲钱,所以就拿钱打车去找她,或者她过来找我,两个人腻在一起呆上一天。值得一提的是从这个时候开始,我也就逐渐开始承包了两个人吃饭的开销,基本大多数的时候都是我买单,然后带着女朋友到处吃,也是成功把海底捞吃到了黑海。说起来吃饭的一个遗憾,在大二五月份的时候,之前经常去吃的齐齐哈尔烤肉关门了,一斤肉不贵,而且是老家(姥姥家)的味道,加上辣椒蘸料,以及肉质确实很好,用不了多少钱能和女朋友两个人爽吃一顿。

现在回想起来那一段时间,可以说是岁月静好了,当时 CVPR 的结果还没有出,我还是意气风发的少年,口袋里有一些钱,和女朋友两个人一起开心的生活,而课程不多也不难,实在是令人怀念。

与此同时,另一件事情也在发生,这件事情,我不知道在将来会不会产生什么深远的影响,但是在当下来说,我认为还是一些事情的开端。当时在新生入学的期间,因为有不少同学都向我询问各种各样的问题,尽管像是钱学森书院有自己的新生指南,然而一方面里面的东西都是老生常谈的,另一方面大家也都希望知道一些顶级卷王的干货,恰好当时我的成绩也算不错,姑且也是一个顶级卷王吧。在这么多人的询问之下,我也就萌生了写一个新生指南的念头,并且打算在里面塞满干货,甚至可以说是塞满私货。

当时第一版的内容很快就写出来了,并且进行了分享,顺便科普了一些我当时对于科研以及竞赛浅显的认知,当时没有深入科研,并且加入了 RM 的我给出了我初版的意见。尽管回头来看,在当时推荐大家参加一些竞赛,实际上并非明智的选择,但是好在当时我阅读书籍和论文也不算少,所以在自学前沿内容上面还是给出了自己不少的见解,从今天来看也应该还是适用的。

大二下生活#

在经过了上述的种种事情之后,也就自然而然的迎来了大二下,大二上的成绩考得不能说理想,但是至少还在可以接受的范围内,这样我进一步将天平倾向的科研,因为我讨厌考试,也不喜欢复习,我喜欢学习新知识的感觉,但是重复的复习和刷题让我感到厌烦。

整个寒假我没有做很多事情,主要还是以休息为主,这个主要以休息为主的话,在现在来看已经是遥不可及了,我现在已经很少能够闭着眼睛安稳地度过一天,更何况连续七天的休假,可以说这简直是奢望。

大二下之后事情并没有什么转机,只是将一切在平淡的进行着推进。QZZ 可以说也是在我的怂恿下进行了科研,而 LXW 进行了一些代码的开发。尽管从我的视角上来看,在他的开发下代码进一步的变成了屎山,但是至少出了一些效果。

至于我的生活还是按部就班,每天是在社团里面看看论文,学习一下技术,然后继续推进我的那个新课题。在这个过程中,或许有必要提及的是我们建立了 AI 学组,并且 YXJ 同学作为领头人。事实上我并不知道他为什么有这个资格担任这个职位,我们这个年级里面超过百分之八十的资料是我一手写出来的,而他的贡献量是零,直到后面一些同学开始参与才有所好转,但是即使这样可能我发表资料也超过了百分之五十。

尽管大多数的内容都是我一个人创造的,但是在前面加上一个学组的前缀,我倒也并不是十分反对,当时我还抱有一种期待,认为这些同学们被聚集在了一起,说不定确实可以有所突破,事实上这种想法是正确的,但是出现在了之后的学弟学妹身上,我们这个年级可以说是寥寥无几。

然后除了参加比赛,这个内容已经在 RM 回忆录里面说过,剩下的时间就到了期末考试前,也不知道那时候的我是怎么想的,那个时候忽然开始了想要写作西安交大生存指南的念头,并且开始创建我的博客,并且记录下我的一些想法。

然后就是激动人心的 ECCV 开分时刻了,可以说是堪称不可思议的结果,我居然获得了 443 的分数,这个一边倒的好分数可以说很大的鼓舞了我。在这个分数之前,我当时已经受到了太多负面的反馈,可以说只要有一个正面分数,我就已经知足了,然而没有想到它居然给了我这么多的希望。

从现在来看,这个分数简直就是一个奇迹,事实上这篇工作的含金量完全到不了这个分数,但是恰巧每个审稿人都刚好到了欣赏的程度。有的时候我会想,假如说我没有获得这个分数会发生什么,我应该不会觉得失望,毕竟当时我已经做了心理预期,想好了自己面对的结果是什么。但是假如按照这种结果来看,选择了科研,或者说认为自己是做科研的料,根本就是一个笑话,这是一次错误的决定,我在一个没什么前途的领域里面花费一年时间,伴随着成绩的退步,结果是一无所获。

但是好在是成功了,所以一切的情况都逆转了过来,从一次失败的决定,变成了在容易出成果的领域里面发表了一篇还不错的工作,并且获得了审稿人的认可,可以去到更好的科研平台,甚至领先了绝大多数的同龄人。

在获得了这个分数之后,我很快就草拟出来了一大堆的 rebuttal 内容,试图稳住 4 分的审稿人,并且让 3 分的审稿人提一些分数。第二天我便前去找老师进行讨论,并且定下了 rebuttal 的基调。三个审稿人都比较温和友善,提出的问题也不算特别尖锐,可以说只有几个疑惑需要解答,并且认为论文的写作中有一些笔误和不清晰。于是任务便定下来了,重新作图,完善 motivation 以及 pipeline 的表达,老师请来了两位师兄师姐,与我共同完成这些内容。

不得不说,本人的作图审美可以说是一塌糊涂,两位师兄师姐则是颇有水平,一方面在他们的指导下,一方面他们亲自上阵帮忙,仅仅是一天时间,图片变已经从原来的莫名其妙变为了颇具顶会风格的插图。然后便是我较为擅长的内容,打磨文字,删减字数,顺便和老师讨论表达有何不妥,最后提交了 rebuttal,一切告一段落,顺便进入了期末周的复习阶段。可以说这个初审的分数给我带来了极大的希望,甚至说这种希望近乎已经成为了一种折磨,把我从原来对于 ECCV 已经不抱有任何幻想的状态,拉进了每天的煎熬中。

那段时间几乎每天我都会看知乎相关的话题回复,看看又有多少人超过了我的分数,还有多少人逊色于我。我的分数确实处于一个领先地位,这是一个安慰,但是随后更大的焦虑便袭来了。万一我所在的领域分数都是如此的高;万一审稿人看见了彼此的评价,并降低了分数;或者干脆就是 meta reviewer 看我不顺眼,于是直接将我 reject。毕竟这些内容在网上都能找到前科,而我对于我的运气下来不是十分自信,当时甚至立下了,假如中稿便拍摄二十张精心设计的女装照的对赌。

话题回到西安交大生存指南,于是按照当时我的执行力,我很快就完成了一系列的内容,将我当时的一些个人见解和经验都总结了起来。尽管当时我还没有中稿 ECCV,所以还没有资格以一种成功前辈的姿态去进行教导,但是我也率先写下了这些内容,因为不管结果如何,这些事情都是我在踩坑之后的个人体会,并且我坚信这些东西对后人会有一些帮助。与此同时,我还写了一个 AI 自学指南,但是直到现在我还没有继续完工,因为现在的事情实在是太多了,确实没有心思放松下来去写这么一个需要系统整理的内容。不过我把两个内容的前言都空了下来,我在祈祷 ECCV 可以有一个好结果,那时候我也就可以挺起胸膛去写下这些内容了。

轻舟已过万重山#

我记得是很清楚的,那时候我的编号,那个时间,以及那种心情。按理来说,论文的结果会在第二天凌晨出,于是我决定熬夜,但是在大概六七点的时候,投稿群里面忽然就有了消息,说结果已经提前出了,我点到网页里面,然后颤颤巍巍地搜索了我的编号,8535,然后没有任何结果,我的心几乎停了一拍,接着发现号码输错了,改正过来之后找到了那个一,一种说不出来的情绪萦绕在了我的心间,像是我用了一年时间在肩上托举的一块巨石,终于被我轻轻放下,我跟旁边的好朋友 GYT 说,我中稿了。

紧接着我瘫坐在椅子上的时候,一种欣喜才迟迟地涌上我的心头。我一时间似乎有些想哭,但是哽咽就卡在嗓子中,哭不出来,一路上可以说经历了太多的坎坷,绝对不是这一篇博客,几段文字,简简单单便可以概括的。好在一切都有了结果,好在努力得到了回报。接下来我开始向各路关心我的人报喜,然后发了一条 QQ 的说说。

接下来我告诉老师,并且开始查询注册的相关事情,然后平复心情,写了我的两个指南的前言,进行宣传,然后发了一条说说。

说说里面的话,在第一周的周记里面已经写了,剩下的还有什么呢?我还是想再说一次,一句,轻舟已过万重山。

可以说这一次的成功,虽然说相较于我一开始的天才少年的预想,还是差了一些,没有在大二上就早早的获得了论文发表,并且出去进行科研实习,但是依然已经是十分可喜可贺的成果了。其实一开始我的设想一直是,大二上一篇文章,大二下再投出去一个,手里拿着两篇文章去进行申请会好很多,然而一方面到了后面我发现文章的中稿并不是那么简单,另一方面一篇文章就已经比较有含金量了,所以也就开始进行了下一步的打算。

绿群往事#

我在大二上,甚至可以说我在大一下的时候就已经开始接触绿群,并且在里面认识了非常多的朋友。

从另一方面来说,因为在早期接触了 RM,养成了一些通宵的坏习惯,并且习惯于把电脑之类的东西都统一放在社团里面。可以说作为重度“网瘾”的我来说,一切的事情都要通过电脑上的工作流来解决,这导致我基本上没有回寝室和舍友交流的机会,当然也可以说这是我的咎由自取。反正无论如何,我在现实中与身边的同学们的交际并不算多,算得上好朋友的同学曾经有过几位,但是后面也都渐渐疏远了,主要是我不太习惯在社交工具上与别人一对一聊天(除了和女朋友),自然而然和他们就渐行渐远了。反正是因为各种原因,反而我在网上认识了很多的朋友,这里面来自于绿群的大概有二三十位,大多数同学比我大一级或者两级,也有一些和我是同级的。大概是因为我经常在群里面卖萌的原因(即口癖“喵”以及女装),以及经常和大家聊天,所以说倒也还算是比较知名。

这里面的不少同学,我也有和他们私下交流过,包括一些生活上的琐事或者是科研的见解,可以说是受益良多。

在这一年里面,我倒也做了不少的东西。一直以来绿群的服务是通过 Github 作为主要阵地,会维护一些夏令营信息以及实验室实习的信息,至于其他的内容则大多都被放在了群聊里。当时其实就有注意到一个现象,尤其是在下半学年里面,很多同学因为缺乏自信或者比较慌张,经常愿意在群中发表自己的具体情况,并且寻求其他同学的建议,类似于自己的水平可以去哪样的学校,通常称之为保研定位。实际上这种地位并没有很多的价值,但是毕竟能获得一个心安的效果,只是群里面消息说的太快,很多同学很难被照顾到,同时那些熟练可以定位的群 u,又经常不会在群聊中一直活跃,于是构建一个定位表的想法第一次诞生了。

就用腾讯表格创建了第一个定位表,当时由我来进行维护,搭建了一个简陋的雏形,可以进行匿名的情况上传,比如说输入自己的学校、排名以及竞赛科研情况,然后后面几个位置给其他人去进行评价。这个表格在推出伊始就获得了大量的关注,上千名的同学在里面填写了自己的情况,并且也有人进行积极的回复,甚至在小红书和知乎都获得了一定的传播。后来其他保研交流群,比如自动化交流群也迅速的进行了仿照,这可以说是我做出的第一个比较有影响力的事件。后面我对这个表格也进行了一段时间的维护,包括建立了排序功能,记录那些情况的被回复数量,并且加回复少的排在前面。

但这种风气之后还是没落了,一方面填写的人的激情是有限的,而另一方面,整体用户的数量也到达了一个上限。而且因为各种保研中介也来访问这个表格,爬取数据之后还将表格进行举报,出于隐私安全我又添加了权限限制,这导致易用性进一步下滑,后来更是转战谷歌,谷歌表格免去了被举报的风险,但是也进一步导致可以编辑表格的人数受到了限制,因为谷歌并不支持开放的表格,而且必须限制在一定允许用户范围内。

不过无论如何,这可以说是我在参与水群之外的绿群事务中第一次的亮相。在之后,一次和群友的闲聊中,大家都提及了 ccfddl,这是一个在科研圈知名的网站,统计了符合 CCF 的会议的截稿时间,十分的方便,而保研的各种夏令营和预推免报名,正好也符合这个需求。发现了实现的可行性之后,我立刻展开了行动,用了一个晚上的时间就实现了基础的功能,并且在后面进一步使用 Github Action 来进行自动化的处理,方便其他人对网站的数据库进行贡献。按照目前的方法来说,只需要提交一个 Issue,Issue 中的数据就会自动同步到网站里面。

这个网站长期以来给无数的学子提供了数据支持,并且可以帮助他们查漏补缺一些自己有能力去,但是没有注意到的去处,获得了上百个 star。

这个事情确实获得了广泛的讨论,而且这个项目目前依然在维护的状态下,相信在 2025 年也可以实现价值。因为为这件事情,以及之前的若干事情,我需要频繁发布群公告,来告知项目的更新情况,于是我顺理成章成为了绿群的管理员,并且进一步在 Github 中获得了绿群组织的 owner 身份。

上海实习#

暑假可以记录的事情,就是在暑假又一次去了深圳,陪着 RM 的队伍参加了比赛,然后又一次获得了十六强的成绩,这大概花费了一个月的时间,算是一个小小的插曲。

除此之外,也就是目前最重要的一件事情发生了。因为之前 ECCV 的中稿,以及时间的紧迫,我决定现在就开始实习,并且前往我比较喜欢的实验室。在询问了绿群的前辈以及广泛的调查之后,我陶瓷了 OpenRobotLab 的老板。可以说上海人工智能实验室是我从很久以前就一直特别想去的地方,大概是从大一开始了解科研的时候,就有听说那边的很好的氛围,不错的待遇,以及大量的科研资源,可以说是我非常理想的一个去处,所以说我的挑选范围从来就是在这个大的实验室下面的不同小实验室中。在多模态以及具身智能之间进行了挑选之后,我选择了具身职能作为目标的方向,事实上,我在此之前主要阅读过的是一些多模态领域的论文,或者更准确的说,其实是大模型时代这方面的论文,但是鉴于这个领域已经很久没有出现我比较喜欢的工作,以及具身的交叉范围更广,前景也更深,我认为也很有意思,于是做出了这个选择。

在联系了那边之后,那边的回复也是很快,大概就是当天就有了回复,那边的大老板约了面试。也就是那段时间,我开始陆续阅读了一些具身智能领域的文章。事实上,在此之前,我可能接触的更多的一些文章还是主要来自于多模态领域,尤其是大模型时代的一些论文,这里面主要是因为这些论文确实都比较有意思,当时读起来也很快。

然后进行了面试。面试的内容也不算很难,就是一些自我介绍,讲了自己之前的论文,并且讲了一下一些自己的领域里面的理解,经常被大家吐槽的公式以及代码的考核其实并没有太多,也可能是因为有论文发表,所以轻松了不少。

之后就是八月份,在深圳的比赛结束之后,我就立刻前往了那边,在公司旁边租了房子,并且开始了一个多月的上班生活。事实证明我没有什么不适应,一个人来到一个新的城市,然后独自生活和上班,这件事情对于我来说已经很自然。

上海本身和北京没什么大的区别,或者说我的活动范围一直在公司的附近,因为基本上全部的时间都在写程序以及科研,甚至在周六日也会去那边,所以说实际上并没有什么自由探索的机会,只是印象比较深刻的是那里的饭菜都很贵,在北京生活的时候,一般是家人带着出去吃,而西安又有学校食堂,外面的饭菜也不算贵,但是在上海吃一顿饭动辄就三十块钱起步。

在上海这段时间,也是认识了实验室里的其他同学以及 mentor。我和大老板淼哥交流不多,组里是伦哥带着,以及认识了豪哥、洋哥、xiaoshen、xinyi、haifeng 很多人,并且还和绿群不少的群 u 线下见面吃了饭(很多大三的同学当时都在上海人工智能实验室实习),可以说是拓展了一波社交,以及彻底融入了新的科研节奏和环境,认识了很多新朋友。

去上海的这段时间主要还是带着我的游戏本(大学入学时候买的外星人电脑),十分的笨重,而且因为电池老化,只有一个小时左右的续航,这也为我后续在大三的时候购买新的轻薄本埋下了伏笔。同时在那边还和两位其他的来自西安的同学 Selen 以及谢老师认识了,Selen 也是我这个领域的,将来可能会有很多交集,大家都是很好的人。

在上海线下的这段实习,主要就是在开始做了一次 paper reading,并且后续完成了一次算是考核任务的内容,复现了一个开源但是非常难以迁移的论文,并且熟悉了 Isaac Sim 的仿真平台,开始正式进行自己的课题。

但是确实时间不是很多,可以说是匆匆开始就已经结束了,后面就和 mentor 商量了一下,毕竟我是非常想后续就在上海人工智能实验室读博的,所以说肯定是要长期实习,在设置了若干的 todesk 等设备之后,就转了远程,然后就坐高铁回了西安。

尾声#

大二的生活其实比大一单调了许多,没有那么多的社团活动和社交,我把交往的重心转向了网络,而现实中基本上只有乐小姐这一个锚定点,所以读者才看到本篇内容的时候,会发现主要的讲述就是科研以及 RM,而几乎没有其他事情,事实也确实如此。

假如说大一的生活是第一次面向自由的美好,因为考试的顺利而偶然走向了学习这条路,在懵懂中探索,那么大二则是更加确定了自己的方向,我尝试了科研,并且有了科研产出,同时在一年之后,前往了新的实验室。这种速度虽然稳定,但是还没有令我足够满意,尽管我有了产出,但是也不尽如人意。

虽然对于自己还有诸多的不满意,但是这只是针对自己而言,假如与大多数同龄人而言,这依然是遥遥领先的状态了。大多数同学还宅在寝室里面打游戏,在课上刷着视频,任由时间的齿轮空耗。我可能相较于我大一的情况,现在已经免去了内耗,因为从一些角度来说,我确实已经走出去了太远。我不会在意同学的成绩是否比我高,或者大家的科研进展究竟是否比我快,我已经走在了自己的这条路上。

从现在的角度来看,我的大二生活相较于自己的设想,是骨感的,没有那么的丰富,充满科研以及学习,而是依然有很多时间在空耗的自我感动中度过,但是依然已经是可圈可点的一年了。只是新的大三中,我或许还可以做的更好。

大二回忆录
https://axi404.top/blog/uni-memoir2
Author 阿汐
Published at January 5, 2025
Comment seems to stuck. Try to refresh?✨