尽管说起来上一次,说的是记完上一次之后就很快要记这一周,然而因为各种各样的事情还是耽搁了,事实上确实是科研的压力太大了,而且还伴随着其他的琐事。
科研#
现在距离 CVPR 也就剩下的寥寥无几的不到两周时间,科研压力也越来越大。一方面要做数据生成,这是我的科研内容的一部分,随着时间的推移,后面应该也可以慢慢更多的透露我在做什么,当然,等到工作发表之后,我会完整讲一讲。另一方面又有其他的很多工程内容需要去实现。要是满打满算来看,实际上这次科研我足足准备了三个月时间,不过从现在来看,还是有点太勉强了。主要的一个多月时间,我都在熟悉这个框架,剩下的时间有课内的压力,而且我所在的框架的生态并不友好。大量的内容,要是文档里有都已经谢天谢地了,有可能你需要的一些功能或者遇到的问题,都只能在论坛里面寻找答案,甚至要自己去看源代码,这毫无疑问极大的降低了我的开发效率。
而且和那位大四的同学一起合作的过程中,另外一件事情,当然也是之前感慨过的,就是一些套路化的代码积累真的很重要。目前基本上每一个功能我都是手动实现的,这毫无疑问给我带来了巨大的负担,把大量的时间浪费家的不必要的地方。
北理工学术会议#
这一周还值得一提的事情是,受到了辅导员的邀请,我去北京理工大学参加了一次学术会议。与其说是学术会议,其实就是北京理工大学那边的荣誉学院,和几个兄弟院校的荣誉学院(包括我们西安交通大学),邀请我们几个学院出一个人,和他们的一些人一起分享一下自己的科研成果。
讲实话,我并不是很喜欢之前的工作,当然这并不是说我会把它看作是黑历史,实际上这篇工作相当不错,也在中稿之后给我带来了巨大的持续收益,不过相较于现在的我更加喜欢大规模的工作或者那些能够指向问题本质的工作来说,显然之前的这一篇实在是太儿戏了。
因为要去参加这个会议,所以我又特意制作了 PPT,现在这一套成熟的 PPT 是根据之前去上海那边面试的 PPT 修改改过来的,经过了这几次迭代,想必将来也就可以在其他人再邀请我的时候,不需要耗费更多的精力。
现在我非常看重积累这件事情,然而这不是一个可以分享的经验之谈,因为对于新手来说,即使他们知道也无从积累,而对于老手来说,在体验了几次更加熟练的人依靠积累建立的优势之后,也就自然而然会出现这种想法了。
无论是学习资料,还是自己的一些经验分享总结,或者其他的一些东西,比如说水赛的课题,在我某一次耗费了大量的精力,将这个东西实现之后,我希望他可以持续地为我创造价值,而不是一次短暂的瞬时收益。
这个看法,其实我觉得在当下尤其重要。事实上一名老练的科研工作者,相较于那些新手来说,本质的学术水平的差距已经不再是那么明显了。不同于数学存在大量需要彻底理解的公式,很多深度学习方面的见解都是浮于表面的,只要有一名尽职尽责的学长带路,不到一个月,这个人就可以醍醐灌顶。所以真正区分不同人的价值的区分点在哪里呢?关键就在于工作的效率。
有的人只能主导一个课题,而有的人可以在主导自己课题的同时,为别人的课题提供数据,跑一些实验,以及写论文和画图,从而成为了二三四五作。当然这种看法并不是说,想要大量地添加无数的没有意义的论文到自己的名下,或者出于合作关系的挂名,而是确确实实出了一份力在有价值的课题里。
每一个人的时间都是相同的,假如我们都同样聪明,也都同样努力,那么是什么让我们分出了三六九等,答案是效率,而为什么我能够在一段时间内做出更多的事情?是积累。
这种积累体现在两个方面。一方面是知识的积累,比方说对于现在的我,我已经可以比较熟练的部署各种模型,我熟悉我的仿真平台,我熟悉调用 GPT,然而我不熟悉真机的使用,不熟悉模型训练以及集群使用,也就让我需要在这些任务上花费更多的时间(事实上这一点也是之后,我打算进行自我积累的),对于其他人来说,他们已经掌握,就不会像我一样花很多时间在处理简单的报错上面。另一方面就是代码的积累,可能我采集数据有一种自己的格式,而不同的模型有不同模型的格式,我对于某一个模型的格式写了一套转换的代码,而且我也熟悉了这个模型的训练流程,我就可以毫无压力的进行这个模型的丝滑训练。假如恰好别人需要这个模型,那么他把数据给我,数据格式转换以及模型运行的一体化代码,就可以快速地完成他的需求,从而成为合作者。
这大概也是我最近的一些感受,也算是一些分享了,不过最近确实感觉,CVPR 貌似有点来不及了,我也不知道如何才能赶得上,但是还是尽到自己最后一次努力吧。