读研一周年随笔

读研一周年总结

今天有幸参加KDD CUP 2018的一个线下聚会,遇到了很多高手,学到了很多,主要是开拓了视野,优秀的人真的很多。

大四跨专业考研计算机成功。记得大四是6月30日毕业,正好周五,周末在家呆了两天马上就奔赴实验室了,7月3日周一,正式开始了我快(gou)乐(ri)的研究生之旅。

记得去年7月和8月,实验室新开了个交通数据挖掘方向,让我和我师姐一起去调研,然后就疯狂给甲方出方案,出文档,出PPT。当时反正也没学到什么,感受到的就是每天都在写文档,然后反复改,还得去甲方开会,感觉没啥意义,对我来说。那个暑假同时还负责研究hadoop HA的搭建,写了份初稿,然后发到简书上的博客去了,还被加入了什么专栏,前几天回头再看的时候感觉写的跟shi一样。暑假的时候第一次感受到了在北京挺辛苦的。当时没地方住,只能回家,回家坐公交车1个小时,就这样每天都得坐公交来回两个小时,晚上经常在车上睡着。当时项目上还有点开发任务,我记得当时用spark做了一些车辆轨迹的分析,当时学会了怎么写spark。然后就没啥了,那个暑假在coursera上面刷了一些机器学习的课,华盛顿大学开的,学了boosting啊,stacking啊那些东西。

然后不知不觉进入了9月份,开学的日子,开了学之后发现,卧槽老师一个比一个牛逼,讲课都好棒好棒的。等过了一段时间后,也就那么回事,可能是习惯了,就觉得还可以了。当时的机器学习和留学生一起上,还挺有意思的。周一到周五只要不上课,就在实验室呆着。上课的时候倒是还挺有意思,上人工智能的逻辑基础时,总是晚上上课,然后就困,虽说做第一排,但也会趴桌子睡着,最后考个第六,还可以。复杂网络的时候就一直玩手机了,复杂网络我们班同学选的还挺多,他们老在一起玩王者荣耀,挺有意思的,我现在还是挺羡慕他们上课一起玩游戏的,因为现在没课上了。。。复杂网络答辩前一个月,撸了好几篇论文,最后得了个第一,不过看的那几篇论文真是让我学到了很多东西,答辩时我说有一个算法只要调调参什么的,肯定最后效果很好,老师当时说不一定,当时我没有理解,后来我才理解了为什么不一定,后来随着看的论文多了,复现的多了,发现有些论文就是在扯淡,吹的挺好的,实际很渣。然后就是什么数学课啊,什么英语课,英语课最后也考了第一,主要是考研时英语打的底子有点深……感觉真的是终身受益,即便是读了研究生扇贝全家桶也一直在用。考的最渣的就是算法了,主要是后来都没怎么复习,觉得认真准备考试真的越来越没劲了,索性就看了看PPT,最后才考70多分,机器学习才80多。。。唉,就这样吧,毕竟考试分数代表不了任何东西,大家都在cramming,有什么意思呢。所以当时我就接着看论文,自己跑实验来着,那时候一直搞推荐系统来着,本科的时候就玩过,什么协同过滤啊那些玩意,当时机器学习老师给我们讲了矩阵分解的好几个算法,于是我就找了论文研读了一下,虽说都没有实现,但是确实懂了很多,在GitHub上还找到了一个开源实现的implicit feedback recommendation,那个代码真是牛逼,看都看不懂,cython的爆炸性能很强,自己写了很多爬虫,爬各种东西,抓取用户的行为数据,然后跑推荐。那个学期好像没什么印象深刻的事情,反正觉得实验室挺没劲的,项目很水,经常去清华科技园,给甲方运维去,找工作的时候都不好意思说这事。当时我们实验室有个很牛逼的师兄,推荐我去跟着李沐大神每周在斗鱼上的直播,学深度学习,然后我就去了,虽说没有每周都看直播,但还是经常看看录播的,学会了如何使用mxnet里面的gluon,然后就实现了一些网络,跑着玩来着。

寒假的时候,学校放假了,但我们实验室不放,就在实验室看论文来着,只不过老师让我看看群体个体出行轨迹什么的,反正就是研究用户出行规律的。当时我们学校交运学院的在nature communication上面发了论文,让我赶紧研究,我看了看,感觉和计算机研究的基本不相关,他们就是建模,然后用公式来做仿真那样的东西,也不是预测分类啊什么的。寒假在实验室水了水就过去了。然后放我们实验室的寒假了,17天,在家疯狂看cs231n。越看越爽,Justin讲的太好了,还有那个女博士,讲的很棒,学到了很多知识,为什么必须要均一化啊,常用的优化算法的参数啊,各种小trick,现在一看还真没什么大不了的,但那时候给我帮助很大。我就反复的跑mnist,发现accuracy一直在上升,每天都有成就感,寒假顺便还把我的博客搭建起来了,在GitHub上面。放完实验室的寒假,就回实验室接着干活了。忘了干什么,反正马上开学了。

开学之后还是,每周都往甲方跑,前几周好像还是运维,后面就做数据分析了。数据分析就更扯了……用pandas疯狂做各种数据的统计,各种指标全靠自己想,然后画图,写文档。异常坑爹加没劲,做完了也没有卵用,甲方看完连个反馈都tm没有。然后这个项目没弄完呢,又开辟新项目了,让我也参与那边的项目,那边要用的hbase我根本没怎么接触过,那整个4月份,是我最难受的一个月,有一次直接被气哭了,我来读研又不是来学这些的,当时直接不想念了,接着读也没有必要,觉得自己其实就是进错了实验室,天天干些low到不行的活儿,宝贵的时间就这么一分一秒的没了。后来老师也不让我接着去之前那个甲方出差了,那些low活也不让我干了,让我开始学习。4月份的时候看了不少论文,也复现了很多,两版ResNet,一版风格迁移,一版perceptual loss,当时就一直在看CV的论文,学到了不少东西,比如卷积核如何提取特征什么的,感觉那时看的几篇论文又一次拓宽了知识面,之后就是看了一些nlp方向的,机器翻译、NER一类的。5月份的时候还去北大听了MSRA周明博士的讲座,最后的感觉是:牛逼!知道了什么是深入浅出!那时候5月份的时候正好赶上院里面的活动,班级风采大赛,这是我研究生期间参加过的最有意思的活动,也是最难忘的。我们班同学都太给力了,真的很令人感动,演员们真是太用心了。记得当时想剧本,真是想破脑袋了,经常去开会,大家在一起讨论,经常就讨论不出来了,没有灵感了,不过最后总是能突然闪出一个想法,然后大家就在一起讨论。后来活动结束后,大家还一起出去玩,520那天,漂流的时候一个比一个惨哈哈哈哈,5月真的是我最快乐的一段时光,永生难忘。那之后,我就变了,我觉得过得快乐不快乐完全取决于自己是如何看待周围这些事情的,本科的时候没有那么多破事,或者说本科的时候能逃避的都逃避了,但是研究生期间,天天有破事,时间根本不是自己来把控,是boss,是周围的各种有的没的。之后我就把所有的事情都看淡了,快乐还是很重要的,如果自己不能让自己保持一个快乐的心情,那很有可能就是每天状态都非常不好,整天郁郁寡欢的。6月份过的很平静,每天写写作业,帮同学们解答问题,处理他们的虚拟机啊什么的。其他时间看看论文,逛逛GitHub,找一些有意思的工具,然后提提issue啥的。然后就是准备考试,因为一切都看淡了,所以考试成绩都挺惨的……高级D课直接挂了,挂了就挂了吧。平时专业课什么的不挂就行。考试周的时候,抽一部分时间看看考试,其他时间干自己的事情,复现复现论文什么的。

7月份,又迎来了暑假,暑假只有9天,我决定八月底放暑假,因为放的早就没盼头了。。。暑假项目也正式开工了,监督学妹做项目,我接着干自己的事情,搞研究。今天去KDD CUP 2018线下聚会,开拓了视野,我之前一直认为,搞什么数据挖掘,机器学习,没有牛逼的学历,没有牛逼的背景,还搞毛啊,今天发现,不是这样子的,我已经忘了我为什么当初会考计算机,当初考计算机的一个直接原因就是,这行不是靠实力吃饭的吗,但是读了研究生之后,看师兄们找工作的时候,说和北邮啊比不了什么的,潜意识中就逐渐变成了校名决定自己能去哪里,出身决定一切。读研这一年,总会把自己,拿去和那些特别牛逼的选手作比较,总会把自己,和清北那些学生作比较,总觉得平时干那些运维的活儿,就是浪费时间,时间一点一点的浪费着,和那些牛逼的选手越差越远,最后找了个普通工作,学习也变得越来越功利。今天的聚会里面,很多人都没有那么过硬的背景,有个大神,大学都没上,参加了自考,机器学习这些人家全都是自学的,现在马上就要被某银行破格录用,正在走程序。今天他的一个领导还去了那个活动,说想找那种觉得跑模型比打游戏有意思的同学去他们银行,那一刻我才真正的意识到,其实这世界上有很多人热爱计算机,热爱机器学习的,觉得跑模型比打游戏有意思的人多了去了,只不过我一直局限在自己的小圈子里,局限在自己的实验室里面,没有接触到这些人。我考试周之所以不怎么复习,这两次都是因为在跑模型,感觉跑模型上瘾啊,停不下来。

总的来说,读研一年了,实验室挺没意思的,当初是非常期望去实验室学习,早点进实验室,因为当时对实验室有着憧憬,进去之后一堆大神,像我这种跨专业的菜鸡可以学到很多东西。进了实验室后发现,实验室除了提供一个好的环境,有时候连氛围,都没有。打比赛连队友都找不到。。。后来看淡了这一切也就无所谓了,环境无法改变的话,那就不要让环境把自己改变,坚信自己认为对的事情就好了。暑假任务很明确,好好学习,好好看论文,今天主办方说以后好搞将论文,分享模型的活动,看看到时候能不能投投稿,赚赚稿费。然后想做些有意义的事情,争取明年找工作前能发一篇顶会,或者发个sci。然后找个比赛,认真打一下,多参加参加这种线下活动,和大神们多交流,学习,差不多这就是今年夏天到明年夏天的任务。

感觉这一年迷失了双眼。希望新的一年,目标更明确,能更努力的去提升自己,多做有意义的事情。