陈峰做的医学图像处理领域的数据集少得可怜,这个很容易理解,跟医药相关的数据大多都是各大医院的机密,论文作者不会轻易公开。
也就是因为陈峰的导师跟花城市第一人民医院有项目合作,所以才能拿到部分相关数据。但拿到数据只是个开始,还需要陈峰自己进行数据处理。
凌志就没这么幸运了,他的研究方向跟社交媒体中的舆情分析有关,具体而言就是找出社交网络中的水军,也就是属于同一个现实世界人类的不同账号。
他们通过多个账号发布垃圾评论扰乱社交网络秩序为乐,甚至有的商业机构会专门雇佣水军发表负面言论攻击竞争对手,影响十分恶劣。
水军自然不会告诉你自己是水军,而且社交网络的数据大多都很敏感,很少有人专门整理,所以这样的数据集很难弄到。
凌志在过去一年的时间里在数据集上花费了大量的时间,目前他所用的比较好的办法是将同一个人发布的推文分成2份,假装是2个账号发布的,虽然不够真实,但从做实验的角度看足够了。
凌志并不觉得有数据集和没有数据集这两种情况孰优孰劣,但凌志相信一句话,只要你付出,虽然不一定成功,但一定会有收获。
所以尽管凌志在科研上进展缓慢,但采集社交网络数据的过程让他掌握了数据采集、数据分析以及数据预处理等多项技能。
虽然他还算不上是处理数据领域的专家,但也算是积累了丰富的经验。
“唉,话虽这么说,但是内心还是很痛苦的呀,老哥。我自己觉得效果差不多了,但是我导并不放过我啊。”
“那算你倒霉,不过既然你导不满意,目前来看也只能在数据处理上再下下功夫了啊。”
“只能这样了,我回去再挑一挑数据,看看有没有不干净的。”
“那你努力,需要帮忙跟我说一声。”
“行,没问题。那我先走了,拜拜。”
“拜拜。”
陈峰去了学院楼五楼,而凌志的实验室在二楼,所以陈峰坐电梯上去,而凌志直接开11路走楼梯上去了。
时间还早,实验室只来了一个人,周敏师兄。
周敏师兄比自己大1届,预计明年毕业。研究方向是导师王海波的老本行,多目标车辆路径优化问题。
老王在这个领域深耕了多年,发表多篇论文。底下弟子也带过很多届了,一开始都是做