最近几年,研究者往计算机视觉领域的顶会投的论文越来越多。下图就能明显看出这一趋势,尤其是从年开始,论文提交的数量成指数型增长。如此激烈的竞争也让很多研究者颇为焦虑,到底什么样的论文更容易被顶会收录呢?
好论文到底长啥样?
来自弗吉尼亚理工学院的Jia-Bin-Huang教授利用神经网络生成了一个识别好坏论文的分类器,通过输入论文的整体版面的视觉情况(就是看“脸“)来使分类器预测一篇论文应不应该被接收。
简单来说就是,这位研究者希望告诉大家,在论文内容不变的情况下,如何排版和撰写更能写出一篇“好论文”。
论文立刻成为了今天学术圈的热门话题,先来看看作者得出的几个结论:
好论文的特点:第一页中都有预告图用于说明主要思想,有各种表格/图表均衡插入论文各处,来展示验证性实验,有重要的数学方程式,以及有彩色图像列表来量化数据集的基准。
“坏论文”的特点:通常都写不满8页;前两页缺少数字和插图会让读者看不懂。
除了给研究者写论文的参考,作为CVPR、ICCV的领域主席,作者更希望通过论文中提到的“好坏论文分类器”,来减轻论文审核人的工作量。
最终得出的结论从数据上说值得一看。根据测试数据集的检验,此分类器允许0.4%容错率的情况下(拒绝0.4%好论文),能够准确的判断出50%的“垃圾”论文。总的来说,在论文数量庞大,审稿人有限的现实下,这个分类器能够大大减少工作量。
作者还自嘲了一下,自己这篇论文拿给分类器审核,得出的结论是97%的概率会被拒稿。
研究方法
训练这个分类器所使用的训练数据集是~年CVPR和ICCV的会议论文,将这些数据丢进神经网络,根据论文的“颜值”,输出论文的质量。用年CVPR的论文进行验证,准确率达到92%。
此外,Jia-Bin-Huang还为广大的计算机视觉领域的研究者提供了一些建议,帮助他们提高论文美录用率。
研究方法的创新之处,是在训练数据的过程中并不是直接学习图像的映射。而是通过端到端的训练过程,以深度学习的方式重新审视“颜值”问题,从而能够学习特定任务的表现形式。
数据集获取:如何定义好论文和坏论文
研究者从计算机视觉顶会的接收论文列表中收集正样本(好的论文)。
因为无法获取到被拒绝的论文,研究者用workshop的文章做一个近似。
当然,作者也对这一“差论文”的数据集进行了说明,毕竟非常多的workshop论文也会被重要会议收录。
同时,workshop的文章被认作“hardnegative”,有很多文章被评论和复审标示出来从而得到了改进。
数据处理
数据获得和处理。介绍一些平常运用这些数据集的具体步骤。
文件分类:一些workshop对于主要会议文章的有其特定的版面要求,例如需要6页的内容是与数据来源相关。分类就变得不那么重要。我们因而只保留7页多一点就已足够。
PDF2Image::我们用一种基于python的软件-pdf2image-把pdf文件转换成图片,然后剪裁成2×4网格大小。如果缺失第八页,我们就给它放一空页。原始转换后的图片有×像素那么大。
预处理:避免数据落项,我们会把首页标题去掉。如果不做这一步,分类器很多时候就会出现故障,它就只白癜风治得好吗白癜风诚信为民