跳转至

我的论文阅读

约 1442 个字 预计阅读时间 5 分钟

本人是一个刚开始阅读专业学术论文的小白,本科期间读过一些综述和研究,但是基本上没有完全读完过🤦‍♂️,虽然英文水平还可以,但面对大段的英文还是头皮发麻。在AI工具的帮助下,我逐渐建立起自己的一套阅读工作流。

由于CC获取不到账号,且GLM Coding Plan抢不到(太难抢了bushi),我不得不给Cursor充了会员,之前用了一段时间CC感觉确实很强,文本生成代码编辑上没得说,Codex一直想试试没开始,opencode也用过,主要试了下里面的Qwen和MiMo,但是opencode太慢了,目前主要用Cursor。

我会把从arXiv上下载的论文放在Zotero中管理,用Cursor先给我将其翻译成中文版本(一字不差,图片截取放在/assets中,参考文献标注好链接)。

论文翻译提示词

你是一个学术论文翻译助手,你具备中英翻译的技能,可以对PDF中的内容进行准确、高效地翻译,并且符合语境和实际研究方向。现在请将×××(论文路径)这篇论文的正文和参考文献以及附录的内容全部翻译成中文,每一个章节都需要详细准确地翻译,不要遗漏,包括对应的参考文献也加上去,图片请截取放在对应的文章位置处,表格类的图请不要用markdown的表格语法而是直接用原图,将翻译的内容放在×××.md中保存。

接着我会精读一遍原论文,用翻译的中文看英文,阅读上少了很多障碍,我会从摘要开始,摘要中浓缩了整篇论文核心的内容和方法,然后从Introduction开始,到Related Work,然后是论文最重要的Methodology部分,这一部分会有阅读难点,对于作者的一些思想动机和方法、公式什么的需要多方搜索,或者问AI老师,我会在中文翻译文档中或者是Zotero中在相应位置写下我的QA,完成Methodology后论文的理论部分就结束了,对于Experiment部分,重点关注作者和哪些baseline做对比的,采用了什么具体的实验设置,比如数据集划分、超参数设置、评估指标等等,实验主要的内容无非是和SOTA方法做对比,以及进行消融实验分析模块有效性等等,实验部分主要告诉我们提出的方法怎么好,好在哪里,以数据的形式呈现,最后就是Conclusion部分,对文章做总结。有时候实验详细设置和公式推导会在附录部分,这里在通读完整篇论文之后也是必须要看的,因为你在复现的时候可能就需要对论文中的具体超参数进行配置,附录部分可能会有。

精读完论文后就会对论文有个大致了解,论文的Motivation、Methodology、Experiment是必须熟悉的。接着需要做PPT进行汇报,我尝试了Cursor生成PPT,

学术论文PPT生成提示词

@/pptx(这里我使用了pptx这个skill帮助生成) 你是一个组会论文PPT制作助手。我现在需要在组会上汇报×××这篇论文,请帮我设计一下PPT的内容,按照背景、动机和方法、实验与结果、消融实验、总结与展望、参考文献六个板块,PPT大概20页或者20多页。×××(文件路径)是论文原文,×××.md是中文翻译,请你结合中文翻译制作PPT,analysis.md是一篇对于这篇论文的总结分析(可有可无,这个我从github上找到了每日arXiv论文爬取和分析的仓库),涉及到这篇论文的动机和不足之处,可以参考。×××.pptx是PPT模板(你制作的PPT模板,通常我会用学校的模板),请使用这个模板;/assets 中有论文中的图片。

Cursor会对论文进行分析,对我的PPT模板也会生成py脚本操作,最后将PPT进行填充,但是图片它只给了我路径,没有插入到PPT中。我还尝试了Coze中的PPT技能,它会生成学术风的PPT汇报,个人感觉还是挺不错的,但是在一些细节上还不够,比如对于数学公式很头疼,直接在PPT中输入太麻烦,这些AI工具生成的也是垃圾,后续会尝试一下Genspark。

阅读一篇论文的有效时间大概是2天,一天完成翻译和精读,一天生成PPT并调整字体格式、插入图片、复盘论文、生成讲稿。如果是单纯获取论文Idea和总结贡献,大概只需要Prompt一下。阅读的过程中还有一个很重要的点,就是其实我们是通过阅读论文来补充领域知识的,比如阅读了POP: Online Structural Pruning Enables Efficient Inference of Large Foundation Models这篇论文,我会对LLM/MoE/VLM 模型和数据集特点进行学习,了解大模型推理训练流程、Prefill和Decode过程、上下文稀疏性相关研究等等,这是阅读论文除了Idea之外最大的收获。

还有在多次汇报下来的经验,比如怎么联系几页PPT的内容,讲清楚一个概念,把方法和公式解释好,实验和消融部分不拖沓,直接讲重点,以及要提出自己的一些思考等。