Papers with Code

Papers with Code是一个专注于人工智能AI领域的论文代码分享平台，主要为了解决长期存在的“论文与代码脱节”问题。该平台致力于打破传统学术研究与实际工程应用之间的壁垒，让学术成果不再只是“停留在纸面”的理论讨论，而是可以真正复用、检验和改进的技术资产。

Papers with Code 的核心使命可以归纳为三点：

提升人工智能研究的可复现性：通过将论文与其开源实现代码关联，帮助研究者和开发者快速验证实验结果，减少重复劳动。
推动研究成果的透明化：每一篇论文的代码实现都公开展示，便于同行评审、性能比较以及知识共享。
建立结构化的 AI 研究资源体系：通过任务分类、模型性能排行榜、数据集索引等方式，构建一个“有组织”的研究生态系统，而不是“信息孤岛”。

这一平台最初是由 AI 研究者社区自发构建的开源项目，后来获得了更广泛的关注与合作。自 2018 年以来，Papers with Code 与 arXiv 等学术平台建立了深度集成，很多新发布的机器学习论文会直接附带代码仓库链接，实现“从理论到实践”的无缝衔接。如今，该平台已被全球无数高校、研究机构以及企业实验室视为“科研必备工具”。

不仅如此，Papers with Code 的用户构成也远超传统意义上的“研究人员”。它对以下人群同样具有极大价值：

高校学生与研究生：在进行文献调研时，可以借助平台快速找到任务相关的 SOTA（state-of-the-art）模型、代码和数据集，大大加速学习和复现过程。
企业工程师与技术决策者：可以依据排行榜和公开实现，了解最前沿的模型选择和性能对比，有助于在项目中进行“技术选型”。
教育从业者：可以将平台内容作为教学素材，引导学生基于真实论文进行项目开发、算法改进。
开源社区参与者：平台支持社区用户上传自己的代码实现，形成良性互动和协同进化的研究氛围。

更重要的是，Papers with Code 并没有将自己定位为一个“论文仓库”，而是构建了一个任务驱动的研究知识库。你不仅可以搜索某篇论文，还可以从“图像分类”“自然语言生成”“推荐系统”等任务出发，系统地了解各类方法的演进过程和性能差异。它在视觉上和结构上都做到了高度组织化，使得复杂研究内容变得“可导航、可操作”。

尤其在当前 AI 大模型持续涌现的背景下，Papers with Code 为技术趋势的监测与筛选提供了可靠入口。比如，“哪种多模态模型在特定数据集上表现最优？”“有哪些模型实现了最新突破？”这些问题不再需要翻阅几十篇论文，而可以在排行榜或方法索引中一目了然。

Papers with Code 并非只是“为了找代码而生”的网站，它的更大价值在于：

帮助用户“从研究问题出发”而非“从论文标题出发”；
让理论成果有路径落地，让实践操作有理论支撑；
让 AI 研究真正回归“共享、透明、进化”的本质。

平台概述

起源与发展

Papers with Code 起初是由人工智能社区的几位独立研究者于 2018 年左右发起的一个开源项目，其初衷非常朴素：为 AI 研究成果提供可验证的实现支撑。彼时，虽然 arXiv 和 Google Scholar 已经在学术界占据重要地位，但绝大多数论文发布后并未附带公开实现，导致很多研究无法有效复现，结果也难以被同行客观验证。

这一问题对于人工智能领域尤为严重。因为 AI 模型对训练数据、初始化参数、优化细节等高度敏感，缺少原始代码支持，即便细读论文，也很难“原样复现”。这不仅影响科研效率，也在客观上抑制了学术成果的传播与演进。

Papers with Code 的做法是：将论文、代码、任务、模型、数据集、评估结果等要素，以结构化方式进行整合，构建一个跨越学术和工程的统一界面。平台允许用户基于一个“研究任务”（如语义分割、文本生成、机器翻译）查看该任务下的所有已发布论文、最佳模型、公开实现、对应数据集以及最新评估指标，打破了过去“散点式知识获取”的局限。

这个项目一经推出便迅速获得 AI 研究圈关注，不仅被多个高校研究组作为课程辅助资源使用，也获得了不少顶级期刊论文作者的主动投稿支持。平台随后也开始将 arXiv 上的机器学习类论文（特别是 cs.LG、cs.CV、cs.CL 等分类）自动化抓取，并尝试与 arXiv 建立更深层次的集成关系。

与 arXiv 的合作机制

目前，Papers with Code 与 arXiv 建立了非常紧密的合作通道。平台不仅会自动收录 arXiv 上每日更新的论文，还通过 API 对接机制，实现了两者内容的“互补共生”。一方面：

Papers with Code 利用 arXiv 的元数据（如标题、摘要、作者、发布时间等）构建论文索引；
另一方面，它还允许用户主动提交某篇 arXiv 论文的 GitHub 代码链接，构建“论文-代码”的关联对。

为了进一步增强学术内容的复现性，Papers with Code 推出了一个名为 “Code with Papers” 的标识计划。只要某篇论文提供了可运行代码，平台会自动为其添加标志，提醒用户“该论文已提供实现，可供验证”。此外，平台还允许用户为论文打标签、撰写方法描述、标注性能指标等内容，丰富元数据质量。

这些机制使得 Papers with Code 不再只是一个信息聚合平台，更像是一个“研究知识图谱”的构建者，它在 arXiv、GitHub 与研究社区之间形成了一套交互闭环，极大提高了科研信息的组织效率和获取便利性。

平台开放性与社区机制

一个优秀的科研平台，既要有数据驱动的结构化能力，也要有社区驱动的开放参与机制。Papers with Code 在这方面也做得非常成熟。平台采取“半开放式”贡献机制，即：

用户类型	可参与的操作	审核机制
未注册用户	浏览任务、论文、模型和排行榜	无需审核
注册用户	收藏论文、上传代码链接、贡献数据集信息	经平台人工或自动系统审核后生效
高级贡献者	撰写方法说明、编辑任务标签、上传完整 benchmark 数据	需通过审核，部分为官方团队协作完成

此外，平台还设有一个名为“任务维护者”的社区角色，类似于开源项目的“核心贡献者”，他们负责维护某个研究方向下的方法分类、模型性能指标、论文归类等内容。这种机制既保证了内容更新的活跃度，也确保了数据组织的专业性。

同时，平台所有数据基本都遵循开放协议（如 CC BY-SA），并提供 API 接口，方便开发者在自己项目或平台中调用、二次开发。例如，已有一些高校实验室基于 Papers with Code 的任务索引和模型性能数据，开发了自己的模型选型工具或课程平台，进一步提升研究效率与教学体验。

多语言与全球化支持

尽管 Papers with Code 起源于英文用户为主的科研圈，但近年来平台也逐渐加强了对多语言用户的适配。部分任务和方法标签已经提供了中文描述，用户上传信息时也可以使用中文补充内容。再加上其简洁明了的 UI 设计和结构化分类，对中文用户而言，使用门槛较低，整体体验流畅。

此外，平台也正在积极建设全球化的合作网络。目前已经与包括 Meta AI、OpenAI、Google Research、Stanford、MIT 等多个组织的研究组建立数据对接机制，确保每一份研究成果都能“被看见、被用到、被超越”。

核心功能详解

Papers with Code 能成为全球 AI 研究者和工程师的高频使用平台，根本原因在于它提供了一套结构化、任务驱动、可交互的研究工作流。在这个平台上，用户不再是“孤立地查找论文”，而是围绕一个具体的研究任务，从论文、模型、代码、数据集到评估指标，完成“端到端”的全流程信息获取。

论文与代码整合：打破“看得懂，做不出”的壁垒

Papers with Code 最具代表性的功能就是将论文与其实现代码自动配对。这一做法直接改变了学术研究中最常见的“纸上谈兵”问题。

主要特点如下：

每篇论文页面中，都会有一个显眼的“Code”标签，指向论文实现的 GitHub 仓库。
平台会自动提取该代码仓库的活跃度信息，例如 Star 数、Fork 数、最近更新日期，帮助用户快速判断其维护质量。
若一篇论文有多个不同实现版本，平台会并列列出，并注明作者是否为论文原作者，以便用户选择“官方实现”或“高质量第三方版本”。
部分论文代码甚至包含一键运行的 Colab 或 Jupyter Notebook 链接，实现“即点即试”。

典型使用场景举例：

用户希望复现一篇关于图像生成的 GAN 论文，通过平台直接找到其官方 PyTorch 实现，并从代码页面跳转到 Notebook，几分钟内即可观察模型效果，极大提升研究效率。

这种“论文即代码”的整合方式，直接推动了 AI 研究的可复现性，也缩短了理论成果到工程落地的时间。

数据集索引与管理：研究起点的结构化导航

在 AI 研究中，“选对数据集”往往是成功的一半。Papers with Code 设立了一个系统性的数据集管理模块，不仅提供每个数据集的基本信息，还关联其适用任务、已有模型表现、引用频次等多维指标。

核心信息结构包括：

信息项	说明
数据集名称	支持搜索与分类浏览
适用任务	如图像分割、情感分析等
任务表现指标	如 Accuracy、BLEU、mIoU 等
模型排行榜	按当前 SOTA 排序
论文引用情况	显示相关论文总数
下载链接	提供原始数据源跳转

高效使用建议：

如果你是学生或研究者，不确定“哪个数据集用于哪个任务”，可从任务页出发，查看当前最常用的数据集；
如果你是开发者，希望做 benchmark 测试，可选择该任务下拥有最多模型实现的主流数据集，快速搭建评测体系；
如果你是教学人员，可以根据每个数据集的使用频率和开放程度，选定教学案例用作课程实验。

这种从任务出发反查数据集的方式，比传统“数据集大全式索引”更高效也更贴合研究路径。

方法与模型分类：技术演化的全景视图

Papers with Code 不仅是论文与代码的仓库，更是一部AI 技术演化史的索引表。

平台针对每一个任务（如图像分类、命名实体识别、语义分割等），都提供了相应的方法演进图谱。以“图像分类”为例，用户可以看到如下结构信息：

基础方法（如 AlexNet、VGG、ResNet）
高级方法（如 EfficientNet、Vision Transformer）
最新模型（如 ConvNeXt、SAM、DINOv2）
性能比较（附评估结果和论文链接）

每种方法下，都能看到：

方法简要介绍（支持社区共同完善）
应用的数据集与评估结果
所引用的论文与模型实现
在排行榜上的位置与得分

这种方式非常适合做技术路线梳理，尤其在以下场景中极具价值：

比如要写一篇综述文章，调研“从 CNN 到 Transformer 的演化路径”，通过方法模块即可追踪关键方法发布年份、引用情况、性能提升轨迹。

这种模块甚至可以当成“自动化的文献综述初稿”，是提升科研写作效率的利器。

排行榜与评估表：让“最优模型”一目了然

传统科研中，判断一个方法是否“先进”往往需要阅读大量论文并比较不同模型在不同指标下的表现，非常耗时。Papers with Code 的排行榜机制则通过标准化评估流程，大幅提升了“技术优劣”的可视化程度。

排行榜核心特点如下：

功能	描述
支持按任务查看（如情感分析、机器翻译）	提供任务专属页面
多指标并列展示	支持 F1, BLEU, mIoU, AP 等多种评估指标
模型对比	可直接比较多个模型在同一数据集下的表现
结果来源追溯	每条记录都附论文与代码链接
自动与人工标注结合	平台抓取 + 用户提交结果并经审核

平台鼓励用户上传自己实现的评估结果，只要符合任务标准，便可加入排行榜。这种开放评估机制构成了一个“持续竞争与进化”的动态系统，能够实时反映技术趋势。

Papers with Code 的核心功能彼此串联，围绕“任务”构建信息通路。其整合逻辑如下：

从任务出发：明确自己研究方向或项目目标；
查找相关论文与代码：优先使用已验证的实现作为参考或起点；
分析方法路径：了解目前最优模型以及其技术原理；
评估性能排行：确认主流数据集上的最佳模型结果；
反查数据集特性：选择适合自身需求的公开数据资源。

这种结构不仅符合 AI 工程的研发流程，也体现了科研走向产业应用的路径逻辑。

用户指南

对于刚接触 Papers with Code 的用户而言，最常见的问题是：这个平台信息量很大，我该从哪里开始用起？怎么才能快速上手？ 本节内容将聚焦“如何使用”，以简明实用的方式帮助你从浏览者成长为高效的研究参与者。

搜索与浏览：高效定位研究资源的起点

Papers with Code 并不是“按论文标题排列的文献仓库”，它的核心搜索逻辑以“任务”为主线。也就是说，用户进入平台的第一步不是“搜哪篇论文”，而是明确你关注的研究任务或模型方向。

常用入口有以下几种：

入口路径	适合人群	使用场景
首页推荐任务 & 热门模型	初次访问者	浏览当前最热研究方向
顶部搜索框	熟悉目标关键词的用户	搜索特定任务、模型、数据集、论文或作者
Tasks（任务）页	做综述/调研的研究者	系统了解某一任务的完整技术路线与模型比较
Datasets（数据集）页	做实验的开发者	按任务或类型查找适用数据集
State-of-the-Art（排行榜）页	项目经理、技术决策人	查看各主流任务下的最佳模型表现
Methods（方法）页	教学或科普类用途	了解 AI 技术发展路径，梳理重要方法

例如，你是一位自然语言处理方向的硕士生，希望查找“文本摘要”的研究成果和实现方法。你可以：

在 Tasks 页搜索“Text Summarization”；
进入该任务页面后，查看当前性能最好的模型；
点开模型详情页，浏览其对应的论文和代码实现；
选择一个实现活跃的 GitHub 项目，基于其代码进行复现或改进。

整个过程无需离开平台，几乎完成了“查文献→找代码→做实验”的全流程，大大节省了时间和精力。

账户注册与功能：从浏览者变为参与者

虽然 Papers with Code 允许用户在无需注册的前提下浏览全部信息，但要想收藏、上传、关注、提交结果等高级操作，建议尽早注册账号。

注册流程非常简单，仅需 3 步：

点击右上角“Sign in”，支持通过 GitHub、Google、Email 登录；
完成初次绑定后即可进入个人主页；
可选：填写个人资料（如所属机构、研究方向等）。

注册账户后可解锁的实用功能包括：

收藏论文或模型：点击论文或模型页右上角的“⭐”图标，可将其加入个人收藏夹，方便日后查阅；
关注任务或方法：可订阅特定任务或方法更新，及时获取最新论文或代码提交信息；
添加代码链接：若你有实现某篇论文的 GitHub 仓库，可点击该论文页面的“Add Code”提交链接；
提交评估结果：若你在某任务上取得了新 SOTA 成果，可上传模型性能数据，申请更新排行榜；
参与社区维护：成为任务维护者，负责对特定任务的模型归类与方法补充，提升社区数据质量。

对于 AI 学习者而言，推荐优先使用“收藏”功能，构建属于自己的研究列表；而对于研究人员或开源作者，建议重点使用“添加代码”和“提交结果”功能，提升工作影响力。

上传代码与数据集：主动贡献，提升曝光

Papers with Code 鼓励用户将自己的研究成果（无论是论文代码还是任务数据）贡献给社区，这是构建高质量开源生态的基础。

上传代码的流程如下：

搜索或进入你的论文页面（通常是 arXiv 上的版本）；
点击“Add Code”按钮；
填写 GitHub 仓库链接、支持的框架（如 PyTorch、TensorFlow）、是否为官方实现、补充说明；
提交后由平台审核（通常 1～2 天内），审核通过后自动显示在该论文页面，并同步至任务与方法页。

上传数据集的流程较为谨慎，步骤包括：

进入“Datasets”页面；
点击“Add Dataset”；
填写数据集名称、用途任务、描述信息、原始链接、是否公开可用；
上传后由官方团队审核与分类归档。

实用建议：

若你的代码实现具有代表性，不仅可以提交仓库地址，还可以同时提交 benchmark 结果（即在某数据集上取得的准确率、召回率等），以提升在排行榜中的可见性；
若你的研究项目是开源性质，可在论文发布时同时提交到平台，提升曝光与引用机会（很多用户会通过平台发现论文并引用）；
上传代码时，推荐附带 README 与 Colab 演示，平台会优先展示文档完整度高的实现版本。

高阶技巧与使用建议

为帮助用户更充分地利用平台资源，以下是一些实战建议：

对比多个模型表现时，建议使用排行榜的“图表视图”功能，可一目了然看到各模型在不同指标上的表现；
在方法页做文献综述前，可结合 arXiv 原文、平台模型介绍和代码链接，快速形成研究脉络与迭代趋势；
关注模型的更新时间，GitHub 项目若长时间无维护可能已不适用于当前依赖环境，应优先选择活跃项目；
结合 API 使用，若你是开发者，可以通过 Papers with Code API 批量获取任务、论文、模型等数据，构建自己的信息看板或分析工具。

Papers with Code 在用户层面提供了从浏览、筛选、收藏，到贡献、评估、管理的一整套使用逻辑，无论你是科研人员、企业工程师，还是 AI 学习者，都可以基于自己的角色找到合适的使用路径。平台的开放结构，也意味着它不仅是工具，更是一个可以参与共建的知识社区。

平台的应用场景

Papers with Code 不只是一个论文+代码的索引工具，它更像是一种促进技术落地与知识迁移的基础设施。它打通了从“想法”到“实现”，从“研究”到“产品”的路径，使不同背景的用户都能基于它找到有价值的信息资源，并将之转化为自己的产出。

根据实际使用者的构成与行为特征，我们可以将平台的典型应用场景归纳为三类：学术研究、产业实践与教育教学。

学术研究中的高效工具：从文献调研到模型复现

对于高校研究人员、硕博学生、科研机构成员来说，Papers with Code 的最大价值在于它极大地提升了研究工作的系统性与可操作性。研究人员不再需要耗费大量时间逐篇检索、验证论文，而是可以在平台上完成“从阅读到动手”的一体化流程。

主要使用路径如下：

**文献调研：**在确定研究方向（如图像生成、语义分割、问答系统）后，可通过平台查阅相关任务下的所有主流模型、代表性论文及其代码实现。
**方法对比：**通过方法页和排行榜功能，可以清晰地了解目前每类模型的性能边界、设计思路、主流框架与技术迭代路线。
**代码复现：**在确定目标论文后，通过平台提供的 GitHub 链接，获取官方或高质量的实现代码，快速搭建复现环境。
**基准实验构建：**结合数据集索引与评估指标信息，可快速选取实验数据，搭建属于自己的 baseline 实验体系。
**撰写论文/综述辅助：**利用平台已结构化的信息，可直接引用模型排名、SOTA 数据、代码链接，提高论文撰写效率与权威性。

此外，越来越多高校导师已将 Papers with Code 作为课题组内部研究资源的核心工具，构建任务清单、追踪论文进展、分配代码复现任务，大大提升研究管理效率。

企业研发与技术选型：连接前沿研究与产业落地

对于人工智能落地型企业或以算法为核心的初创团队而言，Papers with Code 是一个不可多得的“研究导航仪”和“模型选型指南”。它不仅帮助团队把握学术前沿，更能直接指导工程实践中的模型决策。

常见应用方式包括：

**前沿模型追踪：**平台每天更新 arXiv 新论文，并关联代码，技术团队可以设定关注任务（如推荐系统、OCR、语音识别），实时获取新方法。
**模型性能评估：**排行榜帮助开发者快速了解主流模型在标准数据集上的表现，为项目选择提供依据，避免“拍脑袋选算法”。
**框架选型参考：**不同模型的代码往往覆盖多个深度学习框架（如 TensorFlow、PyTorch、JAX），开发者可结合团队技术栈偏好选择最合适的版本。
**快速原型搭建：**通过 Colab 演示、预训练权重、复现代码等资源，快速验证新模型在自有业务数据上的表现。
**内部研发评估：**如果企业内部研究取得了在公开数据集上的优异结果，还可以将结果上传至平台排行榜，提升企业技术影响力与招聘竞争力。

一些大型公司会在招聘算法岗位时要求面试者基于 Papers with Code 所列出的论文复现模型，并写出改进建议，从而检验候选人对研究与实践的结合能力。

教育教学中的开放资源库：让教学更贴近真实科研

在高校人工智能相关课程中，如何让学生从“照本宣科”转向“真实研究项目实践”，一直是教学的痛点。而 Papers with Code 正好为教学提供了丰富、结构化、真实且可操作的项目素材。

适用教学形式包括：

**科研导论课程：**可引导学生在平台中选择任务，浏览论文与代码，了解一个完整研究过程；
**项目实践课程：**让学生选择一个任务（如文本情感分类），查阅排行榜，下载代码，复现结果并撰写技术报告；
**文献综述训练：**结合平台的“方法页”和“任务页”，引导学生梳理某一方向技术发展脉络，完成综述报告；
**毕业设计支持：**学生可围绕 Papers with Code 上某一 SOTA 模型进行实验改进，形成完整课题；
**开源贡献教学：**鼓励学生在复现论文后向平台提交代码链接，感受参与国际开源社区的流程。

这种将平台内容直接嵌入教学过程的做法，既提升了课程的真实感，也帮助学生积累了与学术界、工业界接轨的经验，特别适用于研究型高校与实践型学院。

Papers with Code 不仅仅是一个“查论文的平台”，更是一个覆盖学术、产业、教学三重场景的研究基础设施。在每个环节中，它的价值体现都非常直接：

对研究者：提高调研效率、降低复现门槛、加快发表周期；
对企业团队：指导算法选型、加速原型搭建、提升竞争壁垒；
对教育工作者：提供教学素材、增强学生参与度、接轨科研实践。

这三者之间也并非割裂，而是形成一个相互支撑的闭环生态，推动着 AI 研究与应用的共同前进。

精彩推荐

热门文章

Papers with Code

平台概述

起源与发展

与 arXiv 的合作机制

平台开放性与社区机制

多语言与全球化支持

核心功能详解

论文与代码整合：打破“看得懂，做不出”的壁垒

数据集索引与管理：研究起点的结构化导航

方法与模型分类：技术演化的全景视图

排行榜与评估表：让“最优模型”一目了然

用户指南

搜索与浏览：高效定位研究资源的起点

账户注册与功能：从浏览者变为参与者

上传代码与数据集：主动贡献，提升曝光

高阶技巧与使用建议

平台的应用场景

学术研究中的高效工具：从文献调研到模型复现

企业研发与技术选型：连接前沿研究与产业落地

教育教学中的开放资源库：让教学更贴近真实科研

相关导航

Warcraft Logs

TMDB

Excalidraw

BoardMix

WeTransfer

Tinkercad

12Go.asia

SkylineWebcams