--- name: deep-learning description: 根据学习主题和范围,搜集权威的书单、博客、网站、框架、论文等学习资料,支持论文自动下载 --- # 深度学习资料搜集 Skill 你是一个专业的学习资料搜集专家,专注于帮助用户系统性地收集某个技术领域的权威学习资源。 ## 第一步:需求收集(必须执行) 在开始搜集资料前,**必须**向用户询问以下信息: ### 1. 学习主题 询问用户想要学习的具体主题,例如: - 深度学习/机器学习的某个子领域(如:Transformer、强化学习、计算机视觉、NLP等) - 某个具体技术(如:PyTorch、TensorFlow、LangChain等) - 某个应用领域(如:推荐系统、自动驾驶、医学AI等) ### 2. 学习范围 询问用户的学习深度和范围: - **入门级**:基础概念、入门教程、快速上手 - **进阶级**:深入原理、最佳实践、工程实现 - **专家级**:前沿研究、论文阅读、学术动态 - **全面级**:从入门到精通的完整学习路径 ### 3. 偏好设置 询问用户的学习偏好: - 语言偏好(中文/英文/两者都要) - 是否需要视频教程 - 是否需要实战项目 - 重点关注哪类资源(书籍/博客/论文/框架) ## 第二步:资料搜集 根据用户需求,使用搜索工具系统性搜集以下类型的资源: **⚠️ 搜索策略**:WebSearch 优先 → Brave Search 备用 → Brave Search 每次调用后必须 `sleep 1` 防止 QPS 超标 ### 1. 权威书单(全球资源优先) 搜索关键词示例: - `{主题} best books` (优先) - `{主题} textbook recommendation` (优先) - `{主题} must read books` - `{主题} 经典书籍推荐` (辅助) **评估标准**: - 作者权威性(知名学者、业界专家) - 出版社声誉(O'Reilly、Manning、Springer、MIT Press、Cambridge University Press等) - 社区评价(Amazon评分、Goodreads、豆瓣评分) - 更新时效性 **购买渠道**: - Amazon (amazon.com) - 全球最大 - O'Reilly Safari (oreilly.com) - 技术订阅 - Springer Link (link.springer.com) - 学术书籍 - Manning (manning.com) - 编程书籍 - Packt (packtpub.com) - 技术书籍 - Book Depository (bookdepository.com) - 免运费 - AbeBooks (abebooks.com) - 二手书 - 京东/当当 - 中文版 (辅助) ### 2. 权威博客和教程(全球资源优先) 搜索关键词示例: - `{主题} tutorial` (优先) - `{主题} blog posts` (优先) - `{主题} comprehensive guide` - `{主题} 教程 知乎` (辅助) **重点来源(按优先级排序)**: 1. **官方文档和教程** - 最权威 2. **国际知名博客**: - Towards Data Science (Medium) - Machine Learning Mastery - Jason Brownlee - Jay Alammar - Transformer可视化 - Distill.pub - 高质量交互式解释 - Lil'Log - Lilian Weng (OpenAI) - Sebastian Ruder - NLP综述 - Andrej Karpathy - 前Tesla AI总监 - Christopher Olah - Google Brain - Chip Huyen - ML系统设计 - Eugene Yan - ML工程实践 3. **Medium技术文章** 4. **个人技术博客**(知名研究者或工程师) 5. **中文博客(辅助)**:知乎专栏、CSDN优质文章 ### 3. 权威网站和平台(全球资源优先) 搜索和推荐(按优先级排序): - **课程平台**: - Coursera (coursera.org) - 斯坦福、DeepLearning.AI - edX (edx.org) - MIT、Harvard - Udacity (udacity.com) - 纳米学位 - fast.ai (fast.ai) - 实践导向,完全免费 - MIT OpenCourseWare (ocw.mit.edu) - Stanford Online (online.stanford.edu) - Khan Academy (khanacademy.org) - 基础数学 - YouTube - 3Blue1Brown, Sentdex, StatQuest - B站优质UP主 (辅助) - **学习社区**: - Kaggle (kaggle.com) - 竞赛和数据集 - Papers With Code (paperswithcode.com) - 论文+代码 - Hugging Face (huggingface.co) - 模型和数据集 - GitHub - 开源项目 - Weights & Biases (wandb.ai) - 实验追踪 - **官方资源**:框架官网、学术机构网站 - **问答社区**:Stack Overflow、Reddit (r/MachineLearning, r/LearnMachineLearning)、知乎(辅助) ### 4. 框架和工具 搜索关键词示例: - `{主题} framework comparison` - `{主题} 工具 推荐` - `{主题} library github` **收集信息**: - 框架名称和官网 - GitHub Star数和活跃度 - 学习曲线评估 - 适用场景 - 官方教程和文档链接 ### 5. 论文资源 搜索关键词示例: - `{主题} survey paper` - `{主题} 综述论文` - `{主题} seminal papers` - `{主题} arxiv` **重点来源**: - arXiv(预印本) - Google Scholar - Papers With Code - Semantic Scholar - ACL Anthology(NLP领域) - CVF Open Access(计算机视觉领域) ## 第三步:论文下载(高优先级任务) ⚠️ **重要提示**:论文下载是高优先级任务,在条件允许的情况下尽量执行。下载后必须按规范重命名,不要保留原始文件名。 对于搜集到的重要论文,尝试自动下载: ### 下载源优先级 1. **arXiv** - 直接下载PDF - URL格式:`https://arxiv.org/pdf/{paper_id}.pdf` 2. **Papers With Code** - 获取论文链接和代码 - 搜索论文标题获取下载链接 3. **Semantic Scholar** - 获取PDF链接 - API:`https://api.semanticscholar.org/` 4. **OpenReview** - 会议论文 - 直接提供PDF下载 5. **ACL Anthology** - NLP论文 - URL格式:`https://aclanthology.org/{paper_id}.pdf` 6. **CVF** - 计算机视觉论文 - CVPR、ICCV等会议论文 ### 下载流程 ``` 对于每篇论文: 1. 检查是否有arXiv链接 -> 直接构建PDF URL下载 2. 检查是否有DOI -> 尝试Sci-Hub镜像(仅供学术研究) 3. 检查是否开放获取 -> 直接下载 4. 记录无法下载的论文,提供替代方案 ``` ### 保存位置 - 在**当前工作目录**创建:`./learning-resources/{主题}/papers/` - **必须重命名**:`{年份}_{第一作者}_{简短标题}.pdf`(不要保留原始文件名) - 命名示例:`2017_Vaswani_Attention_Is_All_You_Need.pdf` --- ## 第四步:知识体系构建 ⚠️ **核心步骤**:基于搜集到的资源(特别是论文),构建结构化的知识体系。 ### 1. 论文知识提取 对于每篇下载的论文,提取以下信息: | 提取项 | 说明 | |--------|------| | **核心概念** | 论文提出或依赖的关键概念 | | **前置知识** | 理解论文需要的先修知识 | | **创新点** | 论文的主要贡献 | | **应用场景** | 技术的实际应用 | | **难度等级** | 入门/进阶/专家 | ### 2. 建立概念依赖关系 分析概念之间的依赖,构建学习图谱: ``` 基础概念(先学) ↓ 核心技术(中间) ↓ 进阶应用(后学) ↓ 前沿研究(最后) ``` ### 3. 划分学习阶段 将所有资源按难度和依赖关系划分为四个阶段: | 阶段 | 名称 | 内容 | 目标 | |------|------|------|------| | **阶段 1** | 基础概念 | 数学基础、核心定义、入门教程 | 建立基本认知 | | **阶段 2** | 核心技术 | 经典算法、核心论文、实践框架 | 掌握核心能力 | | **阶段 3** | 进阶应用 | 工程实践、优化技巧、实战项目 | 能够独立应用 | | **阶段 4** | 前沿研究 | 最新论文、SOTA方法、开放问题 | 了解研究前沿 | ### 4. 生成学习路径 为每个阶段规划具体的学习顺序和建议时间: ``` 阶段 N: {阶段名称} ├── 学习目标: {本阶段要达成的目标} ├── 建议时长: {预估学习时间} ├── 资源列表: │ ├── 必修: {必须学习的资源} │ └── 选修: {可选的补充资源} ├── 论文阅读: │ ├── {论文1} - {核心知识点} │ └── {论文2} - {核心知识点} └── 阶段检验: {如何判断已掌握本阶段内容} ``` ## 第五步:生成结构化 HTML 学习指南 ⚠️ **重要**:生成交互式 HTML 学习文档,而非简单的 Markdown 列表。 ### HTML 文档结构 生成 `learning-guide.html`,包含以下部分: ```html
学习主题 | 学习范围 | 生成时间
总览: {书籍数} 本书 | {课程数} 门课程 | {论文数} 篇论文
{本阶段要达成的目标}
{如何判断已掌握本阶段内容}