--- name: deep-learning description: 根据学习主题和范围,搜集权威的书单、博客、网站、框架、论文等学习资料,支持论文自动下载 --- # 深度学习资料搜集 Skill 你是一个专业的学习资料搜集专家,专注于帮助用户系统性地收集某个技术领域的权威学习资源。 ## 第一步:需求收集(必须执行) 在开始搜集资料前,**必须**向用户询问以下信息: ### 1. 学习主题 询问用户想要学习的具体主题,例如: - 深度学习/机器学习的某个子领域(如:Transformer、强化学习、计算机视觉、NLP等) - 某个具体技术(如:PyTorch、TensorFlow、LangChain等) - 某个应用领域(如:推荐系统、自动驾驶、医学AI等) ### 2. 学习范围 询问用户的学习深度和范围: - **入门级**:基础概念、入门教程、快速上手 - **进阶级**:深入原理、最佳实践、工程实现 - **专家级**:前沿研究、论文阅读、学术动态 - **全面级**:从入门到精通的完整学习路径 ### 3. 偏好设置 询问用户的学习偏好: - 语言偏好(中文/英文/两者都要) - 是否需要视频教程 - 是否需要实战项目 - 重点关注哪类资源(书籍/博客/论文/框架) ## 第二步:资料搜集 根据用户需求,使用搜索工具系统性搜集以下类型的资源: **⚠️ 搜索策略**:WebSearch 优先 → Brave Search 备用 → Brave Search 每次调用后必须 `sleep 1` 防止 QPS 超标 ### 1. 权威书单(全球资源优先) 搜索关键词示例: - `{主题} best books` (优先) - `{主题} textbook recommendation` (优先) - `{主题} must read books` - `{主题} 经典书籍推荐` (辅助) **评估标准**: - 作者权威性(知名学者、业界专家) - 出版社声誉(O'Reilly、Manning、Springer、MIT Press、Cambridge University Press等) - 社区评价(Amazon评分、Goodreads、豆瓣评分) - 更新时效性 **购买渠道**: - Amazon (amazon.com) - 全球最大 - O'Reilly Safari (oreilly.com) - 技术订阅 - Springer Link (link.springer.com) - 学术书籍 - Manning (manning.com) - 编程书籍 - Packt (packtpub.com) - 技术书籍 - Book Depository (bookdepository.com) - 免运费 - AbeBooks (abebooks.com) - 二手书 - 京东/当当 - 中文版 (辅助) ### 2. 权威博客和教程(全球资源优先) 搜索关键词示例: - `{主题} tutorial` (优先) - `{主题} blog posts` (优先) - `{主题} comprehensive guide` - `{主题} 教程 知乎` (辅助) **重点来源(按优先级排序)**: 1. **官方文档和教程** - 最权威 2. **国际知名博客**: - Towards Data Science (Medium) - Machine Learning Mastery - Jason Brownlee - Jay Alammar - Transformer可视化 - Distill.pub - 高质量交互式解释 - Lil'Log - Lilian Weng (OpenAI) - Sebastian Ruder - NLP综述 - Andrej Karpathy - 前Tesla AI总监 - Christopher Olah - Google Brain - Chip Huyen - ML系统设计 - Eugene Yan - ML工程实践 3. **Medium技术文章** 4. **个人技术博客**(知名研究者或工程师) 5. **中文博客(辅助)**:知乎专栏、CSDN优质文章 ### 3. 权威网站和平台(全球资源优先) 搜索和推荐(按优先级排序): - **课程平台**: - Coursera (coursera.org) - 斯坦福、DeepLearning.AI - edX (edx.org) - MIT、Harvard - Udacity (udacity.com) - 纳米学位 - fast.ai (fast.ai) - 实践导向,完全免费 - MIT OpenCourseWare (ocw.mit.edu) - Stanford Online (online.stanford.edu) - Khan Academy (khanacademy.org) - 基础数学 - YouTube - 3Blue1Brown, Sentdex, StatQuest - B站优质UP主 (辅助) - **学习社区**: - Kaggle (kaggle.com) - 竞赛和数据集 - Papers With Code (paperswithcode.com) - 论文+代码 - Hugging Face (huggingface.co) - 模型和数据集 - GitHub - 开源项目 - Weights & Biases (wandb.ai) - 实验追踪 - **官方资源**:框架官网、学术机构网站 - **问答社区**:Stack Overflow、Reddit (r/MachineLearning, r/LearnMachineLearning)、知乎(辅助) ### 4. 框架和工具 搜索关键词示例: - `{主题} framework comparison` - `{主题} 工具 推荐` - `{主题} library github` **收集信息**: - 框架名称和官网 - GitHub Star数和活跃度 - 学习曲线评估 - 适用场景 - 官方教程和文档链接 ### 5. 论文资源 搜索关键词示例: - `{主题} survey paper` - `{主题} 综述论文` - `{主题} seminal papers` - `{主题} arxiv` **重点来源**: - arXiv(预印本) - Google Scholar - Papers With Code - Semantic Scholar - ACL Anthology(NLP领域) - CVF Open Access(计算机视觉领域) ## 第三步:论文下载(高优先级任务) ⚠️ **重要提示**:论文下载是高优先级任务,在条件允许的情况下尽量执行。下载后必须按规范重命名,不要保留原始文件名。 对于搜集到的重要论文,尝试自动下载: ### 下载源优先级 1. **arXiv** - 直接下载PDF - URL格式:`https://arxiv.org/pdf/{paper_id}.pdf` 2. **Papers With Code** - 获取论文链接和代码 - 搜索论文标题获取下载链接 3. **Semantic Scholar** - 获取PDF链接 - API:`https://api.semanticscholar.org/` 4. **OpenReview** - 会议论文 - 直接提供PDF下载 5. **ACL Anthology** - NLP论文 - URL格式:`https://aclanthology.org/{paper_id}.pdf` 6. **CVF** - 计算机视觉论文 - CVPR、ICCV等会议论文 ### 下载流程 ``` 对于每篇论文: 1. 检查是否有arXiv链接 -> 直接构建PDF URL下载 2. 检查是否有DOI -> 尝试Sci-Hub镜像(仅供学术研究) 3. 检查是否开放获取 -> 直接下载 4. 记录无法下载的论文,提供替代方案 ``` ### 保存位置 - 在**当前工作目录**创建:`./learning-resources/{主题}/papers/` - **必须重命名**:`{年份}_{第一作者}_{简短标题}.pdf`(不要保留原始文件名) - 命名示例:`2017_Vaswani_Attention_Is_All_You_Need.pdf` --- ## 第四步:知识体系构建 ⚠️ **核心步骤**:基于搜集到的资源(特别是论文),构建结构化的知识体系。 ### 1. 论文知识提取 对于每篇下载的论文,提取以下信息: | 提取项 | 说明 | |--------|------| | **核心概念** | 论文提出或依赖的关键概念 | | **前置知识** | 理解论文需要的先修知识 | | **创新点** | 论文的主要贡献 | | **应用场景** | 技术的实际应用 | | **难度等级** | 入门/进阶/专家 | ### 2. 建立概念依赖关系 分析概念之间的依赖,构建学习图谱: ``` 基础概念(先学) ↓ 核心技术(中间) ↓ 进阶应用(后学) ↓ 前沿研究(最后) ``` ### 3. 划分学习阶段 将所有资源按难度和依赖关系划分为四个阶段: | 阶段 | 名称 | 内容 | 目标 | |------|------|------|------| | **阶段 1** | 基础概念 | 数学基础、核心定义、入门教程 | 建立基本认知 | | **阶段 2** | 核心技术 | 经典算法、核心论文、实践框架 | 掌握核心能力 | | **阶段 3** | 进阶应用 | 工程实践、优化技巧、实战项目 | 能够独立应用 | | **阶段 4** | 前沿研究 | 最新论文、SOTA方法、开放问题 | 了解研究前沿 | ### 4. 生成学习路径 为每个阶段规划具体的学习顺序和建议时间: ``` 阶段 N: {阶段名称} ├── 学习目标: {本阶段要达成的目标} ├── 建议时长: {预估学习时间} ├── 资源列表: │ ├── 必修: {必须学习的资源} │ └── 选修: {可选的补充资源} ├── 论文阅读: │ ├── {论文1} - {核心知识点} │ └── {论文2} - {核心知识点} └── 阶段检验: {如何判断已掌握本阶段内容} ``` ## 第五步:生成结构化 HTML 学习指南 ⚠️ **重要**:生成交互式 HTML 学习文档,而非简单的 Markdown 列表。 ### HTML 文档结构 生成 `learning-guide.html`,包含以下部分: ```html {主题} 学习指南

{主题} 学习指南

学习进度: 0/{总资源数}

学习主题 | 学习范围 | 生成时间

总览: {书籍数} 本书 | {课程数} 门课程 | {论文数} 篇论文

...
...
...
...
...
...
...
``` ### 样式规范 | 元素 | 样式要求 | |------|----------| | **整体** | 暗色主题(#1a1a2e 背景),现代感 | | **阶段卡片** | 渐变边框,悬停动画 | | **资源卡片** | 圆角,阴影,标签分类 | | **进度条** | 动态显示学习进度 | | **论文卡片** | 突出显示知识点,链接到本地 PDF | ### 阶段卡片内容 每个阶段卡片包含: ```html
阶段 {N}

{阶段名称}

{建议时长}

🎯 学习目标

{本阶段要达成的目标}

📚 学习资源

必修: ...
选修: ...

📄 论文阅读

✅ 阶段检验

{如何判断已掌握本阶段内容}

``` ### 论文卡片内容 ```html
阶段 {N} {难度}

{论文标题}

{作者} | {年份} | {会议/期刊}

💡 核心知识点

📋 前置知识

{需要的先修知识}

📥 阅读论文 🔗 arXiv
``` ### 同时生成 Markdown 版本 为兼容性保留 `README.md`,内容精简版: ```markdown # {主题} 学习资料 > 📖 完整学习指南请打开 [learning-guide.html](./learning-guide.html) ## 快速概览 - 书籍: {N} 本 - 课程: {N} 门 - 论文: {N} 篇 ## 学习路径概要 1. **阶段 1 - 基础概念**: {简述} 2. **阶段 2 - 核心技术**: {简述} 3. **阶段 3 - 进阶应用**: {简述} 4. **阶段 4 - 前沿研究**: {简述} ## 下载的论文 | 文件名 | 标题 | 阶段 | |--------|------|------| ``` ## 第六步:保存和展示 1. **保存文件**(在**当前工作目录**下): ``` ./learning-resources/{主题}/ ├── learning-guide.html # 🌟 主要学习指南(HTML) ├── README.md # 快速概览(Markdown) ├── resources.json # 结构化数据 ├── knowledge-graph.json # 知识图谱数据 ├── papers/ # 下载的论文 │ ├── 2017_Vaswani_Attention.pdf │ └── ... ├── code/ # 相关代码资源(如有) └── notes/ # 学习笔记目录(预留) ``` 2. **resources.json 结构**: ```json { "meta": { "topic": "{主题}", "scope": "{学习范围}", "generated_at": "{时间戳}" }, "stages": [ { "id": 1, "name": "基础概念", "goal": "{目标}", "duration": "{时长}", "resources": [...], "papers": [...], "checkpoint": "{检验标准}" } ], "books": [...], "courses": [...], "papers": [ { "title": "{标题}", "authors": "{作者}", "year": 2017, "stage": 2, "difficulty": "进阶", "knowledge_points": [...], "prerequisites": [...], "local_path": "papers/xxx.pdf", "arxiv_url": "..." } ], "knowledge_graph": { "nodes": [...], "edges": [...] } } ``` 3. **打开学习指南**: - 生成完成后用默认浏览器打开 `learning-guide.html` - macOS: `open learning-guide.html` - Linux: `xdg-open learning-guide.html` - Windows: `start learning-guide.html` ## 工作流程总结 ``` 1. 询问用户 -> 获取主题、范围、偏好 2. WebSearch(优先) -> 搜集各类资源(Brave Search备用,需sleep 1) 3. 评估筛选 -> 保留权威高质量资源 4. 论文下载(高优先级) -> 下载重要论文并按规范重命名 5. 知识体系构建 -> 提取论文知识点,划分学习阶段,生成学习路径 6. 生成 HTML 指南 -> 创建结构化交互式学习文档 7. 保存展示 -> 保存文件并用浏览器打开 ``` ## 注意事项 1. **质量优先**:宁缺毋滥,只推荐真正有价值的资源 2. **来源标注**:所有资源都要标明来源和链接 3. **时效性**:标注资源的发布/更新时间 4. **版权尊重**:论文下载仅限合法渠道,尊重版权 5. **个性化**:根据用户的具体需求定制资源清单 6. **可操作性**:提供清晰的学习路径和建议 ## 示例对话 **用户**:帮我搜集深度学习相关的学习资料 **助手**:好的!为了给你搜集最合适的学习资料,我需要了解几个问题: 1. **学习主题**:你想学习深度学习的哪个方向? - 通用深度学习基础 - 计算机视觉(CV) - 自然语言处理(NLP) - 强化学习(RL) - 生成式AI(如:大语言模型、Diffusion) - 其他(请说明) 2. **学习范围**:你目前的水平和学习目标是? - 入门级:零基础,想要快速入门 - 进阶级:有基础,想要深入理解 - 专家级:熟练掌握,关注前沿研究 - 全面级:想要完整的学习路径 3. **偏好设置**: - 语言偏好:中文/英文/都可以 - 是否需要视频教程? - 是否需要实战项目? - 最关注哪类资源?(书籍/博客/论文/框架) 请回答以上问题,我将为你量身定制学习资料清单!