欢迎来到西二在线工作室人工智能方向的考核指南。本指南旨在为初学者提供一条循序渐进的人工智能学习路线,帮助你系统性地掌握人工智能的核心知识与技能。
本项目遵循 GPL-3.0 License。如需转载,请注明本项目仓库地址。
- 正式考核范围为 Task 1 至 Task 6
- Task 1-6 的学习过程中,你只需配置 Python 开发环境,无需配置深度学习相关环境。考虑到部分同学的硬件条件有限,所有需要使用 GPU 算力的任务均可通过免费的云端 GPU 平台(如 Google Colab)完成
- 科学上网工具与 Google 账号需自行准备。如有困难,可私聊 ShaddockNH3 寻求帮助
(硬件配置参考)
和我的 AMD Ryzen 5 3550H with Radeon Vega Mobile Gfx (2.10 GHz) 说去吧
- 文档中的蓝色下划线文字为可点击的超链接
- 文件夹可逐级展开查看具体内容
- 作业提交方式:请先阅读 collection-ai 仓库 中的 Git 使用教程,作业需通过 Git 提交,而非直接在 GitHub 网页上修改
通过所有考核后,你将成为西二在线网络工作室的正式成员,并获得以下权益:
- 实习证明与成员证书
- 使用工作室的计算资源,组队参与算法竞赛
- 获得外包项目与企业实习机会
- 拥有固定的个人工位及活动室使用权
- 参与科研合作项目
以及玩无人机
西二考核的本质是引导式学习,而非选拔性测试。我们提供的是一条清晰、完整的学习路径。因此,我们鼓励你在完成考核时,尽可能深入地学习和完善项目,而不仅仅是满足最低要求。
考核内容会持续更新,请留意后续阶段的通知。
需要说明的是,考核仅在初期阶段对学习态度进行基本筛选。在后续阶段,毅力与坚持是通过考核的关键。
考核内容可通过点击 tasks(2025) 文件夹查看,或直接点击下表中对应的阶段名称。
此外,你需要掌握一些计算机的基础知识。这是一份索引性质的知识清单,你不需要一开始就全部掌握,而是在遇到相关问题时再回来查阅对应章节。如果你觉得文档冗长,也可以查看QA文档
| 阶段 (Phase) | 学习内容 (Learning Content) | 目标 (Goal) | 预期时长 (Duration) |
|---|---|---|---|
| 语法基础 | Python 基础语法、生成式 AI 认知 | 深度掌握深度学习所需的 Python 基础,具备独立编写高质量 Python 代码的能力;通过前沿课程对生成式 AI 建立体系化认知,激发对 AI 领域的探索兴趣 | 45 天 |
| 网络爬虫 | 爬虫技术与数据采集 | 掌握网页抓包与爬虫技术,具备从网络定向获取、清洗并结构化存储数据的能力,为后续的数据分析和模型训练提供数据支持 | 30 天 |
| 数据分析 | 数据科学工具链(NumPy、Pandas、Matplotlib) | 熟练掌握数据科学核心工具,能够高效进行数值计算、数据处理与清洗,并通过数据可视化进行探索性数据分析(EDA),为机器学习建模奠定数据处理基础 | 30 天 |
| 机器学习 | 深入神经网络底层(CS231n Assignment 1) | 从零开始实现经典的图像分类模型(k-NN、SVM、Softmax),并构建第一个全连接神经网络。深刻理解损失函数、梯度下降与反向传播的核心原理 | 45 天 |
| 深度学习 | 构建现代卷积网络(CS231n Assignment 2) | 掌握模块化编程思维,亲手实现批量归一化(Batch Normalization)、Dropout 等关键组件,并搭建完整的卷积神经网络(CNN),在图像分类任务上取得优秀表现 | 45 天 |
| 前沿探索 | 前沿领域深入(CS231n Assignment 3 / CS224n) | 根据兴趣选择深度方向(CV 或 NLP)进行专项学习。接触并实现 Transformer、GAN 等里程碑式模型,具备初步阅读、理解并复现顶会论文的能力 | 45 天 |
| 未来发展 | 进阶路线(Advanced Path) | 持续深入学习,参与开源项目贡献、前沿论文复现,或在 Kaggle 等竞赛平台磨练实战能力。保持对技术前沿的持续关注,成为独立的 AI 研究者与开发者 | — |
本考核遵循一个核心原则:培养能够创造模型的 AI 构建者,而非仅仅调用 API 的使用者。
在关键的入门阶段(如神经网络基础和 CNN),我们限制使用高级框架,要求从零开始手动实现算法的核心组件。从损失函数到完整的反向传播链条,再到批量归一化等关键组件,都需要亲手实现。这一过程能够确保你深刻理解数据在网络中的流动方式、梯度的计算过程,从而建立扎实的理论与实践基础。
在底层实现阶段,通过要求向量化编程,培养高效的数据处理思维。在更高阶的考核中(如生成模型),即使允许使用 PyTorch,考核重点也从「实现」转向「整合与理解」。你需要将先前构建的模块(如 CNN)与新的复杂模型(如 RNN、Transformer)进行整合,并通过可视化注意力权重、分析模型内部状态等方式,证明你不仅能够搭建系统,更能深入理解其内在机制。
更多关于考核设计的思考,请参考 ShaddockNH3 的博客文章。
欢迎扫码加入 AI 方向学习交流群,与其他学习者共同进步。
