2026年1月-2月已完成技术工作量清单
一、AI 工具链与工作流搭建
- Obsidian AI 集成与嵌入
- 实现了Obsidian内部AI嵌入的复杂调用,包括离线模型和API嵌入(Deepseek、硅基流动)。
- 配置了Obsidian本地AI访问MCP服务,并成功测试。
- 解决了Obsidian多设备同步问题(通过Remotely Save插件与OneDrive)。
- MCP (Model Context Protocol) 探索与实践
- 完成了第一个Python MCP服务器的编写与启动(
TimeServer)。 - 在Claude Desktop客户端成功配置并测试了自定义MCP服务(如
weather服务)。 - 在LibreChat(Docker及本地源码版)中完成了环境配置、MCP嵌入服务及效果测试(系统修改、Obsidian修改、浏览器修改)。
- 解决了LibreChat本地部署时MongoDB安装和终端代理配置问题。
- 成功将Notion MCP服务配置到Claude Code,实现了Notion数据库的访问、文件创建与内容写入。
- 解决了Claude Code模型切换优先级问题,成功切换到更经济的模型(
glm-4.5-air)。
- 完成了第一个Python MCP服务器的编写与启动(
- Dify 工作流开发
- 配置了增强版知识问答检索工作流,包括意图拆解、多路检索(Rerank)、内容合成(DeepSeek-Reasoner)和结构化输出。
- 完成了Dify知识库的批量数据导入(通过Python脚本解决前端限制和API报错)。
- 实现了Dify工作流访问自己部署的Firecrawl服务,进行网页内容爬取和AI总结。
- 完成了Dify自动化流水线,实现B站关键词搜索并导入Notion数据库。
- Claude Code Skill 实践
- 完成了三个Skill的初级尝试(如
File Organizer),并成功将笔记导入Notion。 - 使用
File OrganizerSkill成功对桌面文件进行分类整理和重命名。 - 成功部署了本地Skill文件夹到Claude Code。
- 完成了三个Skill的初级尝试(如
- RAG (Retrieval-Augmented Generation) 系统
- 在Jupyter Notebook中跑通了一个完整的RAG项目,包括数据分片、索引(向量化)、召回、重排和生成。
- AI 创意写作
- 梳理并实现了短篇小说(如《祥林嫂》)第一人称视角转化工作流。
- Bilibili 视频总结系统
- 完成了AI B站视频内容总结系统的落地,包括音频提取(
yt-dlp)、语音转文本(siliconflowAPI)、文本总结(Deepseek API)和Markdown笔记生成。 - 成功将该系统封装为网页应用,并在Ubuntu游戏本和云服务器上部署运行,解决了B站反爬和服务器IP风控问题。
- 实现了时间估计和音频文件自动删除功能。
- 完成了AI B站视频内容总结系统的落地,包括音频提取(
- 知识图谱初步
- 初步了解了知识图谱的主流架构(Microsoft GraphRAG, LightRAG, FastGraphRAG, LlamaIndex PropertyGraph)及其存储原理。
- 跑通了LightRAG的示例代码,并理解其核心函数和异步并发架构。
二、系统与网络工程实践
- 远程访问与隧道
- 完成了台式机Linux服务VPS探索,实现了MacBook通过国内JD云服务器中继远程控制寝室游戏本Linux系统。
- 配置了SSH密钥登录,提高了安全性,并简化了连接路径(
~/.ssh/config)。 - 实现了MacBook与游戏本之间的文件传输。
- 代理与网络调试
- 解决了大量网络代理问题,包括终端代理配置(
proxy_on/off函数)、Docker容器内代理设置。 - 排查并解决了梯子(Hysteria)故障,包括端口占用、日志分析和UDP链路质量问题,并修改了服务器和客户端端口。
- 快速了解了HTTP协议、curl和Python requests库的基本操作。
- 初步上手了Proxifier软件,理解其流量分流和代理链功能。
- 解决了大量网络代理问题,包括终端代理配置(
- 高性能ASR部署
- 在实验室A100 GPU服务器上配置了Whisper和PyTorch环境。
- 成功下载并运行了Faster-Whisper
large-v3模型和FunASRSenseVoiceSmall模型,并进行了API速度测试。 - 解决了Conda服务条款、Hugging Face网络连接、Whisper v3维度不匹配、A100显存溢出等部署难题。
- Docker管理
- 熟练运用Docker Compose进行项目部署(如Firecrawl、LibreChat),并进行了Docker容器的清理和管理。
- 成功在MacBook上使用Docker Compose + mkcert部署了微信公众号批量采集工具。
- Firecrawl部署
- 在本地(Docker及手动)成功部署了Firecrawl超级爬虫,并测试了其网页抓取功能。
三、编程语言与框架学习
- Java 入门
- 梳理了详细的Java学习路径(Java SE, MySQL, JDBC, JavaWeb, MyBatis, SpringMVC, Spring Boot)。
- 初步上手了Java开发环境配置(Maven项目结构、
pom.xml、包管理)。 - 理解了K8S对Java开发者的核心要求。
- LangChain 初步
- 安装了LangChain及相关库。
- 理解并实现了简单的LLM调用(Deepseek, Gemini)。
- 初步学习了LangChain的核心概念(Models, Prompts, LCEL)。
四、效率工具与自动化脚本
- macOS 效率工具
- 熟悉了Alfred的常见用法(文件搜索、内容搜索)。
- 编写了批量关闭笔记本软件的Apple Script快捷键。
- 清理了Mac内存。
- 安卓系统优化
- 完成了GKD广告弹窗避免软件的配置(包括Shizuku永久授权)。
- 文件管理
- 探索了MiXplorer等手机文件管理工具。
- API 协议学习
- 深入理解了HTTP协议的数据包结构、GET/POST方法及curl/requests库的使用。
接下来需要继续完成的部分(从任务完整性角度)
1. 实验室项目:高级提示词与数据抽取
- Few-shot & ReAct方法优化与测试:
- 任务:在现有代码基础上,针对实验室的特定数据(军事/情报文本),进一步优化Few-shot和ReAct提示词,提高抽取准确率。
- 完整性考量:目前仅进行了初步测试,需要更多迭代和定性评估来验证其在实际场景中的效果。
- 知识图谱技术深化与应用:
- 任务:系统学习LightRAG和LlamaIndex PropertyGraph,并尝试将其应用于长篇小说或实验室数据,解决实体命名不一致、可视化效果不佳等问题。
- 完整性考量:知识图谱是您研究方向的重要组成部分,需要从理论到实践的完整掌握。
- 异步并发模型实践:
- 任务:深入学习Python的异步并发模型(如
asyncio),并将其应用于数据采集和处理流程中,以提高效率。 - 完整性考量:您已认识到其重要性,但尚未深入实践,这是提升系统性能的关键。
- 任务:深入学习Python的异步并发模型(如
2. Java开发与K8S学习
- Java SE阶段项目实践:
- 任务:完成“学生管理系统”和“新闻热点追踪系统(TrendRadar CLI)”的编码,达到设定的考核标准。
- 完整性考量:这是Java基础知识的综合运用,确保您能独立完成小型应用。
- 数据库与持久层框架学习:
- 任务:深入学习SQL、Redis和MyBatis,并结合实际项目进行CRUD操作和性能优化。
- 完整性考量:Java后端开发的核心,需要通过实践来巩固。
- Spring Boot快速上手:
- 任务:直接通过Spring Boot项目学习Web开发、IoC、AOP等概念,并尝试构建一个简单的微服务。
- 完整性考量:这是企业级Java开发的主流,能让您快速进入实战。
- K8S开发者核心技能:
- 任务:继续学习K8S的Pod、Deployment、Service、ConfigMap等核心对象,并尝试将一个Java应用打包成Docker镜像并部署到K8S环境。
- 完整性考量:将Java应用与K8S结合,是实现云原生部署的关键。
3. 个人AI工作流与效率工具
- Bilibili视频总结系统功能扩展:
- 任务:考虑增加对YouTube或其他视频来源的支持,并探索将其总结能力封装为MCP工具,集成到您的AI Agent中。
- 完整性考量:将现有成果进一步产品化和Agent化,提升其通用性和易用性。
- Dify工作流进阶应用:
- 任务:探索Dify与外部API的更深层次集成,例如实现更复杂的自动化数据获取和处理流程。
- 完整性考量:Dify作为LLMOps平台,其潜力远不止于此,需要持续探索。
- Claude Code Skill深度开发:
- 任务:继续探索和实践更多Claude Code Skill,特别是与Notion和Obsidian的深度集成,并记录其高阶用法。
- 完整性考量:充分利用AI编程助手的强大功能,提升个人开发效率。
- 数据清洗与管理自动化:
- 任务:解决公众号文章批量导出后的顺序标号问题,确保文章按发布时间有序排列。
- 完整性考量:完善数据预处理流程,为后续知识库构建提供高质量数据。
- 长篇小说第一人称工作流完善:
- 任务:结合知识图谱技术,继续完善长篇小说第一人称视角转换的工作流,解决“遗忘”、“幻觉”和“逻辑断裂”等挑战。
- 完整性考量:这是您个人兴趣与AI技术结合的深度项目,需要持续投入。
您在过去两个月取得了令人印象深刻的成就,展现了强大的学习能力和实践精神。这份清单旨在帮助您在接下来的工作中保持专注,将已有的技术点串联成更完整的系统,并深入探索新的领域。
转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。可以在下面评论区评论,也可以邮件至 kipleyarch@gmail.com