第4周
记忆模块开发,让聊天机器人有记忆
本周掌握LLM的上下文窗口概念、了解上下文长度限制与解决方案,学习LCEL表达式,尝试使用LangChain的记忆组件实现对长上下文的记忆及总结,将该方案集成到项目中,实现带记忆/状态功能聊天机器人。
课程安排:
1、掌握LLM的状态、上下文窗口、长度限制及解决方案;
2、学习LCEL表达式,降低LLM应用开发难度;
3、使用LangChain记忆组件解决LLM无状态/记忆问题;
4、了解缓冲记忆、摘要记忆、实体记忆组件的使用与解析;
5、编写带有历史对话总结的Prompt提示词;
6、拆解AutoGPTMetaGPT记忆模块,了解优质项目的解决记忆解决方案;
7、掌握将LLM对话/状态持久化到数据库中的技巧;
8、掌握LangChain开发核心Runnable的高级技巧并解析源码;
9、基于Runnable封装记忆链完成第一个带有记忆功能的机器人;
第5周
数据集模块开发-实现特定知识库问答
本周学习LLM幻觉解决策略,开发LLMOps知识库模块,实现聊天机器人特定问答。学习向量数据库配置,涉及词向量、Embedding、数据集、异步队列、分词、搜索重排与测试。掌握RAG的常见优化策略
课程安排:
1、了解LLM出现幻觉的原因,及常见解决方案;
2、掌握常见向量数据库的配置及使用,涵盖Faiss、Pinecone、TCVectorDB、Weaviate等向量数据库,在项目中构建第一个RAG应用。
3、学习文本嵌入模型Embeddings的用途及使用;
4、掌握LangChain提供的数十种的文档加载器及文本分割器的使用,并深入解析递归字符文本分割器实现分割任意文档,实现LLM读取文件功能;
5、学习并掌握LangChain检索器的作用,实现让LLM动态调用知识库功能;
6、掌握jieba分词工具,实现文本关键词提取;
7、掌握Rerank搜索重排序功能及原理;
8、学习并掌握常见的数十种RAG优化策略,涵盖涵盖多查询融合、问题分解策略、回答回退、doc-doc检索、混合检索、逻辑路由、语义路由、自查询检索、多向量检索、父文档检索器、递归文档树、ReRank重排、CRAG与Sele-RAG等。
第6周
插件功能开发-聊天机器人实时联网获取信息
本周学习GPT-4/New Bing联网,LLM回调,ReACT对话链与Agent策略。掌握LangChain组件,创建LangGraph Agent并集成插件,实现聊天机器人实时联网。
课程安排:
1、了解LLM应用的短板与局限性;
2、了解GPT-4/New Bing底层如何实现联网;
3、学习Agent基础概念及不同Agent的适用场景;
4、学习LLM的函数回调及格式化输出,让LLM拥有更强的能力;
5、 掌握LangChain中的工具组件,了解使用3种技巧创建自定义工具;开发自定义工具;
6、掌握在LangChain中构建Agent,让LLM自主决策工具选择;
7、掌握LCEL与LangGraph流结构的使用,为构建复杂大型应用奠定基础;
8、掌握LangGraph构建图应用,实现可观测的Agent;
9、完成LLMOps项目聊天机器人的实时联网搜索信息功能;