第4周
记忆模块开发,让聊天机器人有记忆
本周掌握LLM的上下文窗口概念、了解上下文长度限制与解决方案,学习LCEL表达式,尝试使用LangChain的记忆组件实现对长上下文的记忆及总结,将该方案集成到项目中,实现带记忆/状态功能聊天机器人。
课程安排:
1、掌握LLM的状态、上下文窗口、长度限制及解决方案;
2、学习LCEL表达式,降低LLM应用开发难度;
3、使用LangChain记忆组件解决LLM无状态/记忆问题;
4、编写带有历史对话总结的Prompt提示词;
5、拆解AutoGPT记忆模块,了解优质项目的解决记忆解决方案;
6、掌握将LLM对话/状态持久化到数据库中的技巧;
7、完成第一个带有记忆功能的机器人;
第5周
数据集模块开发-实现特定知识库问答
本周学习LLM幻觉解决策略,开发LLMOps知识库模块,实现聊天机器人特定问答。学习向量数据库配置,涉及词向量、Embedding、数据集、异步队列、分词、搜索重排与测试。
课程安排:
1、 了解LLM出现幻觉的原因,及常见解决方案;
2、 掌握常见向量数据库的配置及使用,并在项目中对接向量数据库;
3、 学习文本嵌入模型Embeddings的用途及使用;
4、 掌握LangChain的文档加载器及文本分割器的使用,实现LLM读取文件功能;
5、 掌握对象存储功能,分离文件存储与代码运行环境;
6、 掌握Celery分布式队列任务的使用,高效处理耗时或者定时任务;
7、 掌握jieba分词工具,实现文本关键词提取;
8、 掌握Rerank搜索重排序功能及原理;
9、 在LLMOps项目中集成知识库功能;
10、 聊天机器人关联知识库,完成基于知识库问答功能;
11、 聊天机器人与前端UI完成对接,实现文件上传及对话;
第6周
插件功能开发-聊天机器人实时联网获取信息
本周学习GPT-4/New Bing联网,LLM回调,ReACT对话链与Agent策略。掌握LangChain组件,创建LangGraph Agent并集成插件,实现聊天机器人实时联网。
课程安排:
1、了解LLM应用的短板与局限性;
2、了解GPT-4/New Bing底层如何实现联网;
3、学习Agent基础概念及不同Agent的适用场景;
4、学习LLM的函数回调及格式化输出,让LLM拥有更强的能力;
5、掌握LangChain中的工具组件,开发自定义工具;
6、掌握在LangChain中构建Agent,让LLM自主决策工具选择;
7、掌握LangGraph构建图应用,实现可观测的Agent;
8、完成LLMOps项目聊天机器人的实时联网搜索信息功能;
9、完成LLMOps项目前端接口的对接;