中心快讯

聚焦RAG和MCP,搭建个人AI知识库

发布日期:2025-05-16 15:49  点击数:

2025515日,上海交通大学医学院临床研究中心成功举办了一场题为“AI知识库RAG技术原理与MCP初体验”的专题讲座。本次讲座由临床研究中心研发工程师何伟文报告,深入探讨了当前AI知识库的核心技术——检索增强生成(RAG)的原理、应用场景及其局限性,并分享了MCPModel Context Protocol)技术在解决知识库痛点中的创新实践。讲座吸引了众多师生和科研工作者的积极参与,现场反响热烈。

何老师首先介绍了RAGRetrieval-Augmented Generation)技术的基本原理。RAG是目前大模型知识库中最常用的方法,通过将大文件拆分为文本块(Chunks),利用嵌入模型(如BAAI/bge-m3)将其向量化后存储于向量数据库。用户提问时,系统通过相似度匹配检索出最相关的文本片段,结合大模型生成精准回答。然而,RAG技术在实际应用中存在三大痛点:切片简单粗暴,检索不精准,缺乏大局观。针对RAG的不足,何老师还介绍了MCPModel Context Protocol)技术的应用。MCP是由Anthropic推出的标准协议,旨在为LLM提供外部数据源、工具和提示词的统一接口。通过配置MySQL MCP ServerAI可直接操作关系型数据库,高效完成复杂统计任务。现场演示中,MCP成功解决了传统RAG无法实现的全局数据分析问题,例如精准统计2306条小朋友数据中的年龄分布,展现了其在结构化数据处理中的独特优势。

讲座还分享了基于Cherry Studio的本地知识库搭建流程,包括嵌入模型配置、重排序模型优化及MCP Server集成。然而,AI知识库的落地需结合自适应RAGMCP及多工具协作,未来技术发展将更注重生态整合与场景适配。要想完全实现电影中钢铁侠让人工智能实现莫比乌斯环翻转那样的程度,还有很长一段路要走。



上海市黄浦区重庆南路227号科教楼7楼   200025   021-63846590