传化智联研发部技术总监,曾任职阿里巴巴高级技术专家,现负责传化物流数字化转型、垂直行业人工智能应用平台等研发关键工作,丰富的互联网、物流、制造业等行业从业经历14年,在专业技术、企业管理、科研创新等方面均有丰富经历;在平台技术出海、OSGi 框架研发等平台技术架构也有非常全面资深的了解;在服务化、平台化、国际化等多个领域方向也有丰富的实践经验。
大模型技术正在推动各企业从数字化向智能化的升级。多个行业针对AI需求越来越强烈,从多个制造业企业综合分析行业应用现状,其实AI的实际落地应用仍未跨越鸿沟,技术局限、专业水平、提质增效、数据要素等方面仍面临巨大挑战,需要深入行业应用持续做深做透才有商业化突破的可能性。
本次演讲将从传化服务的行业应用现状分析出发,针对制造业及物流供应链的特点及AI需求共性进行分析,行业级AI应用中多模态文档解析准确度不够、专业词汇不理解、多文档逻辑理解精准性不够以及有一定专业智力水平层级等问题,很大程度影响了AI应用的商用化,在这里行业专业性壁垒的特殊性既是机遇又是挑战。通过行业大模型平台化应用架构解决方案,并用化工、物流等2个跨领域行业应用进行验证AI应用平台的有效性,将会详细介绍在行业应用中如何平台选型(行业应用中基准模型我们为什么会选择chatGLM,以及定制优化策略与大模型的结合)、核心能力的关键技术(RAG与知识图谱互补,知识图谱在提升准确率方面发挥的关键作用;大模型应用于知识图谱的构建及关系推理;RAG结合知识抽取做层次索引增强;用知识图谱在意图识别上的改进;TF-IDF模型的分词权重计算以及TOPK召回、推理等深入的综合应用有效提升大模型在行业场景应用回复准确率到90%+的方法及建议)以及平台化应用研发模式有效提升多个行业场景的AI应用研发效率。
内容大纲
背景:人工智能在行业应用中的现状及挑战
1. 行业应用的特点及AI需求方向:从制造业起家,建立全国27个省市的公路港数实融合创新模式,行业耕耘20年积累了大量的行业资源,分析从40多个行业企业分析AI需求特点及AI场景应用所面临的挑战;如何解决多模态文档解析准确度不够、专业知识不理解、多文档逻辑理解精准性不够也成了行业AI应用难以跨越的鸿沟。
2. 化工、物流等行业实施AI的需求共性及挑战:以化工、物流行业为例,深入洞察各行业AI 应用客户需求现状中的共性,以及达到高智力水平的行业模型的商业机遇及挑战,并用具体的案例进行了解行业数据多、散,以及具备结构化的特点,与知识图谱的数据结构存在有一定的共性。
解决方案:行业大模型平台化应用架构
1. AI平台架构支持多个行业商业化应用:通过实际现状了解行业差异带来智能化小场景应用的快速膨胀问题,通过进一步展开对应AI平台的应用架构设计方案,逐步深入大模型基准模型选型及知识图谱在大模型输入中、训练中、推理中的几个优化方案。
2. 大模型的选型
2.1 如何更好选择的AI基准模型,让AI参加专业考试;
2.2 对话引擎选型,基于策略VS生成模型;
3. 知识图谱发挥的几个核心能力
3.1 RAG的缺陷及知识图谱的互补作用
3.1.1 行业知识图谱建设的关键点-三元组关系
3.1.2 大模型应用于知识图谱的构建及关系推理
3.1.3 RAG_层次索引增强
3.1.4 知识关系可视化运营的必要性
3.2 行业知识图谱如何解决用户意图识别以及问题改写,进一步提升准确率
3.2.1 基于TF-IDF模型的分词权重计算,行业用户使用意图识别率提升
3.2.2 结合策略的设计,加强算法运营,弥补意图识别词性分类算法异常
3.2.3 子图级别的可视化运营设计,意图识别算法干预工具可视化运营
3.3 回复准确率的提升的方案
3.3.1 相似度排序定位知识库及多个句子的最佳推荐
3.3.2 问答清单反馈及知识在线标注
3.3.3 知识切片的运营管理,用知识图谱加强切片中专业内容的识别
3.4 行业应用回复准确率逐步提升要超过90%的几个建议
听众收益
深入理解行业AI应用特点:听众将深入了解当前人工智能在多个生产服务性行业(如化工、物流等)的实际应用情况及面临的共性挑战,包括多模态文档解析、专业知识理解、多文档逻辑理解等难题,从而把握行业AI发展的脉搏。
深化知识图谱在行业中的应用:了解知识图谱与RAG互补以及一些大模型相关的优化方案及策略,提升AI应用的准确率。掌握行业知识图谱建设的关键点、挑战及解决方案,包括三元组关系构建、实体提取与识别、知识关系可视化、意图识别决策等,从而在实际应用中更好地发挥知识图谱的核心能力。