基于语言大模型的农业专家系统的设计与实现

作者: 余圣新 韦莹莹 方辉 李敏 申垚阳 莫小香 曾志康

基于语言大模型的农业专家系统的设计与实现0

摘要:针对农业生产者对农业知识的了解和学习的渠道少,新农业技术和新农业成果的推广困难等问题,以农业知识库为基础,结合语言大模型、卷积神经网络提出了一种农业专家系统。系统根据用户提出文字的问题,通过语言大模型提取问题的词向量,并在农业知识库中进行相似性查询,最后将查询结果返回给语言大模型,由语言大模型生成问题的答案;对于用户提出的病虫害问题,系统根据用户提供的图像,通过卷积神经网络对病虫害进行分类,帮助用户快速准确地判断病虫害类型,同时提供知识库中相关的防治方案。系统的实现为农业生产者提供了一个快速准确的辅助决策工具和一条便捷的知识获取渠道。

关键词:专家系统;农业知识库;语言大模型;卷积神经网络

中图分类号:TP391.41 文献标识码:A

文章编号:1009-3044(2025)05-0015-04 开放科学(资源服务) 标识码(OSID) :

0 引言

数字技术是发展现代农业和实现农业可持续发展的关键技术,20世纪70年代末,美国伊利诺斯大学开发了世界上应用最早的农业专家系统,主要用于农作物病虫害的诊断[1],我国专家系统的研究起始于20 世纪80年代初期[2],在各领域相继出现了大量专家服务系统。近年来,随着计算机技术和人工智能技术的进步,基于人工智能的专家服务系统成为了各领域的研究热点,即利用各领域专家积累的知识和经验构建知识库,基于人工智能算法构建专家模型,最后结合知识库与专家模型,实现模拟人类专家的推理和决策过程。例如在交通领域,曹楠等人针对地面轨道交通开发了地面专家诊断系统,提高了车辆运行的数字化水平和列车风险预知能力,从而保障了车辆安全[3]。在医疗领域,童江波等人通过构建了基于规则的中医药专家系统,系统利用数据挖掘技术,为患者提供有效的新鲜止咳中药治疗方案[4]。黄承宁等人提出了一种面向患者就医前自诊的基于医疗知识图谱的自动问诊系统,有效解决了相关病症咨询专业缺乏问题,实现了患者自助[5]。贾李蓉等人以中医药学语言系统为基础,引入自然语言处理、知识库、自动问答、信息检索等技术,结合中医药信息领域专家的经验知识,构建一套智能知识问答系统,有效地帮助用户在互联网上获取所需的中医药知识、获得更便捷更准确的网络诊疗体验[6]。在水利领域,邹遐迩等人通过对水质检测流程合理分析以及各监控点反馈信号诊断,结合LabVIEW可视化编程技术、信号分析技术和测控技术设计了一种基于微试剂原位水质检测仪的多参数水质微型站监控系统,现场应用结果表明,采用诊断专家系统的水质微型站监控系统满足水质测控的需求, 极大提升系统的稳定性、安全性[7]。王喆等人提出了融合GPT和知识图谱的应急决策智能问答系统,实现洪涝灾害应急处置过程中的在线辅助决策,提升了洪涝灾害应急信息分析和决策效率[8]。

但由于农业知识结构复杂,且农业具有鲜明的地域性,一个区域的品种、技术到另一个区域并不一定适用同一品种在不同区域,所以当前的通用大模型无法直接用于农业领域的问答,因此需要构建一个适用于农业的专家系统,对农业领域的专家模型进行针对性优化,从而较好地满足农业生产者的本地化、专业化、个性化的需求。

1 系统设计

依托农业专家的知识、技术和服务体系,搭建农业专家系统,按数据层、支持层、应用层来分层构建,具体如图1所示。

1)数据层是专家云系统全量业务数据的存储、管理和服务中枢,以农业科技服务为核心,提供数据汇聚治理的流程和工具,提供一站式数据资源管理服务。围绕专家云服务业务,构建从数据汇聚到数据监控的完整数据治理流程,汇聚服务数据,建立农业专家、农业知识、产业主体、服务资源、政策法规、农情监测、生产管理、服务对接、供需匹配、运营管理等专题数据,支撑业务场景的数据需求。

2)支持层围绕专家系统的业务需求和应用特点,融合了统一门户、身份管理、信息推送、API接口、智能算法、语言模型多种能力,构建统一的能力支撑,对外提供API接口,满足系统用户管理、信息服务、应用管理、数据建模、数据可视化分析等场景应用需求。

3)应用层面向农业专家、农业企业、农户等提供专家咨询、知识服务、农事指导、服务对接等综合应用,促进农业科技成果转化应用。

2 系统关键技术

2.1 农业知识库技术

农业知识库是本系统的核心,既包括农业知识库本身,也包括对知识进行管理和分析的系统工具。它汇集了来自关联业务系统、内部其他系统、互联网开源数据等多类知识素材,进行素材采集、数据汇聚、数据治理、模型构建等处理,最终形成覆盖各行业、各业务类型的农业知识库,发现蕴含于大数据中的知识价值,实现知识的增值。

1)农业知识分类。

汇聚各类农业专业知识,按知识类型、内容建立知识分类树,将对应的图片、文字、视频等知识归纳其中,在云系统上展示知识树,方便用户按分类树进行检索查询。

2)智能检索查询。

提供智能检索查询功能,系统可以通过农户输入的关键字、关键词快速匹配相关知识,协助农户快速筛选出所要查询的农业知识。

农业知识库部署后界面如图2所示。

2.2 语言大模型技术

LangChain 是一个开源的大型语言模型(LLM)的编程框架,可将例如GPT-4、阿里通义千问等语言大模型与外部计算和数据来源结合起来,在农业专家云系统中,首先将相关的农业知识导入农业知识库中,然后将知识数据转化为词向量,最后将词向量和通义大模型连接起来,以构建一个适用于农业领域的语言大模型,其主要流程如图3所示。

首先将专家系统中农业知识库中的农业知识数据划分为词向量,并存入LangChain框架中的向量数据库中,然后根据用户提问的内容,对向量数据库中的词向量进行相似性搜索,得到向量数据,最后将用户提问的内容和向量数据输入至通义大模型中,由通义大模型给出最终的回答。

本系统的语言大模型主要包括知识库的匹配与管理、通义大模型的选择与应用两个功能模块。

1)知识库的匹配与管理。

鉴于农业知识数据的结构复杂,数据来源也各不相同,且不同地理位置,农业品种、农技手段也不尽相同,因此需要将农业知识库进行细分,即分为通用农业知识库、广西农业知识库等,在用户登录系统使用时,根据其定位信息自动匹配对应的农业知识库,在不影响模型问答的精度的同时,降低服务器缓存压力。

2)通义大模型的选择。

当前主流的通义大模型有百度的文心一言、阿里云的通义千问、腾讯的混元生文、OpenAI的ChatGPT等,通过其开放的API接口接入本系统,从而确保通义模型的实时更新,用户可根据其不同的需求和使用习惯,可从中选择任意一款通义大模型作为系统的基础问答模型。

使用ChatGPT通义模型和通用农业知识库部署后的语言大模型如图4所示。

2.3 病虫害自动识别技术

卷积神经网络属于一种人工智能算法,常被用于图像处理,如图像分类、目标识别等场景,其主要原理是利用卷积核对图像进行特征提取,从而实现图像的识别和分类。在农业生产中,病虫害是影响作物产量和品质的关键因素,为了能够准确识别病虫害,选择ResNet-50卷积神经网络作为病虫害自动识别的算法模型,该网络采用了残差网络结构,该结构通过将网络输入与输出线性相加的方式,有效缓解了卷积神经网络中梯度消失和梯度爆炸的问题,其具体结构如图5所示。

系统采用Pytorch框架,以知识库中的病虫害图像数据作为训练集,对网络模型进行训练,主要流程如图6所示。

首先筛选出知识库中的病虫害图像数据,然后建立病虫害类别和其索引关系表,具体如表1所示。

根据类别总数,对各个类别进行One-hot编码,其次进行数据增强和图像的归一化,最后输入ResNet网络,根据随机梯度下降算法更新网络权重,训练网络模型。

3 系统应用场景

1)农业知识的自动问答。通过系统提供在线问答交互方式,用户输入想要的信息说明,系统基于知识库中的知识数据以及最新科研成果等,结合LLM语言大模型,智能整合知识给出反馈和来源链接,并对用户提出的农业领域的问题进行专业的回答,提高海量知识的检索查询和服务效率,解决前沿农业技术普及推广难的问题,具体问答样例如图7所示。

2)农业病虫害的自动识别。系统根据知识库中的病虫害图像数据,通过卷积神经网络提取病虫害图像的特征,根据提取的特征实现农业病虫害的快速精准识别,并匹配农业知识库中的相关内容,为其提供有效的防治措施和手段,具体应用如图8所示。

3)农情监测预警。系统通过用户在自动问答系统中的咨询反馈,结合实时的农情数据,分析当前农业生产总体现状,针对重大病虫害和局部地质灾害进行监测、分析、预警和预报,为农业生产经营主体提供指导。

4 结束语

综上所述,农业专家系统旨在解决农业发展中新技术、新成果落地普及困难的问题,是实现农业高质量发展的有效手段,本文通过构建农业知识库,结合LangChain语言大模型框架,卷积神经网络等信息技术手段,为农业生产者提供响应迅速、专业性强的农业问答服务,为相关使用者提供了极大的便利,并且降低了新技术和新成果的普及推广难度。但因当前系统中农业知识数量较少,回答的精度还有提升的空间,未来将继续收集农业领域的相关知识,同时对语言大模型的各项参数进行微调,对系统持续地优化和改进,助力农业的高质量发展。

参考文献

[1] 石琳,陈帝伊,马孝义.专家系统在农业上的应用概况及前景[J].农机化研究,2011,33(1):215-218.

[2] 田娜,杨晓文,单东林,等.我国数字农业现状与展望[J].中国农机化学报,2019,40(4):210-213.

[3] 曹楠,刘兴阳,刘铁良,等.城市轨道交通地面专家诊断系统研究[J].智慧轨道交通,2024,61(3):22-29.

[4] 童江波,朱娇娇,胡灵芝,等.基于专家系统为感染后咳嗽患者提供新鲜中药止咳方案[J].现代中医药,2021,41(3):125-129.

[5] 黄承宁,殷晓磊,陈武.基于知识图谱的医疗问答系统研究应用[J].信息技术与信息化,2024(5):210-215.

[6] 贾李蓉,刘丽红,刘静,等.基于中医药学语言系统的知识问答系统的设计与构建[J].中华医学图书情报杂志,2019,28(5):11-14.

[7] 邹遐迩,李新民,罗学科,等.基于LabVIEW的水质微型站实时故障诊断专家系统[J].工业安全与环保,2021,47(1):84-88.

[8] 王喆,陆俊燃,杨栋梁,等.融合GPT和知识图谱的洪涝应急决策智能问答系统研究[J].中国安全生产科学技术,2024,20(4):5-11.

[9] 窦凤岐,胡珊,李佳隆,等.基于LangChain的RAG问答系统设计与实现:以C语言课程问答系统为例[J].信息与电脑(理论版),2024,36(6):101-103.

【通联编辑:朱宝贵】

基金项目:广西创新驱动发展专项资金项目(桂科AA22036002) ;广西壮族自治区农业科学院科技发展基金(桂农科2023JZ09) ;广西壮族自治区农业科学院稳定资助科研团队基金(桂农科2021YT077)

经典小说推荐

杂志订阅