基于知识图谱的乐山旅游智能问答系统研究及实现
作者: 杜春
摘要:文章采用Python爬虫技术采集“去哪儿网”“百度百科”等网站上的乐山市各个区县及对应景点信息,将采集到的数据进行整理成CSV文件格式,并导入Neo4j图数据库中,从而构建了一个旅游景点的知识图谱。同时根据景点数据制作问句模板,并将这些问句模板中的问句转换成FastText模型训练时需要的数据集格式。接着创建了一个FastText模型,对训练集进行训练,生成了一个问句意图识别的分类模型。最后采用Flask Web框架搭建了一个智能问答系统,实现用户输入问句,对此问句进行中文分词、去停用词等预处理,再进行命名实体识别和将问句传入意图识别模型进行意图识别,查询知识图谱中精确的答案返回给用户。
关键词:爬虫;旅游;FastText;Flask;知识图谱
中图分类号:TP311 文献标识码:A文章编号:1009-3044(2023)29-0046-03
上一篇
点击页面呼出菜单
下一篇