大语言模型问答任务准确性评价方法及基于微调的垂直领域优化研究AET-电子技术应用-最丰富的电子设计资源平台

大语言模型问答任务准确性评价方法及基于微调的垂直领域优化研究
所属分类：技术论文
上传者：wwei
文档大小：5136 K
标签：大语言模型问答任务语料库
所需积分：0分积分不够怎么办？
文档介绍：随着自然语言处理技术的进步，大语言模型展现了强大的语义理解和生成能力，但在实际应用中，其问答准确性仍面临诸多挑战，特别是垂直领域应用。首先梳理了通用大语言模型问答生成能力常见的评价指标，其次，从基于词汇的自动评价方法、人工评价方法和基于大语言模型的评价方法三方面，阐述通用大语言模型问答任务准确性评价方法，而后，针对通用大语言模型垂直领域问答准确性较低的问题，以ChatGLM36B和国防动员领域为例，提出了构建垂直领域语料库、精细化处理数据、定制化微调的“三步走”优化方法，通过人工评价和基于词汇的自动评价的方式进行3轮测试评估，解决了通用大语言模型垂直领域问答精度较低的问题，显著提升问答准确性。相关成果有望为其他通用大语言模型和垂直领域应用提供参考。
现在下载
VIP会员，AET专家下载不扣分；重复下载不扣分，本人上传资源不扣分。