南理工发布首个语言文学学术全文本大语言模型

2024-07-16来源:经济管理学院作者:沈思审核人:游鹏编辑:李英阅读:182

近日,我校经济管理学院沈思副教授团队牵头发布了语言文学学术全文本大语言模型,该大模型为汉英语言文学领域首个垂直领域大模型,在性能上也是科研和教育领域国内领先的垂直领域大模型,得到了人民网、新华网、中国社会科学网等媒体关注报道。

随着以GPT为代表的生成式人工智能的迅猛发展,大语言模型的研究也越来越受到关注。作为大语言模型的一个重点发展方向,垂直领域大语言模型目前已经涵盖通用、医疗、商业、交通、媒体、气象预测、农业、工业和学术研究等各个领域,但在语言文学学术研究和教学的领域,目前还没有相应的垂直领域模型。基于沈思副教授团队所掌握的大语言模型技术,结合语言文学的专业领域知识,针对语言文学研究和教学的广阔应用场景,语言文学学术全文本大语言模型这一典型的垂直领域大语言模型得以构建。

数据是构建语言文学学术全文本大语言模型的关键。结合合作团队的专业优势,数据集涵盖了学术期刊、图书和教材的全文本数据,并且从教学的角度考虑融入了语文词典的数据。基座模型的选择一定程度上决定了垂直领域大语言模型的整体性能。结合所构建的各种评价指标和评价维度,针对语言文学领域在研究和教学上的真实需求,团队通过评估多个开源模型的表现,最终选择了Qwen模型作为基座模型,并采用了最新的技术来优化训练过程,完成大语言模型对大规模数据集的深入学习,从而实现对语言文学基座模型和对话模型的构建。

面向语言文学领域的大语言模型构建是语言文学领域与人工智能技术深度融合的基础,是推动语言文学研究和教学工作从数字化向智能化转型的必要条件,是新文科背景下将新质生产力融入学科发展的应有之义。在后续的研究中,沈思副教授团队一方面会逐步解决模型目前仍然存在的幻觉问题、资源消耗问题,另一方面,深入结合细颗粒度的场景需求,通过结合RAG(检索增强)、AI Agent(人工智能助理)等技术,实现人工智能技术在语言研究和教学工作中的全面落地。

具体新闻报道的网站链接:

人民网报道:

http://app.people.cn/h5/detail/normal/5860779937268736

新华网报道:

http://www.news.cn/book/20240627/2466098f0f8b47f3a40a7ce5663d7205/c.html

中国社会科学网报道:

https://www.cssn.cn/wx/wx_xlzx/202407/t20240708_5763406.shtml