“靠谱的”来了!港科大(广州)牵头完成语言服务大语言模型(1.0)

来源:羊城晚报•羊城派 作者:孙唯 发表时间:2025-10-31 12:31
羊城晚报•羊城派  作者:孙唯  2025-10-31
服务可集成、知识可溯源

日前,由国家语言资源监测与研究中心指导、中国传媒大学和商务印书馆主办的“中国语言生活皮书”编纂二十周年暨第四届中国语言生活学术研讨会在中国传媒大学举行。本次会议上,香港科技大学(广州)作为牵头单位,正式对外发布了语言服务大语言模型(1.0)。

据介绍,语言服务大语言模型(1.0)是国家语言文字科研项目的阶段性成果,由香港科技大学(广州)牵头完成,简称“语服通大语言模型”,意指语言服务通。该大语言模型面向国家语言服务体系构建的实际需求,聚焦多源异构语言数据与复杂中文语境,打造了服务可集成、知识可溯源的一体化大模型,为国家语言服务体系的智能化建设提供了应用示范。

在服务层面,该大语言模型集成了国家语言资源服务平台的各类语言资源与知识源,支持跨平台资源访问与服务联动,实现了平台内资源的集成与智能调度。系统能够自动识别不同的服务请求类型,智能路由至相应的数据源和语言服务模块,完成请求解析、资源调用与结果生成全过程,不仅具备语言知识问答能力,更能在语言研究、教育教学、政务传播等垂直领域中提供专业支持。

在知识层面,该大语言模型依托国家语言生活知识库,实现了回答内容的可溯源与可验证。在回答问题时能够基于文献原文进行推理和引用,并在输出中标注具体来源,通过点对点溯源方式,确保生成结果可验证、可引用,以及模型的学术与公共可信度。其中,国家语言生活知识库汇聚了近二十年来的国家语言生活报告和政策研究成果,经过专家标注、原始文档数字结构化,形成了可检索的知识单元。

内测阶段,团队邀请了语言学专家、教师、科研人员等多角色参与评测,结果显示该大语言模型在问答准确率、调用准确率与溯源可靠性等方面均表现优异,满意度较高。未来,语言服务大模型将持续拓展语言资源接入与应用的边界,推动语言资源服务集成化、智能化、可信化发展,为国家数字中文建设提供有力支撑。

“目前,国家语言资源服务平台已经积累了大量的语言资源和服务,但这些资源和服务呈现出分散的状态,像是被锁在一个‘蓄水池’里,无法充分发挥它们的价值。为了打破这种‘资源孤岛’的局面,我们亟需对这些碎片化的服务进行整合,以便能够对外提供一个统一、高效的语言资源服务。”项目团队带头人陈雷教授指出。

项目团队带头人屈哨兵教授表示,语服通大模型是依托香港科技大学(广州)的大数据团队,和国家语委设在广州大学的“国家语言服务与粤港澳大湾区语言研究中心”的力量,和华中师范大学等有关高校及国家语委的科研机构一起发力,旨在于人工智能时代以切实有效的方式,使国家语言文字资源更好地服务教育强国文化强国建设,展示数字中文的勃勃生机。

文|记者 孙唯 通讯员 港科广
图|学校提供

编辑:李可欣
返回顶部
精彩推荐