全国首个区域文化大模型交出“年考”答卷 岭南文化大模型完成10亿词元语料建设
创始人
2026-03-29 09:15:41
0

羊城晚报记者 詹淑真

“全国超过100个大模型,却没有一个能用粤语思考、听得懂粤剧、看得懂广彩瓷器。”一年前,这句话道出了岭南文化在人工智能时代面临的尴尬处境。

3月28日,在2026年岭南数字创意大厦高质量发展大会上,羊城晚报报业集团旗下岭南文化大模型实验室发布阶段性建设成果:围绕“打技术基础、做示范应用、找落地场景”三条主线,实验室已完成超10亿词元岭南文化语料建设,在全国率先发布粤语思维链语料集,并通过深度蒸馏微调推出7B至72B参数系列模型,在文旅、教育两大领域实现首批应用落地。这是国内首个聚焦区域文化的多模态大模型首次系统性披露建设进展。

值得关注的是,大会上,岭南文化大模型实验室发布“广东外贸一千年”多模态语料集。语料集探索“一展一知识库”,推动文博展览从“一次展示”走向“长期复用”。

10亿词元筑底座,让大模型“学透”岭南文化

语料建设是项目最核心的基础。过去一年,项目团队系统整理形成了超过10亿词元的岭南文化语料,覆盖13大类、200多个子类,数据形态涵盖文本、图片、音频、视频,并已完成广东省数据知识产权登记。对区域文化模型而言,这意味着其能力建设不再依赖零散信息的简单调用,而是建立在较大规模、较高结构化程度的本土文化知识供给之上,为后续模型训练、知识组织和场景应用提供了稳定底座。

其中最具突破性的是粤语思维链语料集的发布。岭南文化大模型实验室负责人解释,当前主流大模型在处理粤语时,本质上走的是一条“曲线路径”——先将粤语翻译成普通话,再基于普通话语义生成回答,最后转回粤语输出。这种“翻译中转”模式导致模型在面对方言逻辑、文化隐喻和本土表达时往往“水土不服”,丢失了大量只有粤语母语者才能领会的语义细节。而实验室构建的粤语思维链数据集,通过系统化标注粤语推理路径,让模型能够像在广州土生土长的人那样直接用粤语逻辑进行思考,而非经由普通话“中转”。该数据集已于2025年12月面向全国开源,系国内首个面向区域方言的思维链语料资源,发布后引起学界和业界广泛关注。

模型方面,实验室基于DeepSeek和通义千问等国产基座模型,通过文化数据深度蒸馏微调,先后发布7B至72B多个参数规格的岭南文化垂直模型,具备文字、图片、视频等多模态处理能力。在合规层面,实验室已于2025年9月、2026年1月分别完成深度合成算法备案和生成式人工智能大模型备案,成为目前国内为数不多完成“双备案”的区域文化大模型团队。

从文旅导览到教育互动,两大场景率先落地

有了技术基础和示范成果,关键还要“用起来”。过去一年,岭南文化大模型在文旅和教育两大领域率先实现应用落地,让技术成果真正触达普通用户。

在文旅领域,2025年8月,基于岭南文化大模型打造的智能文旅服务产品“文化通”正式上线羊城派App,面向公众提供个人文旅导览、文化活地图等一体化智能服务。该产品入选省文旅厅、省工信厅联合发布的2025年广东“人工智能+文旅”应用场景典型案例。

下一步,实验室将推进“一村一芯”计划,为省内典型村落部署以本土文化语料微调过的垂直大模型,将每个村落独特的历史文脉、民俗风物、建筑遗产等转化为智能导览和文化体验产品,以数字化手段助力广东“百千万工程”在文化维度的纵深推进。

在教育领域,实验室正积极探索“一书一应用”模式——将图书内容、角色形象与AI互动能力进行深度融合,突破传统数字阅读的单向传播局限,让图书从“被阅读”变为“可对话”,从“静态文本”变为“活态体验”。

与此同时,围绕“岭南文化通识+AI素养”方向,实验室正研究制定面向校园和青少年群体的融合课程体系,计划在条件成熟后逐步在省内学校落地使用,并向港澳地区延伸,为大湾区青少年提供兼具文化底蕴与技术素养的创新课程资源。

“一个底座、一套模式、一条路径”

回顾过去一年的建设历程,实验室相关负责人将成果概括为“一个底座、一套模式、一条路径”:建设了一个底座——全国首个区域文化多模态大模型,实现模型自主可控;打造了一套模式——“一展一知识库”,让文化资产从“展完即散”变为“永续留存”;走出了一条路径——从文旅到教育,让岭南文化真正走进日常生活。

当前,羊城晚报报业集团已将岭南文化大数据中心建设列为“十五五”规划重点任务。下一步,实验室将围绕《广东省推进落实国家文化数字化战略实施方案》,持续深化语料建设、模型迭代和场景拓展,在文博、文旅、教育、社科研究等领域探索更多应用可能,推动岭南文化数字资源向更大范围的知识服务和产业应用转化。

“我们的目标很明确——让岭南文化在大模型时代不缺席、有话语权。”羊城晚报报业集团(羊城晚报社)党委委员、副社长丁华表示,当大模型重塑知识生产和文化传播的底层逻辑时,区域文化不应只是被动的数据供给方,而应成为主动的知识建构者。岭南文化拥有两千多年的深厚积淀,从粤剧粤曲到广彩广绣,从海上丝绸之路到改革开放前沿,这些独特的文化基因理应在人工智能时代获得新的表达方式和传播渠道。岭南文化大模型的一年实践,正是这一理念的具体回应。

相关内容

蔚来首进拉美!哥斯达黎加三...
3月26日,蔚来汽车在哥斯达黎加的首家门店正式开业,标志着蔚来在拉...
2026-03-29 11:11:10
春满大地
2026-03-29 11:10:07
中关村论坛年会:中国不断推...
以“科技创新与产业创新深度融合”为年度主题的2026中关村论坛年会...
2026-03-29 11:09:13
旅行博主杰克·托尔:购在中...
中国日报网3月28日电 对澳大利亚人杰克·托尔来说,每次来中国都有...
2026-03-29 11:08:47
以篮球之名,展文明之风——...
3月28日傍晚,阳江市体育馆内外人潮涌动。距离开赛还有一个多小时,...
2026-03-29 11:08:35
华为云计算解决方案销售部总...
3月28日,在2026年岭南数字创意大厦高质量发展大会上,华为云计...
2026-03-29 11:07:45
视频丨海外华侨华人热议太平...
《太平年》正在总台中文国际频道面向全球观众热播。随着剧情的深入,剧...
2026-03-29 09:17:54
青年服务“百千万工程”专题...
超万个优质岗位“上链接” 最高月薪6万元新快报讯 记者毛毛雨报道 ...
2026-03-29 09:17:22
交通银行广东省分行:以金融...
文/刘韫恩 陈银洁 图/受访者提供金融兴则产业兴,文化强则民族强。...
2026-03-29 09:16:57

热门资讯

蔚来首进拉美!哥斯达黎加三品牌... 3月26日,蔚来汽车在哥斯达黎加的首家门店正式开业,标志着蔚来在拉美地区的首家门店以及海外首个三品牌...
中关村论坛年会:中国不断推动世... 以“科技创新与产业创新深度融合”为年度主题的2026中关村论坛年会正在举办,来自全球100多个国家和...
旅行博主杰克·托尔:购在中国是... 中国日报网3月28日电 对澳大利亚人杰克·托尔来说,每次来中国都有惊喜,而喜欢在中国买东西,原因竟是...
以篮球之名,展文明之风——从一... 3月28日傍晚,阳江市体育馆内外人潮涌动。距离开赛还有一个多小时,热情的球迷便从四面八方汇聚而来,脸...
华为云计算解决方案销售部总裁陶... 3月28日,在2026年岭南数字创意大厦高质量发展大会上,华为云计算解决方案销售部总裁陶敏作主旨发言...
视频丨海外华侨华人热议太平年:... 《太平年》正在总台中文国际频道面向全球观众热播。随着剧情的深入,剧中吴越之地世家大族的家风传承,引发...
青年服务“百千万工程”专题招聘... 超万个优质岗位“上链接” 最高月薪6万元新快报讯 记者毛毛雨报道 3月28日,青年服务“百千万工程”...
交通银行广东省分行:以金融创新... 文/刘韫恩 陈银洁 图/受访者提供金融兴则产业兴,文化强则民族强。中央金融工作会议锚定建设金融强国目...
自岭南向全国:羊城晚报三大文化... 3月28日,2026年岭南数字创意大厦高质量发展大会现场,三大文化垂直领域IP——“博物天下”“上场...