新闻 发表于 2025-9-7 01:51

AI采集乡音数据,数字激活地域文化

作者:微信文章
“ 让方言重新焕发生机



ZHIYULIUSHENG

智语留声:

数字方言守护者



实践总结报告





AI采集乡音数据

数字激活地域文化

ZHIYULIUSHENG





      这个夏天,南京航空航天大学机电学院机械工程104班的智语留声团队开展了以“智语留声:方言数字守护者”为主题的方言数字化暑期社会实践项目。团队采用线上线下紧密结合的实践形式,以团队成员各自的家乡作为实践地点,计划在暑假期间,高效完成多地域方言语音数据的采集工作,并成功搭建起功能完备的数字平台。







科技为翼,

探索方言守护新航道

PART ONE

方言的生存危机



       方言作为地域文化的活化石,承载着一个地区的历史记忆与民俗风情。然而随着社会的快速发展,普通话的普及程度日益提高,以及人口流动的加剧,方言的生存空间不断被压缩。



亟需做出行动



       然而数字时代的到来,尤其是人工智能技术突飞猛进的发展,为方言的保护与数字重生提供了前所未有的机遇。为此,智语留声团队希望通过AI技术,将方言数字化、永久化,并使其在更广泛的范围内传播。



       项目发起人孙同学表示:“我们注意到,方言不仅是语言符号,更是文化认同的纽带。通过 AI 技术,我们希望让方言从‘口耳相传’走向‘数字永存’,为后代保留珍贵的文化遗产。”







步步为营,

构建方言数字保护网

PARTTWO

三步走策略



   首先,团队成员系统性地收集、标注了特定地区性的方言语音样本。团队成员来自五湖四海,有贵州黔东南、吉林白山、浙江温州、广西桂林等多个地方。他们深入家乡的各个角落,从热闹的社区,到宁静的乡村,都留下了他们忙碌的身影。成员们还与家乡居民耐心沟通、亲切交流,广泛收集方言语音素材。最终形成了覆盖9种方言的多地域方言语音数据集,这些珍贵的数据将成为后续方言数字应用开发的坚实基础。





       接着,成员们借助现有人工智能软件建立 AI 方言模型。团队成员会对数据库中的语音数据进行深入分析与学习,并借助豆包 AI 智能体和即梦AI等AI软件的创作功能,通过不断训练 AI 模型,实现基本的方言语音对话功能。







实践照片





       同时,团队成员还搭建了一个网站:智能助手平台。在该网站上,大家可以快速了解多地方言,领略不同地区的风土人情。后续还将持续优化升级该网站,完善现有的功能,为用户带来更好的方言交互体验。





       此外,团队还提出让应用走进生活,成员们用方言 AI 制作了许多趣味视频和音频,让AI来讲当地故事,传承地域文化,吸引更多人使用方言 AI。







成果初现,

开启方言 守护新篇章

PARTTHREE

       目前,团队已经取得了显著的阶段性成果。在数据采集方面,成员们克服困难,成功收集到了涵盖八个省份的共九种地方方言的大量高质量的语音素材。据统计,已经创建的AI智能体被添加累计近千次,视频播放量累计破万,线上线下覆盖人群超1000人次。

       展望未来,智语留声团队将继续深化项目研究,不断完善方言智能对话平台的功能,拓展方言保护的应用场景。相信在所有人共同的努力下,方言这一珍贵的文化遗产将在数字时代绽放出更加绚丽的光彩,为中华文化的繁荣发展增添新的动力。



文案|李佳怡

编辑|孙本一

图片|孙本一朱传波潘盛钦龙成熙

审核|孙本一

页: [1]
查看完整版本: AI采集乡音数据,数字激活地域文化