人工智能时代如何维护文化主体性

	老金范文,海量公文素材资料,下载网址:www.laojin123.com,润笔请加微:liaoda199。



人工智能时代如何维护文化主体性




当前,以大语言模型技术为核心的人工智能技术正飞速迭代和加速演进。大模型通过海量数据的预训练,形成千亿级别参数的复杂网络结构,能够实现强大的上下文理解和多模态内容生成能力,并在很大程度上体现出了通用性和推理能力,能够有效解决当前社会生产生活中存在的一些具体问题,提升全社会的生产效率。围绕大模型的广泛应用,正在形成新的科研范式、创新范式、人机协同工作范式,解构了传统的代际知识传承方式和教育方式,催生出新的人类信息和知识获取模式,重塑未来经济生活形态。

但是,当我们看到人工智能带给人类新纪元曙光的同时,也必须看到当前的大模型在涉及文化判断和价值取向的领域,输出结果仍不尽如人意,存在着与主流认知之间的差异,在一定程度上存在着“胡说”“乱说”“胡写”“乱画”的现象,干扰了人们对社会主流价值观念的认同与判断、对中华优秀传统文化的认知和理解,也对人工智能时代的薪火赓续形成了新的挑战。因此,亟须在积极推进大模型产业应用的前提下多措并举,以社会主义核心价值观为引领,把中华文化主体性融入到大模型的建设和产业应用中,让大模型更具“中国特色、中国风格、中国气派”。

当前的大模型在涉及文化安全的领域,存在着如下问题和挑战。

从训练数据角度看,全球互联网中的英文语料占比高达59.8%,中文语料占比仅为1.3%,使得大模型在训练生成时就缺乏丰富的中文知识。比如,ChatGPT训练数据所使用的中文数据占比就不足0.1%。这种数据分布结构性的缺陷导致了大模型在认知中文世界时存在先天不足。与此同时,互联网公开信息来源复杂,存在大量未经认证的虚假和错误信息,“以讹传讹、三人成虎”的现象在互联网中屡见不鲜,并形成了大量基于误导信息的语料。这就导致大模型对于真实信息的识别能力下降,进而影响输出结果的正确性。除此之外,互联网经过近三十年的发展,“数字鸿沟”问题依然存在,数据在地域、领域和人群分布上极其不均衡,“马太效应”严重,互联网是强势地区、活跃领域、活跃人群的发声地,互联网数据无法全面代表全球不同人群的价值观和世界观,扭曲了大模型最终的价值判断和文化取向。

从大模型本身的技术架构角度来看,大模型存在着极其复杂的网络结构,内部工作机制一直被认为……
试读结束,开通会员文档无限下载使用
收藏 加会员 下载
×
微信支付

打开微信扫码支付

¥28

微信安全登录
打开微信扫码即可登录(新用户自动注册)

手机号注册/登录

×