问题:
近年来,中美大模型发展差距加大,国内人工智能大模型领域竞争日趋激烈,用好北京人工智能资源优势、加速人工智能大模型产业发展,面临5个迫切需要解决的实际困难。一是高端复合型人才不足。数据显示,全球顶级AI研究员工作所在地,美国占60%,中国仅占11%。尽管北京人工智能人才高度聚集,但符合产业发展的复合型人才仍然紧缺。二是缺少高质量的中文数据集。目前已上线的中文数据集整体数量和质量与英文数据集相差巨大,相当一部分内容非常陈旧。三是算力成本居高不下。国产芯片算力集群不足以支撑较大规模的模型训练,即便使用较小规模参数的模型,国产芯片训练成本仍为使用英伟达等算力基础设施的2.5倍以上。四是大模型应用场景少且监管严苛。大模型应用不充分,政府部门、企业出于各种原因对大模型应用的接受度和认可度不高,应用场景开放不够。大模型应用需要准备大量材料以通过“双新评估”,费时耗力,已通过评估的基础模型服务场景改变算法及算法备案流程繁琐,导致大部分模型应用仅聚焦企业内部使用,市场化应用不足。
分析:
一是人才方面,大模型应用涉及跨学科、跨文理多个领域,高端复合型人才难以满足产业发展需要。二是中文数据集建设方面,国内外基础大模型参数数据集主要以英文为主,大模型中文语料库建设及语料库训练运用面临困难,需要政府统筹。三是算力方面,大模型企业需要迅速获得大量低成本、高效能的算力,而非芯片本身。尽管北京市已投建部分算力中心,但因工程化能力不足等问题,难以支撑较大参数的基础模型训练,需要企业付出较高成本进行算力工程化调试并处理训练中的适配问题,大幅提升了训练成本。四是应用场景方面,政府公共服务部门、国有企业对大模型等新技术应用、数据安全保密等存在顾虑,开放大模型场景意愿不强。许多传统企业还处于信息化、数字化初期,对大模型的应用接受度和认知度不高。基础模型通过网信办“双新评估”需要准备大量材料,初创企业很难有足够的人手和专业力量投入。利用已通过评估的基础模型服务场景,通常需要进行算法调优,如应用在面向公众的场景中,必须对每一次算法改变进行算法备案,流程繁琐。
建议:
一是加强人工智能领域人才支持。支持民营企业AI人才参与国家重大科技专项、重点研发计划等顶层设计和执行,并支持民营企业AI专家参与国家杰出青年科学基金、长江学者奖励计划。对于符合条件的高端AI人才,实行优先落户政策,提供税收优惠,保障子女就学、家人就医等,解决人才后顾之忧。
二是加大产业规划引导力度。通过算力券等补贴方式,降低企业使用优质算力成本。采用弱知识产权、数据安全技术等方式推动数据开放共享,推动公共数据资源开放利用。加快构建统一的公共数据开放基础制度规范,扩大面向AI产业的公共数据供给范围,支持龙头企业牵头制定数据标注规则和数据标注质量评估体系,加快构建中文高质量数据集。
三是开放应用场景,加速产业发展。推动相关部门、国有企业加速开放场景。为民营大模型创新企业提供资金和政策支持。优化审批流程,为大模型技术产品和服务进入市场提供快速通道。鼓励企业探索订阅服务、按使用量付费、技术许可等多样化商业模式。支持服务业、文化类企业加速应用基础大模型、研发应用行业模型和企业专属模型,通过“用模型”反哺技术创新。
四是稳慎推进监管,留足创新空间。在人工智能领域统筹发展与安全,审慎出台规制型政策,为创新留足时间和空间。对处于发展初期的AI大模型技术和应用,结合其技术特征和发展规律,在监管模式上更注重事中、事后监管,对应用场景风险较低的新技术新应用,以行业自律等方式予以治理,留出更多试错、容错空间,保护企业投资意愿和创新活力。