依托中国科学院空天信息研究院全球遥感监测系统、星网和北斗时空大数据以及黑龙江本地公共数据,通过数据采集、存储、清洗、标准化、标注,打造一批包含文本、图形、视频多模态,能够应用在政务、交通、应急、制造、农业等领域的高质量语料库及数据集,涵盖服务大模型研发的预训练集,指令微调数据集和测试集。本项目打造国产化数据管理软件和数据安全防护平台及跨行业数据集,充分发挥数据要素乘的倍增器效能,推动龙江政府和企业数字化转型,培育时空数据产业生态,引领龙江时空数字经济的发展方向,构筑龙江在时空数据领域的竞争优势。建设1套国产化数据管理和数据防平台,1套面向政务、交通、应急、制造、农业等行业包含文本、图形、视频多模态的高质量数据集,形成基于政务咨询和助手、智能决策支持、自然灾害监测预警、产品质量检测、病虫害识别与防治、智能农机卫星导航等跨行业场景的预训练数据集,指令微调数据集和测试集。项目预算7000万元,其中数据集采集汇聚1500万元,数据清洗和标注1500万元,国产数据管理及数据防护平台3000万元,数据基础设施1000万元。
会员可见完整内容
马上解锁查看