什么是合成数据?合成数据是2016年公布的管理科学技术名词,是通过算法、仿真或其他方法人工生成的数据,能够模仿现实世界数据的结构、特征和统计属性,但不包含任何实际的现实世界信息。
该技术的生成方式包括基于生成对抗网络(GANs)、扩散模型、统计模拟等方法,应用于自动驾驶、医疗影像、金融反欺诈等领域,有效降低数据采集成本并满足隐私合规需求。
1.人工智能训练
自动驾驶:通过物理模拟生成道路环境数据,用于训练车辆识别障碍物、交通标识等能力。
医疗影像:生成模拟患者影像数据,助力AI模型开发同时保护真实患者隐私。
2.金融风控
模拟黑天鹅事件等极端金融场景数据,增强反欺诈模型的鲁棒性。
3.工业制造
生成设备故障模拟数据,优化预测性维护算法。
生成方式:真实数据来源于现实观测,而合成数据通过算法模拟生成。
隐私合规性:合成数据不含真实个体信息,天然满足《个人信息保护法》等法规要求,避免数据泄露风险。
可控性:可针对性生成稀缺数据或极端场景数据,弥补真实数据覆盖不足的缺陷。
各市工业和信息化局: 《2024年制造业“揭榜挂帅”招才引智专项攻关指导目录》已编制发布,其中:关键技术攻关类 […]
市工信局: 为实施制造业“揭榜挂帅”招才引智计划,推动科技创新力量、要素配置、人才队伍体系化、协同化,强化企业 […]
各市工业和信息化局: 《2024年制造业“揭榜挂帅”招才引智专项攻关指导目录》已编制发布,其中:关键技术攻关类 […]
市工信局: 为实施制造业“揭榜挂帅”招才引智计划,推动科技创新力量、要素配置、人才队伍体系化、协同化,强化企业 […]