让AI“说实话”!讯飞星火X1再升级

安徽省资讯 (281) 发布于:2025-07-28 11:31:14 更新于:2025-07-28 11:31:14 来自:合肥日报
项目申报

让AI回答更可靠,日前,科大讯飞宣布基于全国产算力训练的深度推理大模型讯飞星火X1再次升级,在“AI幻觉”治理问题上取得显著突破,超越业界主流模型。

“一本正经地胡说八道”,是许多人对当前开放式内容生成功能的观感和评价,这也就是业内所说的“AI幻觉”。升级后的星火X1在内容可靠性上大幅提升,大大解决“AI幻觉”问题。星火X1升级后无论是对自身生成内容真实性的把控(事实性幻觉治理),还是在参考外部资料时对原文的忠实程度(忠实性幻觉治理),都有显著改善。

整体来看,新版本综合能力大幅提升,在翻译、推理、文本生成、数学等核心能力上,已能对标OpenAI o3等国际一流大模型最新版本效果;多语言能力更是扩展至130余种。与此同时,基于星火X1的语音同传大模型也迎来全面升级,教育、医疗、企业应用、代码、科研等行业大模型和智能体均取得新突破,在复杂行业场景任务上进一步满足用户核心需求。

讯飞星火X1此次跃升,背后是一系列原创性技术突破的集成。

面对大模型容易“胡说八道”的通病,科大讯飞提出基于多路径采样验证及事实性约束强化学习的幻觉治理技术,在大模型思考过程及回复生成阶段,实现客观问题与标准答案的深度强对齐,大幅减少了在慢思考下的幻觉率,让大模型回复通用常识及专业知识问题更加可靠。

在数据层面,科大讯飞更是开创性地提出了基于人类专家数据的通用认知任务数据反写技术,有效地解决了SFT高质量数据获取困难、人工标注费时费力等现实挑战,实现了主观语言类任务文笔和风格化的显著提升。

转载于:合肥日报

THE END

温馨提示:

如有侵权请联系删除邮箱:2942802716@qq.com, 违法和不良信息举报邮箱:hzj@spiderltd.com。
新媒体服务

下一篇

已是最新文章