业界
讯飞星火四款企业级新品亮相:从能力重塑到场景落地,让AI在行业真正跑起来
飞星火企业军团集中发布四款企业级 AI 新品,构建起覆盖业务场景、人机交互、模型运行的产品体系:业务场景层推出星火营销助理、星火 AI 企业风控官,分别聚焦业务增长与风险管控两大核心领域;人机交互层依托星火智能语音,全面优化复杂场景下的人机交互体验;模型运行层则由星火智能推理担当调度中枢,实现模型高效路由、推理加速、Token 治理与安全管控,保障 AI 算得清、接得快、管得住。
飞推出的高性能CPU版ASR不需要昂贵的GPU,在CPU上就能高效跑起来,并且已适配国产ARM架构和Linux系统。在同等算力下,新版本单路并发路数提升约90%,离线%。一家头部保险公司的真实场景中,综合成本比传统CPU方案节省了近一半。
飞深厚语音技术积累与大模型能力结合后的系统级升级。高性能CPU版ASR与全双工语音交互技术的突破,正在帮助企业跨越“部署成本”和“交互体验”这两道关键门槛,把“听清楚、聊顺畅、答自然”融入统一的语音交互体验之中。
当语音能力、营销能力、风控能力开始在企业的核心业务中并行运转,一个更深层的问题随之浮现——能力都有了,怎么让它们在企业环境里一起安全、高效、可控地运行?Token经济的浪潮让这个问题更加紧迫,中国日均Token调用量两年增长超千倍,但对央国企来说,Token不只是一个技术指标,它牵动着年度预算如何与弹性消耗衔接、数据主权如何保障、采购模式如何适应。
星火智能推理SparkInfer的设计初衷,就是回答上述问题。它的定位是业务和模型之间的统一中间层,采用私有化部署为主、公有云API为辅的混合架构,对于高敏感数据和核心业务场景,支持本地模型推理,确保数据不出域、模型本地跑、调度有策略、成本可追溯。
它做的第一件事,是让不同复杂度的任务匹配不同量级的模型。根据Prompt长度、对话轮次、任务难度和数据敏感等级,把请求分为四级:简单的FAQ调用轻量模型,常规的公文摘要调用标准模型,复杂的合同审查等Agent应用调用Agent增强模型,核心的战略规划和安全审计强制调用最高规格模型。路由决策综合考虑质量、成本、延迟、可用性和安全等级,路由延迟在100毫秒以内。
它做的第二件事,是从三个层面减少不必要的算力消耗。语义缓存让相似问题直接返回结果,在内部知识问答这类高频场景中命中率可达20%~30%;Prompt压缩和上下文裁剪分别再减少10%~20%的输入量。三层叠加,综合可减少30%~60%的Token消耗。
它做的第三件事,是把AI的算力账算清楚。从用户、部门、项目、模型到部署方式,从八个维度拆解每一笔Token的去向,配合预算预警和ROI报表,让信息化部门从大致估算过渡到数据驱动的算力管理。
在推理上,针对DeepSeek、Qwen、GLM等国产主流模型做了算子融合和内存优化,在主流国产硬件上,推理效率比开源vLLM框架提升约50%,首Token延迟降低30%~40%。
目前,星火智能推理 SparkInfer 已在能源、冶金行业多家央国企启动部署和场景验证,助力企业 AI 模型建设实现算力可控、响应高效、安全可管。
智能语音跨越了成本和体验两道门槛,让机器真正能听会说;营销助理将语音交互与营销决策能力转化为增长生产力,AI企业风控官将风险识别与数据分析能力转化为安全生产力;智能推理SparkInfer让语音、营销、风控等更多AI能力在企业环境里安全、高效、有节制地运行。
在Token经济浪潮和国产化替代加速的当下,这个“场景-能力-”矩阵为以央国企为主的行业客户提供了一条从验证到兑现的清晰路径:不是让模型更大,而是让每一步都走得更稳。