财经资讯
大模型高考成绩单出炉,讯飞星火语数外实力位居第一梯队
混元、讯飞星火、文心等国内第一梯队大模型全部参考。据多家媒体在语文作文、数学、英语作文三科实测中,DeepSeek成为本年度国产大模型的“高考数学状元”,讯飞星火数学以1分之差位于第二,其中英文作文则在多个评测中,得分第一,而通义千问、豆包等模型也在部分科目展现出顶尖实力。
飞星火则凭借精准的算法优化与教育领域深耕,已超越更大参数规模的对手。
飞星火以破题,斩获杨小晴、曹越两位专家给出的52/54高分,杨小晴老师点评讯飞星火作文:“结构如交响乐章,选材如历史长卷。”
飞星火的作文将“艺人开不了口”“鸟儿嘶鸣”“带血拥抱”提炼为“中国文人的精神图谱”,直指文明传承内核。其次,用屈原放逐著、杜甫茅屋写广厦、常书鸿守护敦煌等案例,构建出了从个体觉醒到文明永续的逻辑链。立意有穿透性,逻辑有纵深度的前提下,配合精准且震撼的文字表达,使得这篇精准破题,成为高考作文中的优秀范本。
飞星火写的打50分,得分超GPT、 DeepSeek、 Kimi。而在新浪微博、新浪新闻主办的“AI高考作文盲评挑战”中,讯飞星火在10家国内外主流大模型、15位专业评委老师盲评中,获得第一名。
飞星火141分紧随其后。两大模型在函数题、数列证明等高难度题型中均展现完整解题链,稳居国内大模型数学能力的第一梯队,在考生中也达到了“尖子生”标准。
混元,在解题过程中暴露出逻辑连贯性问题。文心则出现了公式套用的错误。
飞星火X1、豆包1.5和混元T1。
飞星火X1、腾讯混元T1、文心X1六款深度推理模型产品。北京市十一学校一分校英语老师韩宪昌、深圳中学英语教师赵文嘉参照往年高考评分标准对上述大模型生成的英语作文给出了专业评分,由高到低的排名分别为:讯飞星火 X1、DeepSeek R1、文心X1、通义千问Qwen3、ChatGPT o3、腾讯混元T1。
飞星火以“全球气候行动网络”提案分获20分和19分。
飞星火内容完整,理由充分且紧扣主题,句式多样,段落衔接自然,展现出对国际议题的精准表达和理解深度。DeepSeek的作文结构严谨且逻辑流畅,但是UN initiatives翻译不够具体到位,以及字数较多实际考试不一定可以写完。ChatGPT提议“零塑饭盒”却用this works口语化表达,腾讯混元用Glad to hear开头像聊天软件对话——高考作文需要正式与非正式语体的精准平衡。
飞星火X1在写作文前执行的“解析题干-提炼论点-匹配论据”流程,可成为学生日常写作的思考链条,基于不同prompt的回答可以启发学生突破套路化表达。
飞星火等多家大模型高考数学成绩均突破130分,国产大模型推理能力整体上已经实现质的飞跃。