作者 | 刘宝丹实时股票配资平台
编辑 | 黄昱
DeepSeek已经成为行业风向标,在这场AI竞赛中,主流模型公司都在试图超越DeepSeek,国内AI独角兽智谱也给出了自己的答卷。
3月31日,智谱在中关村论坛上正式发布AutoGLM沉思,这一全新智能体不仅具备深度研究能力(Deep Research),还能实现实际操作(Operator),真正推动AI Agent进入“边想边干”的阶段。
作为全球首个集深度研究与实际操作能力于一体的Agent,AutoGLM沉思的发布是智谱自主智能体技术的一次重要进步,也是设备操控智能体的进一步升级。
AutoGLM沉思背后,智谱推出Agentic GLM系列矩阵,包括GLM-4基座模型、GLM-Z1推理模型、GLM-Z1-Rumination沉思模型和AutoGLM模型等,尤其是推理模型GLM-Z1-Air,它拥有比肩DeepSeek R1的推理性能,而价格仅需R1的1/30。
距离ChatGPT出圈已经过去两年多,AI大模型也从技术迭代转向应用落地,后者已经成为检验模型厂商竞争力的核心指标。目前,智谱已和三星等头部企业合作,还成为北京、上海等城市的合作伙伴。此外,智谱也启动了出海战略。
智谱CEO张鹏对华尔街见闻表示,公司2024年商业化收入增长超过100%,2025年会有更大的增长机会。
在这场AI大模型竞赛中,智谱开始探索出自己的成长路径。
AutoGLM沉思:边想边干4个月前,智谱用AutoGLM实现了群发红包功能,这是AI发出的第一个红包,代表着AI大模型开始从对话走向操作。4个月后,智谱将推理能力布局到Agent上。
不同于上一次发红包,这次智谱开始用Agent赚到钱了。
14天前,智谱秘密开展了一项测试,公司注册了一个小红书号,专注于生活科普。然后用AutoGLM沉思生成笔记,比如怎么选咖啡壶、怎么做化妆品成分对比等。
在现场演示中,张鹏表示,调查2025年化妆品最火的三大抗老成分,比对它们的作用、用法、优劣势,最后还要做严谨的比对分析。“有些任务可真不简单。”
智谱现场揭晓了该账号的成绩:两周时间收获了5000粉丝,接到多条商单邀请,昨天,智谱发出了第一个商单,赚了500块钱。
AutoGLM沉思是首个集深度研究能力和网页操作能力于一体的Agent,体现了智谱对AI Agent的最新理解,即让机器不仅能够思考,还能主动行动,实现“边想边干”的目标。
这也是AutoGLM沉思与Open AI的DeepResearch不同的地方,沉思推动AI Agent从单纯的思考者,进化为能交付结果的智能执行者。
张鹏表示,沉思突破了实时联网搜索、动态工具调用、深度分析和自我验证,实现真正的长程推理和任务执行。
比如,让沉思写一篇报告,“关于哪吒2票房的成功将会给中国电影行业带来怎样的改变。”据张鹏介绍,沉思模型很擅长做这类开放性的问题,需要模型自己去探索,最后它生成了近万字的报告。
这次,智谱发布的是AutoGLM沉思preview版本,核心支持research场景。张鹏透露,在未来两周,将进一步扩展更多Agent的执行能力。
此外,AutoGLM沉思发布即上线,目前已经在智谱清言PC客户端上线。
背后模型全栈自研AutoGLM沉思模型的背后,是智谱自主研发的全栈大模型技术。
整体来看,沉思融合了GLM-4的通用能力、GLM-Z1的反思能力、GLM-Z1-Rumination的沉思能力,以及AutoGLM的自动执行能力。
智谱重新训练了一个320亿参数的基座模型GLM-4-Air-0414,在预训练阶段加入了更多的代码类、推理类数据,并在对齐阶段针对智能体能力进行了优化,模型在工具调用、联网搜索、代码等智能体任务上的能力得到大大加强。
会上,张鹏表示,GLM-4-Air-0414以32B参数量比肩更大参数量的国内外主流模型,这使得模型在适配智能体任务方面特别有效。“这是因为智能体任务往往涉及多轮复杂交互,32B的参数量使得GLM-4-Air-0414能快速执行复杂任务,为AI智能体的真正大规模落地应用提供了坚实基础。”
基于GLM-4-Air-0414,智谱推出了全新的深度思考模型GLM-Z1-Air,在性能表现上,可以与DeepSeek-R1(671B,激活37B)媲美。
在推理速度上,GLM-Z1-Air相比R1提升了8倍,成本可以降低至1/30,实现高性能与高性价比的双重突破。此外,GLM-Z1-Air可在消费级显卡上运行。
基于GLM-Z1,智谱通过扩展强化学习训练,提升了模型结合工具使用完成长程推理能力,训练出沉思模型GLM-Z1-Rumination。
张鹏表示,该模型突破了传统AI单纯依赖内部知识推理的局限,创新性地结合实时联网搜索、动态工具调用、深度分析和自我验证,形成完整的自主研究流程。
GLM-Z1-Rumination能够主动理解用户需求,在复杂任务中不断优化推理、反复验证与修正假设,使研究成果更具可靠性与实用性。相比于传统的推理模型,智谱期待沉思模型引领AI助手进入一个“高智商”到“高智商+高自主”的阶段。
Agent的核心就是推理规划和动手能力。如果说沉思模型是AutoGLM沉思的大脑,那么,AutoGLM则是AutoGLM沉思的手脚。
智谱去年10月发布了AutoGLM,它是全球首个能够在手机上执行长达50多步action的大模型智能体,AutoGLM沉思版背后的AutoGLM能力,较上次发布也有了非常大的进化。
张鹏表示,大模型的预训练和后训练存在Scaling Law,Agent也存在类似的Scaling Law。“在Agent Scaling Law的基础上,我们进一步发现了Agent存在的能力涌现。”
比如,在训练中,从未教给AutoGLM沉思访问过巨潮资讯网。然而,当发送指令“帮我收集昨天关于具身智能的相关研报”时,AutoGLM沉思能够规划出通过访问巨潮资讯解决问题的方案,并顺利操作了网站。
张鹏表示,AutoGLM的动手能力目前在行业内处于Sota,包括浏览器、手机和电脑在内的使用工具能力,全面领先。在GUI智能体方面,CogAgent在GUI Agent的多个榜单上取得了Sota的结果。
上述一系列成绩背后,离不开智谱对Agent的前瞻性布局。
从2023年10月最早推出具备FunctionCall能力的智谱清言,到2024年1月上线支持智能体编排的GLMs,再到2024年10月推出AutoGLM,以及今天推出的AutoGLM沉思,智谱一直在引领对Agent的探索。
在经过6年的技术沉淀后,智谱终于开始在这场AI竞赛中展现出更多竞争力。
开源并不等于免费与DeepSeek和阿里等AI公司一样,智谱也坚持开源策略。张鹏表示,上述模型将于4月14日开源,并将在未来两周内陆续上线MaaS平台。
阿里开源的商业逻辑是为了售卖云计算服务,对模型厂商而言,开源就意味着把核心技术公开,对于商业化会带来一定挑战。
张鹏也坦诚,开源对商业化市场会有一些影响。不过,他也强调,开源并不等于完全免费,后期技术人员的投入、维护成本,包括如何把DeepSeek做本地化落地等,成本一点都不低,要找专业团队来解决问题。
目前,市面上有各种智能体产品,作为很早就开始智能体相关研究的模型厂商,智谱深谙市场需求。张鹏强调:“一定要做模型的服务,不是说把产品光扔给企业就可以了,企业玩不转白搭,他花了钱反过头来还会告诉你不好用。”
目前,智谱正在大力推进AI技术的整体服务,包括提供工具和平台,提供案例和解决方案,提供更好的经验,让更多的人能够把买来的模型或者开源模型真正地用起来。
华尔街见闻获悉,目前,智谱已携手金融、教育、医疗、政务、企服等领域的合作伙伴,共同推进AgenticLLM的落地应用。今年2月,智谱和三星官宣了基于Agentic LLM的相关合作,将Agent体验带到三星最新手机Galaxy S25系列上。同时,智谱也相继与北京、杭州、上海、成都、珠海等城市达成合作。
智谱也在积极出海,当天,由智谱主导,来自东盟十国及“一带一路”沿线的10个国家共同发起了“自主大模型国际共建联盟”正式成立,帮助“一带一路”国家建立自主AI,构建可控的国家级AI基础设施。
对于商业化方面,智谱去年整体实现了超过100%的增长速度,很多头部行业已经打进去,有一定规模化的效果。对于今年的预期,张鹏表示,经过再一次科普,会让市场呈十倍以上的增长,会有更大的机会存在。
“整个模式和商业路径会有一些变化,我们会做调整。但是我们还是保持一贯的稳定的商业化落地的速度和效益,持续提升商业化落地的效果。”张鹏表示。
当谈到公司目前的战略重心时,张鹏对华尔街见闻表示,智谱把自己定位成技术驱动的公司,另外一条腿是商业化路径,这两条腿并不是互相矛盾的,也不是互相争抢资源,处于动态调整的过程。
张鹏进一步表示:“技术的推进和演进,到了一个必须深入到产业和应用当中去,吸取营养回馈技术研发,所以才会从去年开始大力推进产业化、商业化落地这件事情,会有一些资源的投入。但是从整体的核心任务和资源投入角度来讲,我们更多的资源还是投入在技术研发、创新这一块更高一些。”
这场通往AGI的竞赛仍处于早期实时股票配资平台,对智谱来说,虽然已经探索到L3-Agentic LLM阶段,但未来的路仍然充满荆棘,要想在全球范围内实现更大的创新,还要全力以赴。
风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。