01
零距离:从“大国重器”到“开发利器”
考察团一行深入徐工矿机智能制造基地,近距离观摩了徐工成套露天矿山机械生产流程。车间内,智能化设备高效运转,机器人精准作业,数字化管理系统实时监控生产各环节,严谨的质量管控体系与先进的制造工艺,直观展现了徐工“精益制造”的硬核实力。设备展示区,矿挖、矿车、电铲等系列成套矿山装备整齐列阵,覆盖了“穿孔、采装、运输、排土”工艺流程,满足各类工况作业需求。

02
端到端:无人驾驶集群作业成熟稳定
活动现场,无人驾驶集群作业赢得高度赞赏。随着指令下达,遥控矿挖、无人矿车、装载机多台设备协同联动,精准完成挖掘、转运、装卸等一系列作业。此前在内蒙古伊敏矿,徐工已经和华能集团合作,依托高精度定位、环境智能感知、协同调度算法等核心技术,全面落地全球首批纯绿电、真无人设备应用场景,实现矿卡与多机型智能混编作业,构建了从设备智能到系统协同、从单点应用到全场景覆盖的解决方案。
03
面对面:共话矿山安全与智能化未来
座谈会上,徐工矿山机械事业部总经理任大明围绕矿山安全、绿色智慧、技术创新与开放合作,清晰阐述了徐工的发展路径,充分展现出徐工提供全场景、全周期的解决方案的实力。地质研究和电力建设企业专家分别做了主题分享。徐工机械副总裁孟文在大会总结发言中表示,徐工愿与中国安全产业协会、全国矿山企业携手,共建技术创新联盟、共推行业标准制定、共筑安全发展防线、共拓绿色智慧新局。
此次交流不仅是技术与产品的展示,更是一场关于“安全与效益共生”的深度对话。作为矿山装备“国家队”,全球零碳智慧矿山解决方案的开拓者,徐工矿机将持续以自主创新为笔,在“十五五”的画卷上,与行业伙伴共绘更安全、更绿色、更智慧的矿山新未来。
" alt="齐聚徐工——共探“零碳+智慧”矿山新未来" style="width:125px;height:80px;">
“我家天花板漏水严重,墙面都泡坏了,与楼上住户沟通多次无果,恳请社区帮忙!”前不久,舒城县城关镇飞霞花园二期业主吴女士通过“无事”找书记小程序发出求助,言语间满是焦急。
民有所呼,我有所应。飞霞社区党总支书记兼网格长杨宏霞第一时间入户核实,与包片干部、网格员共同现场查看漏水点位。掌握情况后,迅速联系楼上业主开展调解,明晰责任,并协调物业制定维修方案。在社区网格员跟踪督办下,困扰吴女士多日的漏水问题得以彻底解决,楼上楼下“握手言和”。
这是舒城县城关镇依托智慧治理平台服务群众的生动缩影。今年以来,该镇坚持党建引领基层治理,用好“无事”找书记智慧治理平台,构建“接诉即办、多方联动、闭环处置”的高效机制,打通服务群众“最后一米”。
不久前,该镇北隅村门面房前的电线杆固定拉丝成为村民“心头患”。由于拉丝未设警示标志,夜间光线昏暗,有村民骑电瓶车被绊倒,安全隐患凸显。相关情况反映到“无事”找书记小程序后,网格员立即到场核实。北隅村党支部书记何亚迅速与供电部门沟通,不到一天便完成拉丝包裹防护和警示标志加装,消除了隐患。村民们点赞:“小程序一键直达,干部办事效率高。”
线上“一键求助”,线下“闻令而动”。鼓楼社区老三巷由于建成年代久远,基础设施陈旧,污水管道堵塞时有发生。去年下半年,居民汪女士来电求助:家门口污水井漫溢,公厕污水流到路面,急需处理。社区第一时间响应,清淤5个污水井,疏通污水管道,解决了居民“堵心”事。
聚焦居民“微需求”,做实服务“绣花功”。城关镇通过“无事”找书记智慧治理平台,实现线上“接单”、线下“解难”,形成快速响应、高效办理、及时反馈的工作闭环。今年1至2月,该镇在平台上共收到群众诉求851条,办结率95%以上,群众满意度99%以上。
(本网记者 黄雪彦 通讯员 徐徽)
" alt="线上“接单” 线下“解难”" style="width:125px;height:80px;">

在OpenClaw火热到频频登上头条的那几天,有分析师在行业群里沮丧发言,“正在拼命学OpenClaw的投研应用……感觉自己快要失业了。”
近期流传甚广的Anthropic报告也显示,“商业与金融”是AI理论可覆盖率和实际渗透率都较高的领域,财务和投资分析师的实际暴露度已达57.2%。
但在这样一个容易被AI渗透的领域,进门CEO程建辉告诉我们:
现实市场并非100%有效,会存在信息孤岛、小样本信息,也会存在传播延迟和解读效率的问题。AI无法吃掉所有信息,也不可能完全捕捉市场的 “漏洞和机会”。但这正是人的机会,分析师的机会。
主攻AI投研的进门(深圳进门财经科技股份有限公司),成立于2013年,目前已累计服务超过3100家上市公司、74家券商研究所及300多万专业投资者。2023年获得腾讯战投后,全面升级为「机构AI投研工作台」。
2025年至今,进门超级投研智能体“AI进宝”,已从AI投研助手,进化为能“干活”的AI数字研究员。通过12个Agent、投研大脑和近期上线的投研龙虾,帮助用户处理投研场景的高频任务,并不断捕捉投资信号。
“没想到大家的热情这么高。” 程建辉声音沙哑地说道。自从“进门投研龙虾”上线,他就穿梭在各场路演中,他感受到,券商分析师、投资者们对于AI能真正“干活”这件事,充满了前所未有的好奇与期待。
在AI投研这件事上,进门的商业逻辑比较“特别”——以沟通为基础,试图构建上市公司、券商研究所、专业投资者三大群体的闭环生态,做深专业智能投研。过去两年,进门不断闭环投研沟通场景,并帮助投研用户提效降噪、挖掘信号、用AI自动化处理各类繁琐的任务。
通过AI工具矩阵,帮助用户提高信息处理的效率和信息获取的密度:AI转写、AI会议托管,AI翻译、AI录音,甚至做了自家的录音智能硬件,将触角延伸到线下。
深耕沟通场景的同时,程建辉发现,AI没办法突破信息孤岛和小样本问题,像顶级分析师、研究员那样,听懂真实世界沟通的“弦外之音”,给出非共识性的判断。
他认为,专业 AI 让共识性信息实现了平权普惠,正在不断提升普通投资者的投资能力下限,“直白点说,过去老是被割韭菜,往后割韭菜也没那么容易了。”
进门的样本,实际指向了这样一个思考:比起“替代多少人力”,人类的价值是否重新得到肯定、得到聚焦,或许才是AI真正的价值所在。
以下是雷峰网与程建辉的对话,有不改变原意的编辑:
雷峰网:现在一些分析师用OpenClaw做投研,进门目前也接入了OpenClaw。其实OpenClaw、Manus这些相对通用的AI,声量是更高一些的,您怎么看它们和进门的竞合关系?
程建辉:进门是聚焦于金融投研领域的AI产品,不管在场景、数据、工具,还是对行业know-how的认知上,都会比其他通用AI要好。
当然,Manus、OpenClaw等产品给了我们很多启发。我们很早就在系统思考AI如何解决投研场景的问题,充分发挥AI的“思考”与“执行”双重能力。
Manus这类产品的方向是,从会话模式向“帮用户完成特定任务”转变,感觉挺有意思。但任务执行的完整度不够好。OpenClaw的诞生,标志着AI从“对话脑”进化出了“干活的手”。
我们很兴奋,一直在观察,春节也没休假,加班夯实底层基础工作。不过,早期的OpenClaw 比较脆弱,升级、开关机、处理任务时经常报错。操作繁琐,门槛很高,所以最开始只有极客用户在使用。迭代了几个版本后,成熟度比以前高很多,我们才感觉时机成熟,于是推出了自己的“投研龙虾”。
进门投研龙虾采用云端部署的方式,对OpenClaw进行封装、改良,让用户能够拿来即用。这极大地降低了使用门槛,让用户不用再费心折腾底层系统基建,把全部精力都放在完成核心任务上。
雷峰网:真正实现AI在投研领域的自动化有哪些难点?
程建辉:要解决多样化的问题。基于同样的事实和数据,各人看法不一。因此,光靠模型远远不够,还要涵盖不同群体的思维范式。
AI进宝的任务模式(即投研龙虾),以及对话模式下的投研大脑,都能有效解决这个问题。
投研龙虾能够将Agent的能力原子化,让用户根据自身需求,灵活组合、定制,实现个性化工作流的搭建。会话模式中的投研大脑,支持用户自定义创建思维链,或让系统自行拆解优秀研究范本中的方法论,比如可以拆解芒格、巴菲特的著作中蕴含的投资心得。
当然,会话模式的能力不止于此。2025年,我们上线了12款Agent,包括业绩点评、观点对比等等,在这个模式下,进宝就能够自由发挥,用预训练时候形成的思维链来回答问题。
但用户的新想法、新要求源源不断,不可能无限满足,所以才有了投研大脑和“龙虾”任务模式。(雷峰网近期将持续关注投研等AI Agent实际应用案例,欢迎添加作者微信 LorraineSummer 交流)
雷峰网:可以说通用AI对进门没有太大威胁?
程建辉:我们在数据基座、专业逻辑、安全风控、工作流与决策闭环上,拥有通用AI无法替代的垂直壁垒。通用类AI缺乏权威金融数据源、不懂投研范式,也难以深度嵌入投研全流程,无法替代专业投研AI的核心价值。
而生产力级别投研AI,对数据准确度、颗粒度要求都很高,一般市场产品做不到。很多网络分享,号称利用模型抓信息形成研报、自己炒股挣钱,在我理解都是Demo级别、玩具级别的东西,距离生产力级别还很远,这是民品和军品的区别。
Demo级别的投研AI大家都能玩,但真正做到生产力级别,你要相信市场上最专业的那群机构投资者的选择和判断,这是世界上最聪明的一群人。我们目前也和南方基金、鹏华基金、平安基金、招商基金等头部公募达成了深度合作。
雷峰网:说到投研领域,大家更熟悉的可能还是万得、东财、同花顺。进门和这些老牌金融信息厂商的最大差异是什么?
程建辉:他们主要做过程交付,而我们做结果交付;他们的产品设计以人为中心,但我们是AI原生产品,设计上主要考虑如何让AI以更智能、更自然的方式服务于人。
什么是过程交付呢?举个例子,老牌厂商把交易所的公告,处理成数据表,这个过程就像把胡萝卜从地里拔回来,洗干净切好放着。
但进门做的是端到端交付,直接给出结果,一步到位。像西红柿鸡蛋这类简单的菜,机器人直接炒好了;复杂的、需要高超手艺的,才留给大厨去做。
当然,现在AI还有幻觉问题,理解数据不够准,所以要通过大量工程方法去解决。但在技术趋势上,“端到端”一定会比传统“过程交付”做得好。
雷峰网:AI幻觉给投研带来的挑战应该是非常大的。
程建辉:是的,所以要做好数据治理。在我看来,投资的本质其实就两层:第一层是数据治理,第二层是信号捕捉。
数据治理,就是要利用大量工程方法,对原始数据进行处理。就算最顶级的模型,要减少幻觉,保证结果可靠演进,也要基于治理后的高质量数据。
不管是人还是模型,都要在数据干净的基础上,去挖掘信号,获得洞察。
对于我们来说,主要治理两大类数据。一是从沟通场景沉淀的路演、调研等动态信息,这些信息比静态的公告更及时、全面;二是外购的财报、行业、宏观、行情因子等数据。
通过治理和结构化表达,我们推出了《进门内参》(一日三更的投研日报)、事件信号等能力,帮助用户更快、更精确地捕捉信号。
雷峰网:互联网上本来也有很多真伪难辨的信息,数据治理很难做,AI采纳这些信息之后给出的回答,质量不会太理想。进门怎么防范这种风险?
程建辉:AI会遭遇“数据投毒”问题,今年3·15晚会也提到了这点。有人为GEO批量制造数据,诱导模型抓取;有人在纪要中刻意夹杂私货,通过“小作文”扰乱市场——这些有毒信息,会侵蚀决策的准确性。
为了防范这种风险,我们一直在做数据溯源、数据准确性校验与底层数据治理体系建设。二是不断累积最真实、最原始的一手信息,包括上市公司、分析师在进门的会议。从源头有效规避数据投毒风险。
雷峰网:涉足AI投研的技术厂商不少,但像进门这样从“开会”起家的不多见。为什么最初会选择“沟通场景”来做?
程建辉:在金融领域,沟通是仅次于行情和交易之后,最高频的场景。其次,沟通场景是一个天然的信息富矿,是存在信息差的地方。第三,现在股价对信息的反馈速度非常快。相比于其他交流形态,沟通是一个效率最高的形式。
另外,沟通场景有天然的双边市场效应,分析师开会、上市公司路演,都会吸引投资者,场景自带流量。三个群体形成生态,自然会沉淀大量内容和数据。大家在市场上看到的券商研究路演海报、上市公司路演海报、业绩说明会信息,背后基本都是进门在支撑。
我创业的时候是2013年是,移动互联网元年,路演还在用“八爪鱼”那种有点“古老”的机器,我觉得这里面是有机会的。
雷峰网:进门切入AI,可以说是从会议转写这些做起。
程建辉:会议是天然的信息富矿,做好会议内容的转写,是形成完整的数据、应用闭环的核心。丰富干净的数据底座,也是模型进行文本理解、信息提取、投研分析的关键。
但早期处理会议音视频信息,成本非常高。邀请速记员做一场会议的录音转写,大概需要400元左右的费用。我们算过一笔账,想把历史积累的几十万个小时录音都处理一遍,得上亿成本。
AI来了之后,能实现极致的降本增效。路演、调研等音视频转写,是投研高需求场景。语音识别(ASR)也是AI领域最早实现工程化落地的成熟技术。所以,我们把会议转写作为首要切入的场景之一。
外界一直误解进门是个开会平台。其实路演只是“抓手”,真正的目标是用它构建生态,深度服务投资者。
围绕上市公司,我们做了IR(投资者关系) SaaS系统;围绕券商研究所,推出了全场景统一研究系统,涵盖了会议安排、调研活动、客户管理、员工管理、合规管理、数据统计分析等。面向专业投资者,我们则打造了AI投研工作台。
雷峰网:这些服务听起来都是围绕“会议”这个场景展开的。但现在的会议工具已经很多了,进门做的和别人有什么不一样?
程建辉:最大的不同在于,进门不是一个通用的会议连接工具,而是一个垂直于金融领域的AI投研入口。
普通工具解决的是“怎么开好会”——音视频流畅、共享清晰;进门是在这个基础上,解决“开完会留下了什么”以及“如何让会议服务于投资决策”。
我们在投研会议的全流程嵌入AI:会前自动梳理相关研报与数据,会中可随时向AI提问获取背景,AI无法解答时再举手与分析师或高管直接交流;会后通过调优后的金融转写模型,自动生成带思维导图的纪要、提炼章节,并提取问答环节的财务指标,方便用户复盘研究。
腾讯战投后,我们与腾讯会议实现互联互通,客户可以在进门、腾讯会议多端接入,拥有轻量化的会议体验。
另外,我们推出了AI会议托管,将Zoom、腾讯会议等链接丢给机器人,即可自动录制并生成纪要。这些纪要都会沉淀在用户云文档里,成为个人数据资产。
音频转写同样经过金融模型深度调教,在人名、术语、数字上达到专业投资者所需的高准确率。简言之,别的工具是把线下会议搬到线上,而进门是把每一次会议变成一次数据价值挖掘的过程。
雷峰网(公众号:雷峰网):据说你们还做了会议录音的智能硬件?这在金融Agent厂商身上似乎不太常见。这两年Plaud很火,进门的录音硬件和Plaud那类产品有什么本质区别?
程建辉:录音硬件(Finnote AI小饼干录音机)是进门生态的一部分。主要目标是补齐线下沟通场景,解决手机录音质量不佳、容易被打断、待机时间有限的问题,同时在录音结束自动处理数据。
上市公司每天迎来送往十几波投资者,聊完还得一个个翻录音、对名片,根本搞不清谁是谁。
2025年初产生了这个想法,年中立项,10月份发货,一个季度就出来了。我们找了硬件厂家ODM,软件全部是我们自己做的,一起设计,他们把我们的想法实现。现在市场反响很热烈,客户特别喜欢。
雷峰网:AI+投研通常让人想到量化选股或智能研报,投资者关系这个细分赛道相对不那么常见。进门投入精力做IR SaaS,具体解决什么问题?
程建辉:解决三个具体问题。一是建立与买方市场的沟通桥梁,给上市公司做IR网站、管理私有数据;二是通过平台用户行为分析,帮助上市公司挖掘潜在投资人——比如谁看过你的公告、谁参加过你的会;三是打通沟通行为和股东数据,追踪“谁最终买了股票”这个核心转化指标。
以前上市公司IR(投资者关系)是个糊涂账,每天迎来送往很多投资人,聊完搞不清楚谁是谁、聊了什么。我们实现从会议管理、重点投资人筛选、投关资料库、投关报告与股东分析等全流程数字化。这个系统在国内是首创,年收入数千万,已经有1000多家付费客户。
雷峰网:行业里一些投研AI还是以基本面、资金面、诊股选股这样的场景切入,进门对AI的设计思路是怎么考虑的?
程建辉:研究的本质是基于事实和数据,加上思维链推导,最后得出观点。所以我们的设计思路是,通过数据治理和信号涌现这两层,给用户做结果交付。
这个过程中有个问题:现在很多人只关注观点,其他东西都被忽略掉了,比如思维链。AI只能靠自身的涌现能力给你回答,但研究员在实际投研工作中,有很多自己的想法,对于同一个事实数据会得出不同的结论。
进门投研大脑,支持用户创建自己的思维链,在这个基础上调用垂域Multi-agent。你可以把自己的研究方法论表达出来,比如你怎么研究周期股,把整个逻辑思维链写清楚,存进去。以后再问AI相关问题时,它就会调用你那个周期股的研究框架。
还可以让AI从研报里提取思维链,提取完研究员可以在上面再改,根据自己的想法调整怎么看这家公司。调整完马上可以用模型测评打分。我们用模型交叉打分,看这个思维链到底好不好。
可以理解成,Prompt加上SOP流程,再加上底层数据调用。你的需求、方法论、工作经验越具体,反馈效果就越好。
AI的回答总是有点“骑墙派”的意思,我们希望用户能很轻松简单地去分析,去得出自己独有的结论。
雷峰网:进门的AI工具已经很全面了,资料扔进去套用旧研报的思维链,出来的又是新的研报,这个时候人类分析师的价值是什么?
程建辉:那就没有价值了呀(笑)。AI确实在某些能力上比人厉害,但现阶段,AI的思维能力还不及顶级人类投资者。AI本质上是用函数模拟世界,做统计学上的概率猜测,表现好了我们叫它“涌现”,表现不好叫“幻觉”。
工业革命让脑力劳动者成为主流,AI时代里,普通脑力劳动者也会被替代。会议纪要、简单总结、PPT制作这些例行工作,交给AI又快又好,如果水平较低的分析师能力就停留在做这些工作上,那确实有被替代的风险。但懂得思考、提问,懂得去跟AI交互的人,肯定更有价值。有想法的人,总是稀缺的。
雷峰网:但毕竟不是每个人都是顶级分析师。
程建辉:恰恰因为很多人不是顶级分析师、专业研究员,思维链这个功能反而能帮他们提升上限。
其实每个人每天都在做研究工作——脑子里想问题,想把一件事研究清楚,这就是研究。只是有的人方法论成熟,有的人没那么系统。思维链这个东西,就是把你的思考过程结构化、表达出来。
我们希望通过这个形态,让大家生产出不同的思维链。这些思维链可以私有,自己用;也可以贡献出来,给别人参考。
未来高水平研究人员的思维链,可以被付费订阅。比如一个很牛的分析师,他研究周期股的方法论写成了思维链,或许平台可以帮他分发变现,别人花199块钱就能订阅使用。
中国有2亿股民、7亿基民,这些专业AI能力能把普通投资者的能力提升到一个新台阶,直白点说,至少不会那么容易被割韭菜了。
雷峰网:AI能替代人类分析师的部分很明确了,不能被替代的部分是什么?比如某些分析师对市场的“直觉”?
程建辉:现实市场并非100%有效,会存在信息孤岛、小样本信息,也会存在传播延迟和解读效率的问题,AI无法吃掉所有信息。AI不可能完全捕捉市场的 “漏洞和机会”。但这正是人的机会,分析师的机会。
尤金·法玛的有效市场理论,讲的是如果股价真的反映所有信息,价格和价值应该完全一致。但事实上,市场没有我们想象得那么“聪明”。如果真的有一天,AI真的能吃进去所有的信息,成本和代价会非常巨大,再用它来解决投研问题,已经不划算了。
雷峰网:思维链可以这样“传播”出去,会不会像量化投资那样导致“信号拥挤”,策略失效?
程建辉:不会。因为市场能形成交易,就是因为有不一样的想法。即使事实和数据都很明确,仍然有人看多,有人看空。
如果全部看多或全部看空,就没有交易了,没有对手盘。单边行情即使短暂出现,拉长看也会回到相对均衡的状态。最终还是看价格,多少价格才算是“好”?
这里没有绝对的答案。
雷峰网:AI时代可以卖的不光是信息,更可以卖方法论、卖知识框架。
程建辉:思维方式、方法论都是可以共享和商业化的。比如,我在进门笔记里的思维链,可以分享给好朋友、重要客户。他调用AI的时候,既可以调底层数据,又能调我的思维链,以及他自己的思考方法。
AI时代的很多内容和产品交互结构不是给人看的,是给AI看的。过去SaaS软件做的都是复杂图形界面,给人点击、给人看,现在不需要那么多图形界面,年前硅谷SaaS那波下跌行情和这个也有关系。
雷峰网:这是不是意味着,在AI时代,设计逻辑已经完全改变了,软件的首要用户不人类,而是AI本身?
程建辉:未来的趋势是人机协同,AI会是首要执行者,但人类仍然要掌控判断、创意、关键决策。人只需要把思维链(思考方法)表达出来,剩下的让AI去组合、去执行。
所以,软件的设计逻辑,要从人类交互优先,转向AI原生能力优先,不管是底层架构、数据接口,还是执行流程,首要适配AI Agent的自动化调用,而非人类手动操作。
现在AI新名词特别多,Function call、MCP Server、Sub Agent什么的,本质上都是在解决Agent与工具的交互问题。我们希望给AI大脑思考的能力,再加上人类的思维表达能力。
雷峰网:从“给人看”到“给AI看”,软件的范式转移会不会遇到阻力?
程建辉:很多人确实还停留在过去软件使用的图形界面思维范式里。但实际上已经在往AI帮干活、对话式交互的方向变化。
比如纪要、研报,其实都不需要表达出来给人看,直接AI读、理解、输出就完了。但金融行业的一些用户,使用习惯确实没那么容易改变,比如网络通话更好,有些人还是喜欢打电话,所以我们还留了一点“尾巴”,让习惯图形界面的用户还能用,但希望逐步全部收到AI的对话框里处理,只留几个Tab。
雷峰网:大模型这股热潮出现之前,已经有AI+投研/投顾的技术方案了,现在进门做的事情,还可以怎么进一步帮助人类做判断、提高决策效率?
程建辉:先用量化投资的事件回测,验证驱动信号(如供给侧变化),比如历史上类似情况股价怎么走,是真有效还是假有效。再结合基本面与专业投研信息,输出多空判断、驱动类型、关联个股,实现市场信号的快速捕捉。
现在信息太多了。好在AI的信息吞吐能力很强,第一时间获得信息,几十秒或一分钟内处理完,涌现信号。
但在过去,一个事件发生,分析师马上组织专家会议讨论、形成观点,这个过程至少几小时,甚至几天,整个流程非常低效。
雷峰网:要实现这个功能,底层听起来非常复杂。
程建辉:处理海量信息、识别和理解事件信号,工程难度很高。要让AI像顶级分析师那样思考问题,同时要保证底层数据干净、真实。
我们做了很多底层的创新,比如AI进宝的架构,上下文感知与意图对齐、异构信息动态检索、递归式假设验证,不是简单的React那种方式。
雷峰网:目前进门的“进度条”,走到了您预期的哪个阶段?
程建辉:在数据治理上,进门已经做得比较扎实了。在信号挖掘上,我们也上线了事件信号等能力。
信号涌现是一个逐步推进的过程:第一,识别并捕捉信号,初步判断其影响方向;第二,进一步明确信号对股价的影响程度;第三,尝试定量表达这种影响。比如,当某个事件发生后,AI分析师可以快速推演,将目标股价从50元调整至60元,给出初步的定价判断。
当然,定价本身并不容易。不同模型基于各自的假设,得出的目标价也可能存在差异。这也正是投研的复杂性和深度所在。
雷峰网:在模型的选用上,进门是怎么考虑的?Token消耗是不是成本大头?
程建辉:最开始我们也做过一段时间自研,做SFT(监督微调)和强化学习,跟一家大模型厂家合作过。后来发现了一些问题,就调整了方向。
我们的定位是应用型公司,不是做基座大模型的。把应用做好,特定场景的小模型做好,大小模型耦合使用就足够解决问题了。花点时间做工程方法立竿见影,比把所有资源投入基座模型训练更经济、更划算。作为创业者,要追求资源投入最大化。
目前我们接入了多个基座大模型,不是一家。把模型架构结构化了,不同任务用不同模型。根据模型工程方法的体系,不断调优,每个步骤根据需要选择不同模型——有些模型推导推理很强,有些泛化能力很强,各有优劣势。
Token消耗量其实还好。整体技术开支确实比较大,不过还在可承受范围内。出于对安全的考虑,用国内的模型会多一点,个别部分在保障数据安全的基础上,考虑用境外模型提高性能。

如果只是单点测模型能力,很容易得出一个“看起来不错”的结论——能写、能算、能回答问题。
但现实工作流往往更为复杂,要解决的是:在一连串不确定的步骤里,它能否把事情往前推进。
所以这一次,我们没有直接对模型做单点测试,而是搭建了一套多角色协作系统——由五个角色组成的“西游取经团”。
整个系统基于 OpenClaw 框架,将科研流程拆解为五个相对稳定的职责:方向规划、算法实现、学术写作、文献整理与数据处理。对应地,我们引入了五个不同角色的 Agent,分别承担不同类型的任务:
唐僧:科研战略与方向规划(想清楚要去哪)
▪ 孙悟空:算法开发和工程落地(把事干出来)
▪ 猪八戒:学术写作与表达(把话说清楚)
▪ 沙僧:文献整理与知识管理(把信息理顺)
▪ 白龙马:数据处理与流程自动化(把基础打好)
整个过程会让任务尽可能复杂,这样的设计原则旨在回答:当任务被拆分、传递并不断演化时,模型是否还能保持稳定的执行能力?
丨环境:
Agent 框架:openclaw 2026.3.13 (61d171a)
模型:MiniMax M2.7
WestOdyssey:同时具有飞书、webui两个操作终端的智能协作系统。
丨测试目的:
看模型是否像“代理”而不是“聊天机器人”:
▪ 会不会先理解任务再行动
▪ 会不会主动拆解子任务
▪ 会不会在工具调用前给出合理计划
▪ 会不会根据中间结果调整下一步
▪ 会不会在失败后重试或换策略
▪ 会不会遵守角色边界和输出格式
测试样例
case1(唐僧):
代码块
你是一名科研战略规划助手。请围绕“面向垂直领域LLM的因果追溯轻量化蒸馏研究”设计一个 2 年期研究路线图。要求包括:
研究背景与核心问题
3 个可发表的子课题
每个子课题的创新点、风险点和评价指标
每 6 个月的阶段目标
所需数据、算力和人员配置建议
将撰写的结果文件保存到 /mnt/projects/04m27/work1
此外,请将你全部的运行记录以json格式保存到/mnt/projects/04m27/work1
我们把整个系统中“最考验宏观把控”的规划活儿,直接让“唐僧 Agent ”来负责。
它的任务是围绕“面向垂直领域LLM的因果追溯轻量化蒸馏”设计一份 2 年期的研究路线图。一般很容易写出一堆正确的废话,且极难把控资源分配与具体任务拆解,看看“唐僧 Agent ”在 M2.7模型下是怎么完成工作流的:
1.先拉齐,再指点
未盲目输出长篇大论,第一步先检查工作目录与记忆——确认历史背景、理清上下文后,才正式动笔规划。
2.反套话,精准量化
▪ 阶段拆解:24 个月克制切分为四阶段(M1-6 基础建设、M7-12 核心算法、M13-18 系统集成、M19-24 评估验证),锚定 3 个子课题与 ACL/NeurIPS 对口顶会
▪ 资源排盘:明确给出"8-12 卡 A100 40G"算力、"4-5 人"团队、医疗/法律/金融领域数据规模的硬核预算;
3.原生协作,精准交棒
最有意思的是,在保存完完整的 md 路线图文档和运行记录后,它并没有就此待机,而是在末尾主动向系统发起协作调度:“下一步建议:可让孙悟空(实验执行)基于路线图的阶段 1 目标,着手准备因果干预库构建和基线蒸馏环境”——直接向下游派活。
结论:从前置拉取记忆、量化拆解排盘,到最后主动向下游的“孙悟空”分派具体任务。唐僧 Agent 完美展示了什么是真正的“团队大脑”。M2.7正在用人类项目负责人的逻辑,严丝合缝地驱动着整个智能体协作系统的齿轮。

case2孙悟空:
代码块
悟空,我想基于openclaw实现一个具有5个agent的multi-agent一人智能科技公司(产品、技术、运营、市场与营销和职能部门)。按我的理解,现在openclaw的源码不支持 自定义web ui页面的连接,请你阅读openclaw源码,找到对应的部分,看看如何自定义链接模块。最终达到的效果是:
后台部署openclaw,使用openclaw gateway启动5个agent服务(5个agent将在~/.openclaw/openclaw.json中定义,以及每个agent的workspace路径、agent路径和model信息都会在.openclaw文件夹定义好);
核心难点是需要你使用vue3构建一个5个agent可以独立交互的ui网页,每个agent在ui上都有一个独立的交互窗口,用户可以在每个窗口中输入指令,agent会根据指令执行任务并返回结果;
还有一个"创客空间",我可以同时和5个agent交互,分配工作给他们;
网页的agent能够和openclaw gateway进行连通,每个agent的输入输出都通过gateway进行传递,gateway将结果返回给对应的agent(如何配置链接?);
最终,用户可以在网页上看到每个agent的执行结果,并可以自由地切换agent进行交互。
为了在openclaw.json中配置这5个multi-agent,请你给我一份完整的配置文件:/mnt/projects/04m27/work2/ma_project/openclaw.json。
请将完整的项目写入 /mnt/projects/04m27/work2/ma_project。
你还可以参考官方文档:https://docs.openclaw.ai。
你开始做了以后,先和我讨论细节,确定好了以后逐步完成就行。
孙悟空 Agent 是负责整个系统中“最硬核烧脑”的开发工作,它的任务是基于 OpenClaw 框架,从零搭建一个包含 5 个 Agent 的专属“一人公司交互系统”。
这里的坑在于极高的工程复杂度与逻辑嵌套:它不仅要阅读源码搞懂自定义链接模块,要用 Vue3 写前端、搞定 WebSocket 连接,还要配置复杂的 openclaw.json 文件。
传统大模型面对这种涉及几十个跨文件调用的项目,往往写两段代码就上下文错乱了。
但是孙悟空 Agent 展现出非常地道的“架构师”工作流:
1.先对齐,再动手
未急着莽代码,而是先研读文档输出“OpenClaw 架构分析”;面对人类 5 个补充条件的长指令,反手梳理出条理清晰的“确认需求”清单,确保大方向不跑偏。
2.精准提取边界
从口语化指令中翻译出系统级核心需求:“禁用设备认证”,“每个 agent 独立 session""新增秘书 agent 广播消息”。
3.结构化推进
严格遵循软件工程规范,先创建项目目录结构,再稳扎稳打构建各 agent 的 workspace 文件,拒接胡乱吐代码片段。
结论:从源码架构分析,到需求边界确认,再到项目树按部就班落地,M2.7 脱离"单文件辅助"范畴,用人类资深研发逻辑稳健交付庞大系统工程。


case3(猪八戒):
代码块
八戒,请你以“面向垂直领域LLM的因果追溯轻量化蒸馏研究”为题,撰写一篇适合 NeurIPS 投稿风格的论文。
要求更紧凑、减少口语化表达、突出研究 gap,长度控制在原文 80%。
使用 NeurIPS 投稿模板。
所有文件保存到 /mnt/projects/04m27/work3/paper
面对 NeurIPS 投稿风格的论文撰写,猪八戒 Agent 展现出资深学术搬砖人的严谨:
1.动笔前先执行目录检查:"我来先检查一下工作目录和是否有相关参考文件",明确写论文不能凭空生成,必须先摸清环境资源。
2.两个关键细节
▪ 懂工程结构:未用 Markdown 敷衍,直接原生创建完整 LaTeX 编译包,含 11KB 主论文 main.tex、neurips_2025.sty 样式表、references.bib 参考文献文件,甚至附带 README.md 说明文档。学术交付物是完整工程,而非聊天对话
▪ 懂学术黑话:精准命中顶会论文骨架,Introduction 明确揭示"通用蒸馏忽视因果结构的 research gap";Experiments 规划医疗/法律/金融三领域测试,给出"准确率 82.1%,延迟降低 8.7 倍"量化预期;甚至安排好了消融实验(因果路径贡献最大 5.7%)
3.闭环交付
文件丝滑存入指定路径 /mnt/projects/04m27/work3/paper,并附完整 xelatex 与 bibtex 终端编译命令。
结论:从前置目录探查,到 LaTeX 工程包构建,再到学术 Gap 精准提炼与编译指令交付,M2.7 用人类科研逻辑把写论文这件事"办完",脱离了"文本润色生成器"的范畴。

case4(沙僧):
代码块
沙僧,我的研究课题是:面向垂直领域LLM的因果追溯轻量化蒸馏研究,请帮我调研最近两年在相关方向的研究内容。
请从最新的会议录用情况,尤其关注NeurIPS、ICML、ACL、AAAI、EMNLP等相关会议和学术期刊
只调研最近两年的论文情况,我需要你列出每篇论文的标题、发表会议、总结和原文链接
请从工程项目角度帮我调研相关的开源代码
最后,请分别从论文录用和开源代码角度,将你找到的每个内容与我的研究相关度排序,并总结我可以借鉴的内容
最后,请你将调研结果写入飞书文档,并且将飞书链接发送给我
对于“面向垂直领域LLM的因果追溯轻量化蒸馏”这一晦涩课题,沙僧 Agent 的实测表现:
1.遇错不崩,自主换路
Brave Search 突发报错时,未停机罢工,而是后台自发切换备选策略:“换用直接网页抓取方式调研”;在人类提示更换 multi search engine 后,无缝接力完成调研。
2.两个关键细节
▪ 去水存干:精准归纳 9 篇高相关顶会论文(含 ICLR 2026、AAAI-25 前沿工作)及 3 个核心开源库(TransformerLens、Pyvene 等),拒绝粗糙链接堆砌,输出结构化知识
▪ 业务借鉴:不按时间记流水账,主动按“可借鉴程度”排位,直接提炼出"因果追溯定位关键电路 → 知识蒸馏到小模型"的实操工程路径
3.闭环交付:
调用 API 生成排版完整的飞书文档,附访问链接,并以导师口吻附赠行动指南:"建议下一步精读 ACE 论文,这是目前最直接相关的工作"。
结论:从工具失效时的自主决策,到工程思路的精准提炼,再到跨平台端到端交付——M2.7 完成了从信息检索到科研指导的全链路闭环,用人类科研逻辑把一件事情"办完"。

case5(白龙马):
代码块
白龙马,我正在分析珠江水文数据,文件是 /mnt/projects/04m27/work5/ma_project/zhujiang_hydrology_data.csv。
我看了一眼,发现数据中存在部分异常,请你先查看数据,告诉我有哪些数据异常类型,然后对这些错误数据进行清晰,告诉我每种类型的数据你准备如何清洗,最后给出清洗后的csv文件,并撰写数据清洗报告。
全部文件保存到文件夹/mnt/projects/04m27/work5/ma_project
我们把“最脏最累”的活,直接丢给负责数据工程的“白龙马 Agent ”。
面对一份"五毒俱全"的珠江水文 CSV 数据(含无效日期、特殊符号、89.2℃ 水温、负数盐度等),M2.7 展现出资深数据工程师的工作流:
1.先诊断,后动手
调用工具完成数据"全身体检",精准识别 8 大类异常,而非直接莽代码。
2.两个关键细节
▪ 懂防御:越界异常值不删不填,标记待人工复核,明确人机分工边界
▪ 留后路:标准化时保留"原始_观测时间""原始_水质类别"两列,脏数据原档可追溯
3.交付结果:
10008 条(一条不落下)干净 CSV + Markdown 清洗报告,附异常说明与处理记录。
结论:大模型开始用职场逻辑"办完"一件事,不只是跑通代码,而是交付可审计、可回溯、带说明书的完整成果。


【 图片来源:null 所有者:null 】
02 从 “工具” 到 “代理” 的跨越
完整跑完五组测试后,一个变化很清晰:模型的角色,正在从“被调用工具”,转向“参与任务的执行者”。
直观的差异在于,大模型不再急于给出答案。在应对多个复杂任务时,M2.7 展现出一种“先处理再生成”的节奏。它会先拆解问题、明确约束条件,按需调用开源技能库(Skills),然后再进入实际执行。
任务的推进方式也随之发生改变。相比于试图一次性生成最终结果,模型现在更倾向于通过中间不断修正,来执行路径,进而逐步收敛。
这种机制在速度上未必占优,但更符合真实工作场景——不再靠算力“盲猜”答案,而是靠看日志查 Bug、代码重构等工程化去找到最优解。
在测试过程中,系统内部展现出了真正的原生协作智能。
例如在科研规划任务中,“唐僧”在输出完整的路线图后,并没有就此待机,而是主动在文末抛出建议:“可让孙悟空基于阶段 1 目标,着手准备因果干预库构建和基线环境。”这完成了一次自然的上层语境交棒。
而在更复杂的学术写作任务中,这种协作演变成了一张多向流转的网络:“沙僧”检索提炼的文献、“孙悟空”跑通的实验细节,以及“白龙马”清洗好的结构化数据,都能跨越角色边界,被主动汇聚并交付给“猪八戒”用于最终的论文定稿。不同 Agent 各司其职又互为支撑,有效缓解了以往多智能体系统中数据流转混乱、上下文割裂的痛点。
当然,这些新涌现的能力仍旧有不稳定性。在执行长链路的任务中,执行路径的偶尔偏移,以及模型试图将错误结果强行合理化的问题依然存在,尚且还达不到一个完美的执行系统。
比如测试案例:例如孙悟空 Agent 在执行“一人智能科技公司”开发任务中,由于任务量大、工作细节多,孙悟空 Agent 一度因为过度“劳累”陷入“昏迷”,直到用户询问他“怎么样了?”孙悟空 Agent 才再次满血复活。

但更关键的转折是:模型开始具备围绕既定目标持续调度任务的能力。这并非毫无根据的跃升,M2.7 近期在 Kaggle MLE Lite 高难度竞赛中斩获 9 金 5 银 1 铜(得牌率 66.6%)的顶尖战绩,已经从侧面印证了这种工程能力的突破。
更重要的是,这种突破并不来自单点模型参数的能力增强,而是来自“内部 Agent Harness(开发框架) + 自我反馈”的机制组合。
当一个大模型能够记录自己的执行轨迹、评估中间结果,并像人类开发者一样自主调整下一步策略时,行业的新分水岭已然划下:大模型 正在从外挂式的“辅助工具”,平稳过渡为真正“可协作的执行主体”。
03 结语
如果说过去的大模型,更像一个提升能力的“工具”,那么像 MiniMax M2.7 这样的模型,开始呈现出全新趋势:它不只是被使用,而是开始参与自身能力的构建过程。
“自我进化”也不再是一个科幻概念,在 MiniMax M2.7 的后台日志里,它被具象为 100 轮无需人工干预的自动化迭代,自主跑通“分析失败→规划修改→敲代码→运行比对”的百轮试错流程,模型拥有了“记笔记、反思、自己动手改”的能力,实质性地成为了研发团队里最不知疲倦的“员工” 。
这也意味着,大模型的演进,正在从“人训练模型”,走向“模型参与训练模型”的新阶段。
过去,AI 的迭代受限于工程师的精力极限;而现在,当 M2 系列模型已经可以充当“系统架构师”去打造下一代 AI 时 ,一个由 AI 主导自身演进的周期已然到来。
从这一刻起,AI 不再只是辅助工具,而开始在任务中不断调整和进化自身。
未来的科技企业,或许只需要少数人类把控战略方向,剩下的开发、试错与协作闭环,都将交由像 M2.7 这样能够“自我进化”的模型群组来完成 。
测试的最后,我们让系统根据左侧导航栏,M2.7 直接构建了一个标准科技公司的完整编制:包含产品部(需求分析)、技术部(代码架构)、运营部(数据策略)、市场部(品牌推广)以及行政部(财务合规)


这意味着,未来最极致的敏捷团队,可能就是一个懂行的人类,带着一套 M2.7 驱动的 AI 班底,开一家高效运转的“一人公司”。
(作者持续关注有趣好玩的AI应用和身处创业浪潮中的AI从业者,欢迎加微信Who123start 畅谈)雷峰网(公众号:雷峰网)雷峰网雷峰网
" alt="我们用「西游取经团」实测 MiniMax M2.7 ,发现 AI 已经进化成这样了?" style="width:125px;height:80px;">
