宣抚使
02-02
这篇文章不错,转发给大家看看
@港美银杏君:
MiniMax Agent 开年更新,好的 AI 产品,需要让工具来适应人了
免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。
分享至
微信
复制链接
精彩评论
我们需要你的真知灼见来填补这片空白
打开APP,发表看法
APP内打开
发表看法
1
{"i18n":{"language":"zh_CN"},"detailType":1,"isChannel":false,"data":{"magic":2,"id":528227346411600,"tweetId":"528227346411600","gmtCreate":1769982721424,"gmtModify":1769982723809,"author":{"id":3573195001214954,"idStr":"3573195001214954","authorId":3573195001214954,"authorIdStr":"3573195001214954","name":"宣抚使","avatar":"https://static.tigerbbs.com/667f0b559768dc5e97dd6669771bb3ef","vip":1,"userType":1,"introduction":"","boolIsFan":false,"boolIsHead":false,"crmLevel":2,"crmLevelSwitch":0,"individualDisplayBadges":[],"fanSize":10,"starInvestorFlag":false},"themes":[],"images":[],"coverImages":[],"title":"","html":"<html><head></head><body>这篇文章不错,转发给大家看看</body></html>","htmlText":"<html><head></head><body>这篇文章不错,转发给大家看看</body></html>","text":"这篇文章不错,转发给大家看看","highlighted":1,"essential":1,"paper":1,"likeSize":1,"commentSize":0,"repostSize":0,"favoriteSize":0,"link":"https://laohu8.com/post/528227346411600","repostId":526045516849320,"repostType":1,"repost":{"magic":2,"id":526045516849320,"tweetId":"526045516849320","gmtCreate":1769481367416,"gmtModify":1769481592487,"author":{"id":4142472227465700,"idStr":"4142472227465700","authorId":4142472227465700,"authorIdStr":"4142472227465700","name":"港美银杏君","avatar":"https://static.tigerbbs.com/52096ab7f332449902378dac8549d991","vip":2,"userType":2,"introduction":"专注港美股财经领域分析报道,港股ipo打新","boolIsFan":false,"boolIsHead":false,"crmLevel":1,"crmLevelSwitch":0,"individualDisplayBadges":[],"fanSize":258,"starInvestorFlag":false},"themes":[],"images":[{"img":"https://static.tigerbbs.com/6ec7c2366f4b4910ab76c96ebfa8470e","width":"1080","height":"678"},{"img":"https://static.tigerbbs.com/9cf3650afd7dca5838af2436f2c45ac9","width":"1080","height":"912"},{"img":"https://static.tigerbbs.com/cf49ba03f1d39d8b1d15627197979729","width":"1080","height":"701"},{"img":"https://static.tigerbbs.com/6c6afb668433f2ea8f9944e88063cb4a","width":"1080","height":"978"},{"img":"https://static.tigerbbs.com/c5ff06e5f8927bdd5925245d81452870","width":"1080","height":"815"},{"img":"https://static.tigerbbs.com/b50c08b76dd6b135fabc341386834cad","width":"1080","height":"609"},{"img":"https://static.tigerbbs.com/2096b795b8770992e3f671fcae1d4091","width":"1080","height":"535"},{"img":"https://static.tigerbbs.com/5ac1cf2580fd1a4403c0fc349ee7977f","width":"1080","height":"568"},{"img":"https://static.tigerbbs.com/1e4f6cbeb852abb136bb561cd9493bc8","width":"1080","height":"877"},{"img":"https://static.tigerbbs.com/e1756436c26fa364b525e662e92cde61","width":"1080","height":"698"},{"img":"https://static.tigerbbs.com/e01f6d125b59d7719d3873645c1c8a0e","width":"1080","height":"1015"},{"img":"https://static.tigerbbs.com/41ecf32c655b1a9d47c0a4f97a24e7ff","width":"1080","height":"542"},{"img":"https://static.tigerbbs.com/01dc61e995ba2f2197b2da679a08f784","width":"826","height":"617"}],"coverImages":[{"img":"https://static.tigerbbs.com/6ec7c2366f4b4910ab76c96ebfa8470e","width":"1080","height":"678"},{"img":"https://static.tigerbbs.com/9cf3650afd7dca5838af2436f2c45ac9","width":"1080","height":"912"},{"img":"https://static.tigerbbs.com/cf49ba03f1d39d8b1d15627197979729","width":"1080","height":"701"}],"title":"MiniMax Agent 开年更新,好的 AI 产品,需要让工具来适应人了","html":"<html><head></head><body><p>2026 年第一个月在科技圈刷屏的话题,是 Claude Cowork。</p>\n<p style=\"text-align: justify;\">这是一个跑在本地的 AI Agent,一个面向大众版的 Claude Code,能帮你点鼠标、帮你整理文件、帮你完成各种操作。</p>\n<p style=\"text-align: justify;\">紧接着,开源社区迅速跟进,各种「开源 Cowork」或「Local First」产品接踵而至,或许是感受到了外部的竞争压力,Anthropic 随后将 100 美元 Max 套餐独享的 Cowork 功能下调至 20 美元的 Pro 档。</p>\n<p style=\"text-align: justify;\">MiniMax 也在这个节点升级了旗下的 MiniMax Agent,推出了桌面端,提供本地文件处理功能、Browser Use 功能等等,用户只需要一句话,即可快速完成基于本地的任务。同时网页端新增专家(Expert)功能,可以将常用配置保存为可复用模板——指令、模型偏好、Agent 行为,一次配置,反复使用。</p>\n<p style=\"text-align: justify;\">「桌面 Agent」突然火了起来,行业内已经似乎突然形成了某种清晰的共识。</p>\n<p style=\"text-align: justify;\">当 AI 不再只存在于网页对话框和云端环境里,而是进入你的真实工作环境,这件事究竟改变了什么?</p>\n<p style=\"text-align: justify;\"><strong>答案很简单:上下文扩容。</strong></p>\n<p style=\"text-align: justify;\">以前跟 AI 聊天,它的视野只有对话框里的几行字,以及你上传的附件。但现在不同了,你的硬盘、你的浏览器、你的文件目录、你的屏幕画面,都成了它的视野范围。</p>\n<p style=\"text-align: justify;\">与此同时,AI 开始从「咨询顾问」转向「执行者」。它不再只是给建议、提方案,而是可以真正动手:遍历文件夹、调用本地资源、拆解任务并把流程跑完。</p>\n<p style=\"text-align: justify;\">也正是在这个意义上,我们开始认真看待 MiniMax Agent Desktop。或许,桌面 Agent 的批量出现和流行,代表着 Agent 正在从概念,面向更大众的群体,进入可以被日常使用、被实际交付的阶段。</p>\n<p style=\"text-align: justify;\"><strong>01 从今天起,不用再为整理文件困扰了</strong></p>\n<p style=\"text-align: justify;\">先从一件普通的小事开始使用 MiniMax Agent Desktop——整理文件夹,发票和整理桌面有些简单,我们换一种方式。</p>\n<p style=\"text-align: justify;\">我有一个堆了很多年的电子书文件夹,里面躺着 400 多本电子书。所谓「买书如病倒,读书如抽丝」,松鼠症患者都是这样。文件名五花八门,有的是 ISBN,有的是作者名加书名,有的干脆是不明意义的编号「127766.The.epub」。</p>\n<p style=\"text-align: justify;\">我给 MiniMax Agent Desktop 的任务很简单:</p>\n<p style=\"text-align: justify;\">按主题整理这个文件夹,规范书名;</p>\n<p style=\"text-align: justify;\">不确定的地方可以自行检索;</p>\n<p style=\"text-align: justify;\">最后给我一份 Excel 表格。</p>\n<p style=\"text-align: justify;\">Agent 没有立刻动手,而是先请求了访问权限。需要我明确选中目标文件夹,并确认它可以读取和修改内容。</p>\n<p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/6ec7c2366f4b4910ab76c96ebfa8470e\" tg-width=\"1080\" tg-height=\"678\"></p>\n<p style=\"text-align: justify;\">Minimax 请求编辑权限</p>\n<p style=\"text-align: justify;\">这一步很重要,它明确了责任边界,让我心里踏实了很多。</p>\n<p style=\"text-align: justify;\">确认之后,它也没有马上改文件名,而是先给我了一份整理规划:会有哪些分类,如何判断主题,模糊情况怎么处理。</p>\n<p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/9cf3650afd7dca5838af2436f2c45ac9\" tg-width=\"1080\" tg-height=\"912\"></p>\n<p style=\"text-align: justify;\">MiniMax 规划整理计划</p>\n<p style=\"text-align: justify;\">接下来,它才进入执行阶段。左边是对话窗口,右边是命令行操作。明确的书直接处理;无法从文件名判断内容的书,它会上网检索,然后再归类。</p>\n<p style=\"text-align: justify;\">比如看到「传奇中的大唐」这个文件名,它会去豆瓣查证,确认这是刘勃的历史随笔集,归入「中国历史」。</p>\n<p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/cf49ba03f1d39d8b1d15627197979729\" tg-width=\"1080\" tg-height=\"701\"></p>\n<p style=\"text-align: justify;\">MiniMax Agent Desktop 的工作窗口: 左边是对话窗口,右边是命令行操作界面</p>\n<p style=\"text-align: justify;\">最终结果是两个东西:一个被重新命名、分好类的文件夹;以及一份 Excel 表格,列清楚了文件路径、规范化书名和主题。</p>\n<p style=\"text-align: justify;\">老实说,当看着文件夹里的文件名在瞬间自动刷新、归位,这种视觉冲击力远比生成一段文字要来得猛烈。<strong>那个飘在云端的 AI,第一次真正把手伸进了我的硬盘,完成了对现实世界的干涉。</strong></p>\n<p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/6c6afb668433f2ea8f9944e88063cb4a\" tg-width=\"1080\" tg-height=\"978\"></p>\n<p style=\"text-align: justify;\">整理前(左)vs 整理后(右)</p>\n<p style=\"text-align: justify;\">值得一提的是,MiniMax 还找出了重复下载的书籍。</p>\n<p style=\"text-align: justify;\">我追问了一句:你是怎么判断重复的?</p>\n<p style=\"text-align: justify;\">它的回答是:目前主要基于标题相似度。需要的话我也可以用哈希值再校验一遍。</p>\n<p style=\"text-align: justify;\">我当时的感觉仿佛是在玩一个开放世界的游戏——解决问题的路径不止一种,你可以反复尝试、扩展能力的边界,甚至解锁隐藏内容。</p>\n<p style=\"text-align: justify;\"><strong>02 可复用的 SOP,让 70 分的通才变成 95 分的专家</strong></p>\n<p style=\"text-align: justify;\">网页端增加的专家功能值得单独介绍下,简单来说,它可以把一个人的方法论封装成一个可以反复调用的执行体,在我的理解中,这其实算是 Claude Skill 的普适版,门槛更低,更好操作,但能力没有打折。</p>\n<p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/c5ff06e5f8927bdd5925245d81452870\" tg-width=\"1080\" tg-height=\"815\"></p>\n<p style=\"text-align: justify;\">MiniMax 封装了一些专家 Agent,同时用户也可以自己创建专家并发布到社区</p>\n<p style=\"text-align: justify;\">这个特性触及到了一个非常有价值的问题:经验到底能不能被复用?</p>\n<p style=\"text-align: justify;\">我选择了一个极具挑战性的任务:翻译加西亚·马尔克斯的《百年孤独》开篇。</p>\n<p style=\"text-align: justify;\">之所以选《百年孤独》,是因为这段文字集合了时态穿越、魔幻现实主义的基调以及复杂的长句结构。范晔的译本已经是许多人的心中标准,许多人也许没看过原著,但是仍然可以轻松背诵那句著名的开头:</p>\n<blockquote></blockquote>\n<p>多年以后,面对行刑队,奥雷里亚诺·布恩迪亚上校将会回想起父亲带他去见识冰块的那个遥远的下午。</p>\n<p style=\"text-align: justify;\">我先用常规的 Prompt 词调试了一个「翻译助手」,并将范晔的译本作为对照组,试图看看 MiniMax 能达到什么水准。</p>\n<p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/b50c08b76dd6b135fabc341386834cad\" tg-width=\"1080\" tg-height=\"609\"></p>\n<p style=\"text-align: justify;\">用户可以通过自然语言对话创建专家,也能把行业经验和 SOP 整合进去</p>\n<p style=\"text-align: justify;\">MiniMax 的直出译文在准确性上几乎无可挑剔。它完美解析了原文中关于磁铁吸铁锅、钉子挣扎的复杂逻辑链条,没有出现任何事实性错误。</p>\n<p style=\"text-align: justify;\">这大概是一个 75-80 分的水平,优于裸跑、没优化过的通用大模型 70 分的水准。剩下的那 20 分差距,体现在那些微妙的「颗粒度」上。</p>\n<p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/2096b795b8770992e3f671fcae1d4091\" tg-width=\"1080\" tg-height=\"535\"></p>\n<p style=\"text-align: justify;\">MiniMax 的翻译风格偏向直译、准确,但没有文学性</p>\n<p style=\"text-align: justify;\">例如,形容磁铁的神奇力量时,范晔用了「魔铁」二字,古朴且带有炼金术的神秘感;而 MiniMax 译作「魔法铁块」,虽然意思对了,但少了一分文学的张力。</p>\n<p style=\"text-align: justify;\">在描写吉普赛人带来的新发明时,范晔用了「」来指代家畜,贴合农村的语境;MiniMax 则选用了「」,虽然词义相通,但在中文语境下,这个词通常带有骂人的感情色彩,稍显偏差。</p>\n<p style=\"text-align: justify;\">这可能就是单纯靠 Prompt 调优的极限。我们确实能通过 Prompt 快速让 AI 做到逻辑正确、语句通顺。但想再往上走,达到 90-95 分的专家水准,光靠几句提示词是做不到的,因为它缺乏特定的「隐性知识」。</p>\n<p style=\"text-align: justify;\">于是,我重新配置了 Expert Agent,写入了一套详细的 SOP:</p>\n<p style=\"text-align: justify;\">定义人设:你不是翻译机器,你是一位深谙拉美文学的中文小说家。</p>\n<p style=\"text-align: justify;\">建立约束:禁止使用现代口语,优先使用古朴词汇</p>\n<p style=\"text-align: justify;\">注入知识库:我上传了一份「魔幻现实主义词汇表」和「马尔克斯句式风格指南」</p>\n<p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/5ac1cf2580fd1a4403c0fc349ee7977f\" tg-width=\"1080\" tg-height=\"568\"></p>\n<p style=\"text-align: justify;\">注入 SOP 之后,翻译结果呈现出了一种古朴的风格化特征,明显要比上一版本更好读,但有时会用力过猛。</p>\n<p style=\"text-align: justify;\">这一次,MiniMax 呈现出了一种文学特质,要比上一版本好读得多。例如范晔的这一句:</p>\n<p>湍急的河水清澈见底,河床里石洁白光滑宛如史前巨蛋。</p>\n<p style=\"text-align: justify;\">MiniMax 处理成了:</p>\n<p>河床上铺着光滑雪白的巨石,大如史前之。</p>\n<p style=\"text-align: justify;\">「大如史前之」明显好于上一版本「鹅石」;但「光滑雪白」不如范晔的「洁白光滑」读起来顺口。</p>\n<p style=\"text-align: justify;\">但它有时会显得用力过猛,把吉卜赛人和马孔多描绘得有点像中国古代传奇小说(比如「方生方始」、「提及之际须以手指勾勒」),稍微偏离了拉丁美洲的魔幻现实主义基调。</p>\n<p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/1e4f6cbeb852abb136bb561cd9493bc8\" tg-width=\"1080\" tg-height=\"877\"></p>\n<p style=\"text-align: justify;\">MiniMax 甚至整理了翻译札记</p>\n<p style=\"text-align: justify;\">坦白说,即便加了 SOP,AI 依然无法彻底超越范晔的版本。范晔译本中那种「史前巨蛋」的精妙比喻、「魔铁」的炼金术色彩,依然是人类灵性的高地。</p>\n<p style=\"text-align: justify;\">但令我感到震撼的是,仅仅在我注入那套 SOP 之后,MiniMax 就达成了肉眼可见的进步。<strong>这才是 Expert Agents 真正性感的地方:它让「经验」变成了一种可复用的能力。</strong></p>\n<p style=\"text-align: justify;\">同理,如果你是一位资深行业专家,你可以将自己多年的<strong>关键词挖掘逻辑、竞品分析框架、SOP </strong>上传到知识库。当你把这个 Agent 分享给 AI 实习生时,他就不再是面对一个只会说车轱辘话的通用 AI,而是在使用你的「数字分身」。这种能力的释放,意味着我们只需要做一次「封包」动作,就能让 AI 站在我们的肩膀上工作。</p>\n<p style=\"text-align: justify;\"><strong>03 Agent 的世界难题:「最后一公里」</strong></p>\n<p style=\"text-align: justify;\">第三个实验,我刻意选了一个更容易失败的方向——我想验证,「一人公司」到底是不是一句空话。</p>\n<p style=\"text-align: justify;\">于是我设计了一条内容流水线:</p>\n<p style=\"text-align: justify;\">先调研小红书科技类目的对标账号,分析他们的内容策略、爆款特征;</p>\n<p style=\"text-align: justify;\">然后基于调研结果,批量生成选题和内容;</p>\n<p style=\"text-align: justify;\">最后发布到平台上。</p>\n<p style=\"text-align: justify;\">第一个任务「深度调研」,MiniMax 调用 Web 搜索工具,检索最近一周的科技要闻、小红书科技博主的对标账号信息。搜索完成后,它自动提取关键信息,生成了一份详细的分析报告,包含账号定位、粉丝量级、内容类型、爆款特点等维度。</p>\n<p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/e1756436c26fa364b525e662e92cde61\" tg-width=\"1080\" tg-height=\"698\"></p>\n<p style=\"text-align: justify;\">MiniMax 生成的深度报告及图表信息</p>\n<p style=\"text-align: justify;\">第二个任务「生成内容」。基于调研结果,MiniMax 批量生成了多篇科技类选题,包括封面图、文案、标签建议。</p>\n<p style=\"text-align: justify;\">到目前为止,一切都非常丝滑,AI 展现出了惊人的生产力闭环。</p>\n<p style=\"text-align: justify;\">说实话,看着它自动打开浏览器,熟练地找到发布入口,试图填入标题和正文,这种从「调研」到「执行」全链路跑通的观感,简直像是在看科幻片。这是我第一次真正意义上目睹 AI 试图独自走完业务的全流程。</p>\n<p style=\"text-align: justify;\">但是,当 AI 真正介入到复杂的人类世界时,就会发现到处存在卡点。登录账号、图片上传、页面校验,这些对人来说是肌肉记忆的动作,对 Agent 却是「高摩擦操作」。GUI 本身就是为人类设计的,让 AI 在这种界面里高效操作,本身就违反了 AI 的「天性」;再加上平台严格的风控政策(比如验证码、设备检测),难度就更大了。</p>\n<p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/e01f6d125b59d7719d3873645c1c8a0e\" tg-width=\"1080\" tg-height=\"1015\"></p>\n<p style=\"text-align: justify;\">MiniMax 生成的小红书帖子,包含小红书标志性的 Emoji 文风,Tag以及增加互动率的引导</p>\n<p style=\"text-align: justify;\">整个过程中,MiniMax 提示我需要人工介入的有两个环节,一是登录小红书账号,二是上传 MiniMax 生成的封面图片。</p>\n<p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/41ecf32c655b1a9d47c0a4f97a24e7ff\" tg-width=\"1080\" tg-height=\"542\"></p>\n<p style=\"text-align: justify;\">Minimax操作小红书后台</p>\n<p style=\"text-align: justify;\">当然,这不妨碍它完成前面 90% 的工作。调研、生成、素材准备,这些原本需要花费数小时甚至数天的任务,它在几分钟内就完成了。</p>\n<p style=\"text-align: justify;\">最后那一步的人工介入,与其说是 Agent 的不足,不如说是一个合理的边界划定:涉及账号安全、平台规则的操作,还是需要人类的最终确认。</p>\n<p style=\"text-align: justify;\">这可能才是人类和 AI 协作的最理想画面:<strong>不要期待 Agent 替你完成一切,而是要理解它的能力边界</strong>,然后调整自己的工作流程。让 AI 擅长的事情,让人做人擅长的事情——这可能是一种更健康、更高效的协作模式。</p>\n<p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/01dc61e995ba2f2197b2da679a08f784\" tg-width=\"826\" tg-height=\"617\"></p>\n<p style=\"text-align: justify;\">在 MiniMax 操作小红书后台的过程中,用户可以随时暂停、人工介入。</p>\n<p style=\"text-align: justify;\"><strong>04 一切都关乎「上下文」</strong></p>\n<p style=\"text-align: justify;\">跳出具体的功能评测,MiniMax Agent Desktop 的出现,其实引发了我对「<strong>资产</strong>」两个字的重新思考。</p>\n<p style=\"text-align: justify;\">很多公司的核心资产是「经验」和「SOP」。但传统的 SOP 是写在文档里的死文字,新员工看了也不一定懂,懂了也不一定照做。</p>\n<p style=\"text-align: justify;\"><strong>MiniMax 的 Expert Agents 提供了一种新的可能:你可以把个人和团队的方法论「封装」成可执行的程序。</strong>比如你的团队有一套成熟的内容生产流程——调研、选题、写作、排版、发布——你可以把这套流程固化下来,让 Agent 按照同样的标准执行。</p>\n<p style=\"text-align: justify;\">这样一来,SOP 不再是纸上的条文,而是可交接、可复用、可执行的数字资产。新人不需要从零开始学习,直接调用专家的「方法论」,就能交付质量稳定的成果。</p>\n<p style=\"text-align: justify;\">然后是<strong>心态转变</strong>。</p>\n<p style=\"text-align: justify;\">以前我们用 AI 的感觉像开脑暴会。你说「帮我写个文案」,它给你十个版本;你说「哪个更好」,它分析一通。整个过程是探索性的、发散式的,AI 是你的思考伙伴。</p>\n<p style=\"text-align: justify;\">但用 Agent 的感觉完全不同,像带新人。你想清楚了要干什么,然后给它下达任务,用「验收标准」去沟通。它去执行,你来验收。有问题就调整,没问题就通过。</p>\n<p style=\"text-align: justify;\">这种转变意味着,你需要把自己的思维方式从「提问」转向「管理」。不是问 AI「你觉得怎么办」,而是告诉 AI「我要什么结果,你帮我办」。</p>\n<p style=\"text-align: justify;\">最后是<strong>边界重构</strong>。</p>\n<p style=\"text-align: justify;\">正如开头所说,桌面 Agent 改变的是「上下文」。但这个词背后隐藏着一个更本质的变化:<strong>过去是人去适应工具,现在是 Agent 主动进入人的环境。</strong></p>\n<p style=\"text-align: justify;\">过去三十年,我们一直在适应软件。鼠标该怎么点、菜单在哪里、快捷键是什么——这些都是人要去学习、去记忆、去适应的。但 Agent 不一样。它不需要你学习它的操作逻辑,而是它来理解你的工作环境、适应你的使用习惯。</p>\n<p style=\"text-align: justify;\">这可能才是 MiniMax Agent Desktop 真正的意义:<strong>连接「本地资产」与「云端智能」的桥梁</strong>。你的知识、你的文件、你的工作成果都在本地;云端的 AI 能力通过 Agent 进入你的环境,为你所用。</p>\n<p style=\"text-align: justify;\">有了更多的上下文,Agent 的能力真的可以不一样。</p>\n<p style=\"text-align: justify;\"><strong>05 总结</strong></p>\n<p style=\"text-align: justify;\">三年前,我们还在为 AI 能写出一首打油诗而惊叹;今天,我们已经开始讨论如何让它接管我们的工作流。</p>\n<p style=\"text-align: justify;\">Claude Cowork 的推出、MiniMax Agent Desktop 的这次更新,相比 Cloude Code 等 cli 工具,不只是 GUI 界面的更新,更像是一次对未来工作形态的预演。</p>\n<p style=\"text-align: justify;\">它并不完美,在 GUI 操作上还有进化的空间,但指明了方向——AI 不应止步于聊天框,它必须深入到我们的硬盘、我们的浏览器、我们的具体业务场景中去。</p>\n<p style=\"text-align: justify;\">这可能才是 2026 年真正改变的东西:<strong>不是人去适应分散的工具,而是 Agent 主动进入人的环境</strong>。</p>\n<p style=\"text-align: justify;\">也是 Agent 产品真正走向更大众市场的开始。</p>\n<p><a href=\"https://laohu8.com/S/00100\">$MINIMAX-WP(00100)$</a></p></body></html>","htmlText":"<html><head></head><body><p>2026 年第一个月在科技圈刷屏的话题,是 Claude Cowork。</p>\n<p style=\"text-align: justify;\">这是一个跑在本地的 AI Agent,一个面向大众版的 Claude Code,能帮你点鼠标、帮你整理文件、帮你完成各种操作。</p>\n<p style=\"text-align: justify;\">紧接着,开源社区迅速跟进,各种「开源 Cowork」或「Local First」产品接踵而至,或许是感受到了外部的竞争压力,Anthropic 随后将 100 美元 Max 套餐独享的 Cowork 功能下调至 20 美元的 Pro 档。</p>\n<p style=\"text-align: justify;\">MiniMax 也在这个节点升级了旗下的 MiniMax Agent,推出了桌面端,提供本地文件处理功能、Browser Use 功能等等,用户只需要一句话,即可快速完成基于本地的任务。同时网页端新增专家(Expert)功能,可以将常用配置保存为可复用模板——指令、模型偏好、Agent 行为,一次配置,反复使用。</p>\n<p style=\"text-align: justify;\">「桌面 Agent」突然火了起来,行业内已经似乎突然形成了某种清晰的共识。</p>\n<p style=\"text-align: justify;\">当 AI 不再只存在于网页对话框和云端环境里,而是进入你的真实工作环境,这件事究竟改变了什么?</p>\n<p style=\"text-align: justify;\"><strong>答案很简单:上下文扩容。</strong></p>\n<p style=\"text-align: justify;\">以前跟 AI 聊天,它的视野只有对话框里的几行字,以及你上传的附件。但现在不同了,你的硬盘、你的浏览器、你的文件目录、你的屏幕画面,都成了它的视野范围。</p>\n<p style=\"text-align: justify;\">与此同时,AI 开始从「咨询顾问」转向「执行者」。它不再只是给建议、提方案,而是可以真正动手:遍历文件夹、调用本地资源、拆解任务并把流程跑完。</p>\n<p style=\"text-align: justify;\">也正是在这个意义上,我们开始认真看待 MiniMax Agent Desktop。或许,桌面 Agent 的批量出现和流行,代表着 Agent 正在从概念,面向更大众的群体,进入可以被日常使用、被实际交付的阶段。</p>\n<p style=\"text-align: justify;\"><strong>01 从今天起,不用再为整理文件困扰了</strong></p>\n<p style=\"text-align: justify;\">先从一件普通的小事开始使用 MiniMax Agent Desktop——整理文件夹,发票和整理桌面有些简单,我们换一种方式。</p>\n<p style=\"text-align: justify;\">我有一个堆了很多年的电子书文件夹,里面躺着 400 多本电子书。所谓「买书如病倒,读书如抽丝」,松鼠症患者都是这样。文件名五花八门,有的是 ISBN,有的是作者名加书名,有的干脆是不明意义的编号「127766.The.epub」。</p>\n<p style=\"text-align: justify;\">我给 MiniMax Agent Desktop 的任务很简单:</p>\n<p style=\"text-align: justify;\">按主题整理这个文件夹,规范书名;</p>\n<p style=\"text-align: justify;\">不确定的地方可以自行检索;</p>\n<p style=\"text-align: justify;\">最后给我一份 Excel 表格。</p>\n<p style=\"text-align: justify;\">Agent 没有立刻动手,而是先请求了访问权限。需要我明确选中目标文件夹,并确认它可以读取和修改内容。</p>\n<p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/6ec7c2366f4b4910ab76c96ebfa8470e\" tg-width=\"1080\" tg-height=\"678\"></p>\n<p style=\"text-align: justify;\">Minimax 请求编辑权限</p>\n<p style=\"text-align: justify;\">这一步很重要,它明确了责任边界,让我心里踏实了很多。</p>\n<p style=\"text-align: justify;\">确认之后,它也没有马上改文件名,而是先给我了一份整理规划:会有哪些分类,如何判断主题,模糊情况怎么处理。</p>\n<p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/9cf3650afd7dca5838af2436f2c45ac9\" tg-width=\"1080\" tg-height=\"912\"></p>\n<p style=\"text-align: justify;\">MiniMax 规划整理计划</p>\n<p style=\"text-align: justify;\">接下来,它才进入执行阶段。左边是对话窗口,右边是命令行操作。明确的书直接处理;无法从文件名判断内容的书,它会上网检索,然后再归类。</p>\n<p style=\"text-align: justify;\">比如看到「传奇中的大唐」这个文件名,它会去豆瓣查证,确认这是刘勃的历史随笔集,归入「中国历史」。</p>\n<p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/cf49ba03f1d39d8b1d15627197979729\" tg-width=\"1080\" tg-height=\"701\"></p>\n<p style=\"text-align: justify;\">MiniMax Agent Desktop 的工作窗口: 左边是对话窗口,右边是命令行操作界面</p>\n<p style=\"text-align: justify;\">最终结果是两个东西:一个被重新命名、分好类的文件夹;以及一份 Excel 表格,列清楚了文件路径、规范化书名和主题。</p>\n<p style=\"text-align: justify;\">老实说,当看着文件夹里的文件名在瞬间自动刷新、归位,这种视觉冲击力远比生成一段文字要来得猛烈。<strong>那个飘在云端的 AI,第一次真正把手伸进了我的硬盘,完成了对现实世界的干涉。</strong></p>\n<p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/6c6afb668433f2ea8f9944e88063cb4a\" tg-width=\"1080\" tg-height=\"978\"></p>\n<p style=\"text-align: justify;\">整理前(左)vs 整理后(右)</p>\n<p style=\"text-align: justify;\">值得一提的是,MiniMax 还找出了重复下载的书籍。</p>\n<p style=\"text-align: justify;\">我追问了一句:你是怎么判断重复的?</p>\n<p style=\"text-align: justify;\">它的回答是:目前主要基于标题相似度。需要的话我也可以用哈希值再校验一遍。</p>\n<p style=\"text-align: justify;\">我当时的感觉仿佛是在玩一个开放世界的游戏——解决问题的路径不止一种,你可以反复尝试、扩展能力的边界,甚至解锁隐藏内容。</p>\n<p style=\"text-align: justify;\"><strong>02 可复用的 SOP,让 70 分的通才变成 95 分的专家</strong></p>\n<p style=\"text-align: justify;\">网页端增加的专家功能值得单独介绍下,简单来说,它可以把一个人的方法论封装成一个可以反复调用的执行体,在我的理解中,这其实算是 Claude Skill 的普适版,门槛更低,更好操作,但能力没有打折。</p>\n<p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/c5ff06e5f8927bdd5925245d81452870\" tg-width=\"1080\" tg-height=\"815\"></p>\n<p style=\"text-align: justify;\">MiniMax 封装了一些专家 Agent,同时用户也可以自己创建专家并发布到社区</p>\n<p style=\"text-align: justify;\">这个特性触及到了一个非常有价值的问题:经验到底能不能被复用?</p>\n<p style=\"text-align: justify;\">我选择了一个极具挑战性的任务:翻译加西亚·马尔克斯的《百年孤独》开篇。</p>\n<p style=\"text-align: justify;\">之所以选《百年孤独》,是因为这段文字集合了时态穿越、魔幻现实主义的基调以及复杂的长句结构。范晔的译本已经是许多人的心中标准,许多人也许没看过原著,但是仍然可以轻松背诵那句著名的开头:</p>\n<blockquote></blockquote>\n<p>多年以后,面对行刑队,奥雷里亚诺·布恩迪亚上校将会回想起父亲带他去见识冰块的那个遥远的下午。</p>\n<p style=\"text-align: justify;\">我先用常规的 Prompt 词调试了一个「翻译助手」,并将范晔的译本作为对照组,试图看看 MiniMax 能达到什么水准。</p>\n<p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/b50c08b76dd6b135fabc341386834cad\" tg-width=\"1080\" tg-height=\"609\"></p>\n<p style=\"text-align: justify;\">用户可以通过自然语言对话创建专家,也能把行业经验和 SOP 整合进去</p>\n<p style=\"text-align: justify;\">MiniMax 的直出译文在准确性上几乎无可挑剔。它完美解析了原文中关于磁铁吸铁锅、钉子挣扎的复杂逻辑链条,没有出现任何事实性错误。</p>\n<p style=\"text-align: justify;\">这大概是一个 75-80 分的水平,优于裸跑、没优化过的通用大模型 70 分的水准。剩下的那 20 分差距,体现在那些微妙的「颗粒度」上。</p>\n<p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/2096b795b8770992e3f671fcae1d4091\" tg-width=\"1080\" tg-height=\"535\"></p>\n<p style=\"text-align: justify;\">MiniMax 的翻译风格偏向直译、准确,但没有文学性</p>\n<p style=\"text-align: justify;\">例如,形容磁铁的神奇力量时,范晔用了「魔铁」二字,古朴且带有炼金术的神秘感;而 MiniMax 译作「魔法铁块」,虽然意思对了,但少了一分文学的张力。</p>\n<p style=\"text-align: justify;\">在描写吉普赛人带来的新发明时,范晔用了「」来指代家畜,贴合农村的语境;MiniMax 则选用了「」,虽然词义相通,但在中文语境下,这个词通常带有骂人的感情色彩,稍显偏差。</p>\n<p style=\"text-align: justify;\">这可能就是单纯靠 Prompt 调优的极限。我们确实能通过 Prompt 快速让 AI 做到逻辑正确、语句通顺。但想再往上走,达到 90-95 分的专家水准,光靠几句提示词是做不到的,因为它缺乏特定的「隐性知识」。</p>\n<p style=\"text-align: justify;\">于是,我重新配置了 Expert Agent,写入了一套详细的 SOP:</p>\n<p style=\"text-align: justify;\">定义人设:你不是翻译机器,你是一位深谙拉美文学的中文小说家。</p>\n<p style=\"text-align: justify;\">建立约束:禁止使用现代口语,优先使用古朴词汇</p>\n<p style=\"text-align: justify;\">注入知识库:我上传了一份「魔幻现实主义词汇表」和「马尔克斯句式风格指南」</p>\n<p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/5ac1cf2580fd1a4403c0fc349ee7977f\" tg-width=\"1080\" tg-height=\"568\"></p>\n<p style=\"text-align: justify;\">注入 SOP 之后,翻译结果呈现出了一种古朴的风格化特征,明显要比上一版本更好读,但有时会用力过猛。</p>\n<p style=\"text-align: justify;\">这一次,MiniMax 呈现出了一种文学特质,要比上一版本好读得多。例如范晔的这一句:</p>\n<p>湍急的河水清澈见底,河床里石洁白光滑宛如史前巨蛋。</p>\n<p style=\"text-align: justify;\">MiniMax 处理成了:</p>\n<p>河床上铺着光滑雪白的巨石,大如史前之。</p>\n<p style=\"text-align: justify;\">「大如史前之」明显好于上一版本「鹅石」;但「光滑雪白」不如范晔的「洁白光滑」读起来顺口。</p>\n<p style=\"text-align: justify;\">但它有时会显得用力过猛,把吉卜赛人和马孔多描绘得有点像中国古代传奇小说(比如「方生方始」、「提及之际须以手指勾勒」),稍微偏离了拉丁美洲的魔幻现实主义基调。</p>\n<p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/1e4f6cbeb852abb136bb561cd9493bc8\" tg-width=\"1080\" tg-height=\"877\"></p>\n<p style=\"text-align: justify;\">MiniMax 甚至整理了翻译札记</p>\n<p style=\"text-align: justify;\">坦白说,即便加了 SOP,AI 依然无法彻底超越范晔的版本。范晔译本中那种「史前巨蛋」的精妙比喻、「魔铁」的炼金术色彩,依然是人类灵性的高地。</p>\n<p style=\"text-align: justify;\">但令我感到震撼的是,仅仅在我注入那套 SOP 之后,MiniMax 就达成了肉眼可见的进步。<strong>这才是 Expert Agents 真正性感的地方:它让「经验」变成了一种可复用的能力。</strong></p>\n<p style=\"text-align: justify;\">同理,如果你是一位资深行业专家,你可以将自己多年的<strong>关键词挖掘逻辑、竞品分析框架、SOP </strong>上传到知识库。当你把这个 Agent 分享给 AI 实习生时,他就不再是面对一个只会说车轱辘话的通用 AI,而是在使用你的「数字分身」。这种能力的释放,意味着我们只需要做一次「封包」动作,就能让 AI 站在我们的肩膀上工作。</p>\n<p style=\"text-align: justify;\"><strong>03 Agent 的世界难题:「最后一公里」</strong></p>\n<p style=\"text-align: justify;\">第三个实验,我刻意选了一个更容易失败的方向——我想验证,「一人公司」到底是不是一句空话。</p>\n<p style=\"text-align: justify;\">于是我设计了一条内容流水线:</p>\n<p style=\"text-align: justify;\">先调研小红书科技类目的对标账号,分析他们的内容策略、爆款特征;</p>\n<p style=\"text-align: justify;\">然后基于调研结果,批量生成选题和内容;</p>\n<p style=\"text-align: justify;\">最后发布到平台上。</p>\n<p style=\"text-align: justify;\">第一个任务「深度调研」,MiniMax 调用 Web 搜索工具,检索最近一周的科技要闻、小红书科技博主的对标账号信息。搜索完成后,它自动提取关键信息,生成了一份详细的分析报告,包含账号定位、粉丝量级、内容类型、爆款特点等维度。</p>\n<p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/e1756436c26fa364b525e662e92cde61\" tg-width=\"1080\" tg-height=\"698\"></p>\n<p style=\"text-align: justify;\">MiniMax 生成的深度报告及图表信息</p>\n<p style=\"text-align: justify;\">第二个任务「生成内容」。基于调研结果,MiniMax 批量生成了多篇科技类选题,包括封面图、文案、标签建议。</p>\n<p style=\"text-align: justify;\">到目前为止,一切都非常丝滑,AI 展现出了惊人的生产力闭环。</p>\n<p style=\"text-align: justify;\">说实话,看着它自动打开浏览器,熟练地找到发布入口,试图填入标题和正文,这种从「调研」到「执行」全链路跑通的观感,简直像是在看科幻片。这是我第一次真正意义上目睹 AI 试图独自走完业务的全流程。</p>\n<p style=\"text-align: justify;\">但是,当 AI 真正介入到复杂的人类世界时,就会发现到处存在卡点。登录账号、图片上传、页面校验,这些对人来说是肌肉记忆的动作,对 Agent 却是「高摩擦操作」。GUI 本身就是为人类设计的,让 AI 在这种界面里高效操作,本身就违反了 AI 的「天性」;再加上平台严格的风控政策(比如验证码、设备检测),难度就更大了。</p>\n<p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/e01f6d125b59d7719d3873645c1c8a0e\" tg-width=\"1080\" tg-height=\"1015\"></p>\n<p style=\"text-align: justify;\">MiniMax 生成的小红书帖子,包含小红书标志性的 Emoji 文风,Tag以及增加互动率的引导</p>\n<p style=\"text-align: justify;\">整个过程中,MiniMax 提示我需要人工介入的有两个环节,一是登录小红书账号,二是上传 MiniMax 生成的封面图片。</p>\n<p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/41ecf32c655b1a9d47c0a4f97a24e7ff\" tg-width=\"1080\" tg-height=\"542\"></p>\n<p style=\"text-align: justify;\">Minimax操作小红书后台</p>\n<p style=\"text-align: justify;\">当然,这不妨碍它完成前面 90% 的工作。调研、生成、素材准备,这些原本需要花费数小时甚至数天的任务,它在几分钟内就完成了。</p>\n<p style=\"text-align: justify;\">最后那一步的人工介入,与其说是 Agent 的不足,不如说是一个合理的边界划定:涉及账号安全、平台规则的操作,还是需要人类的最终确认。</p>\n<p style=\"text-align: justify;\">这可能才是人类和 AI 协作的最理想画面:<strong>不要期待 Agent 替你完成一切,而是要理解它的能力边界</strong>,然后调整自己的工作流程。让 AI 擅长的事情,让人做人擅长的事情——这可能是一种更健康、更高效的协作模式。</p>\n<p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/01dc61e995ba2f2197b2da679a08f784\" tg-width=\"826\" tg-height=\"617\"></p>\n<p style=\"text-align: justify;\">在 MiniMax 操作小红书后台的过程中,用户可以随时暂停、人工介入。</p>\n<p style=\"text-align: justify;\"><strong>04 一切都关乎「上下文」</strong></p>\n<p style=\"text-align: justify;\">跳出具体的功能评测,MiniMax Agent Desktop 的出现,其实引发了我对「<strong>资产</strong>」两个字的重新思考。</p>\n<p style=\"text-align: justify;\">很多公司的核心资产是「经验」和「SOP」。但传统的 SOP 是写在文档里的死文字,新员工看了也不一定懂,懂了也不一定照做。</p>\n<p style=\"text-align: justify;\"><strong>MiniMax 的 Expert Agents 提供了一种新的可能:你可以把个人和团队的方法论「封装」成可执行的程序。</strong>比如你的团队有一套成熟的内容生产流程——调研、选题、写作、排版、发布——你可以把这套流程固化下来,让 Agent 按照同样的标准执行。</p>\n<p style=\"text-align: justify;\">这样一来,SOP 不再是纸上的条文,而是可交接、可复用、可执行的数字资产。新人不需要从零开始学习,直接调用专家的「方法论」,就能交付质量稳定的成果。</p>\n<p style=\"text-align: justify;\">然后是<strong>心态转变</strong>。</p>\n<p style=\"text-align: justify;\">以前我们用 AI 的感觉像开脑暴会。你说「帮我写个文案」,它给你十个版本;你说「哪个更好」,它分析一通。整个过程是探索性的、发散式的,AI 是你的思考伙伴。</p>\n<p style=\"text-align: justify;\">但用 Agent 的感觉完全不同,像带新人。你想清楚了要干什么,然后给它下达任务,用「验收标准」去沟通。它去执行,你来验收。有问题就调整,没问题就通过。</p>\n<p style=\"text-align: justify;\">这种转变意味着,你需要把自己的思维方式从「提问」转向「管理」。不是问 AI「你觉得怎么办」,而是告诉 AI「我要什么结果,你帮我办」。</p>\n<p style=\"text-align: justify;\">最后是<strong>边界重构</strong>。</p>\n<p style=\"text-align: justify;\">正如开头所说,桌面 Agent 改变的是「上下文」。但这个词背后隐藏着一个更本质的变化:<strong>过去是人去适应工具,现在是 Agent 主动进入人的环境。</strong></p>\n<p style=\"text-align: justify;\">过去三十年,我们一直在适应软件。鼠标该怎么点、菜单在哪里、快捷键是什么——这些都是人要去学习、去记忆、去适应的。但 Agent 不一样。它不需要你学习它的操作逻辑,而是它来理解你的工作环境、适应你的使用习惯。</p>\n<p style=\"text-align: justify;\">这可能才是 MiniMax Agent Desktop 真正的意义:<strong>连接「本地资产」与「云端智能」的桥梁</strong>。你的知识、你的文件、你的工作成果都在本地;云端的 AI 能力通过 Agent 进入你的环境,为你所用。</p>\n<p style=\"text-align: justify;\">有了更多的上下文,Agent 的能力真的可以不一样。</p>\n<p style=\"text-align: justify;\"><strong>05 总结</strong></p>\n<p style=\"text-align: justify;\">三年前,我们还在为 AI 能写出一首打油诗而惊叹;今天,我们已经开始讨论如何让它接管我们的工作流。</p>\n<p style=\"text-align: justify;\">Claude Cowork 的推出、MiniMax Agent Desktop 的这次更新,相比 Cloude Code 等 cli 工具,不只是 GUI 界面的更新,更像是一次对未来工作形态的预演。</p>\n<p style=\"text-align: justify;\">它并不完美,在 GUI 操作上还有进化的空间,但指明了方向——AI 不应止步于聊天框,它必须深入到我们的硬盘、我们的浏览器、我们的具体业务场景中去。</p>\n<p style=\"text-align: justify;\">这可能才是 2026 年真正改变的东西:<strong>不是人去适应分散的工具,而是 Agent 主动进入人的环境</strong>。</p>\n<p style=\"text-align: justify;\">也是 Agent 产品真正走向更大众市场的开始。</p>\n<p><a href=\"https://laohu8.com/S/00100\">$MINIMAX-WP(00100)$</a></p></body></html>","text":"2026 年第一个月在科技圈刷屏的话题,是 Claude Cowork。 这是一个跑在本地的 AI Agent,一个面向大众版的 Claude Code,能帮你点鼠标、帮你整理文件、帮你完成各种操作。 紧接着,开源社区迅速跟进,各种「开源 Cowork」或「Local First」产品接踵而至,或许是感受到了外部的竞争压力,Anthropic 随后将 100 美元 Max 套餐独享的 Cowork 功能下调至 20 美元的 Pro 档。 MiniMax 也在这个节点升级了旗下的 MiniMax Agent,推出了桌面端,提供本地文件处理功能、Browser Use 功能等等,用户只需要一句话,即可快速完成基于本地的任务。同时网页端新增专家(Expert)功能,可以将常用配置保存为可复用模板——指令、模型偏好、Agent 行为,一次配置,反复使用。 「桌面 Agent」突然火了起来,行业内已经似乎突然形成了某种清晰的共识。 当 AI 不再只存在于网页对话框和云端环境里,而是进入你的真实工作环境,这件事究竟改变了什么? 答案很简单:上下文扩容。 以前跟 AI 聊天,它的视野只有对话框里的几行字,以及你上传的附件。但现在不同了,你的硬盘、你的浏览器、你的文件目录、你的屏幕画面,都成了它的视野范围。 与此同时,AI 开始从「咨询顾问」转向「执行者」。它不再只是给建议、提方案,而是可以真正动手:遍历文件夹、调用本地资源、拆解任务并把流程跑完。 也正是在这个意义上,我们开始认真看待 MiniMax Agent Desktop。或许,桌面 Agent 的批量出现和流行,代表着 Agent 正在从概念,面向更大众的群体,进入可以被日常使用、被实际交付的阶段。 01 从今天起,不用再为整理文件困扰了 先从一件普通的小事开始使用 MiniMax Agent Desktop——整理文件夹,发票和整理桌面有些简单,我们换一种方式。 我有一个堆了很多年的电子书文件夹,里面躺着 400 多本电子书。所谓「买书如病倒,读书如抽丝」,松鼠症患者都是这样。文件名五花八门,有的是 ISBN,有的是作者名加书名,有的干脆是不明意义的编号「127766.The.epub」。 我给 MiniMax Agent Desktop 的任务很简单: 按主题整理这个文件夹,规范书名; 不确定的地方可以自行检索; 最后给我一份 Excel 表格。 Agent 没有立刻动手,而是先请求了访问权限。需要我明确选中目标文件夹,并确认它可以读取和修改内容。 Minimax 请求编辑权限 这一步很重要,它明确了责任边界,让我心里踏实了很多。 确认之后,它也没有马上改文件名,而是先给我了一份整理规划:会有哪些分类,如何判断主题,模糊情况怎么处理。 MiniMax 规划整理计划 接下来,它才进入执行阶段。左边是对话窗口,右边是命令行操作。明确的书直接处理;无法从文件名判断内容的书,它会上网检索,然后再归类。 比如看到「传奇中的大唐」这个文件名,它会去豆瓣查证,确认这是刘勃的历史随笔集,归入「中国历史」。 MiniMax Agent Desktop 的工作窗口: 左边是对话窗口,右边是命令行操作界面 最终结果是两个东西:一个被重新命名、分好类的文件夹;以及一份 Excel 表格,列清楚了文件路径、规范化书名和主题。 老实说,当看着文件夹里的文件名在瞬间自动刷新、归位,这种视觉冲击力远比生成一段文字要来得猛烈。那个飘在云端的 AI,第一次真正把手伸进了我的硬盘,完成了对现实世界的干涉。 整理前(左)vs 整理后(右) 值得一提的是,MiniMax 还找出了重复下载的书籍。 我追问了一句:你是怎么判断重复的? 它的回答是:目前主要基于标题相似度。需要的话我也可以用哈希值再校验一遍。 我当时的感觉仿佛是在玩一个开放世界的游戏——解决问题的路径不止一种,你可以反复尝试、扩展能力的边界,甚至解锁隐藏内容。 02 可复用的 SOP,让 70 分的通才变成 95 分的专家 网页端增加的专家功能值得单独介绍下,简单来说,它可以把一个人的方法论封装成一个可以反复调用的执行体,在我的理解中,这其实算是 Claude Skill 的普适版,门槛更低,更好操作,但能力没有打折。 MiniMax 封装了一些专家 Agent,同时用户也可以自己创建专家并发布到社区 这个特性触及到了一个非常有价值的问题:经验到底能不能被复用? 我选择了一个极具挑战性的任务:翻译加西亚·马尔克斯的《百年孤独》开篇。 之所以选《百年孤独》,是因为这段文字集合了时态穿越、魔幻现实主义的基调以及复杂的长句结构。范晔的译本已经是许多人的心中标准,许多人也许没看过原著,但是仍然可以轻松背诵那句著名的开头: 多年以后,面对行刑队,奥雷里亚诺·布恩迪亚上校将会回想起父亲带他去见识冰块的那个遥远的下午。 我先用常规的 Prompt 词调试了一个「翻译助手」,并将范晔的译本作为对照组,试图看看 MiniMax 能达到什么水准。 用户可以通过自然语言对话创建专家,也能把行业经验和 SOP 整合进去 MiniMax 的直出译文在准确性上几乎无可挑剔。它完美解析了原文中关于磁铁吸铁锅、钉子挣扎的复杂逻辑链条,没有出现任何事实性错误。 这大概是一个 75-80 分的水平,优于裸跑、没优化过的通用大模型 70 分的水准。剩下的那 20 分差距,体现在那些微妙的「颗粒度」上。 MiniMax 的翻译风格偏向直译、准确,但没有文学性 例如,形容磁铁的神奇力量时,范晔用了「魔铁」二字,古朴且带有炼金术的神秘感;而 MiniMax 译作「魔法铁块」,虽然意思对了,但少了一分文学的张力。 在描写吉普赛人带来的新发明时,范晔用了「」来指代家畜,贴合农村的语境;MiniMax 则选用了「」,虽然词义相通,但在中文语境下,这个词通常带有骂人的感情色彩,稍显偏差。 这可能就是单纯靠 Prompt 调优的极限。我们确实能通过 Prompt 快速让 AI 做到逻辑正确、语句通顺。但想再往上走,达到 90-95 分的专家水准,光靠几句提示词是做不到的,因为它缺乏特定的「隐性知识」。 于是,我重新配置了 Expert Agent,写入了一套详细的 SOP: 定义人设:你不是翻译机器,你是一位深谙拉美文学的中文小说家。 建立约束:禁止使用现代口语,优先使用古朴词汇 注入知识库:我上传了一份「魔幻现实主义词汇表」和「马尔克斯句式风格指南」 注入 SOP 之后,翻译结果呈现出了一种古朴的风格化特征,明显要比上一版本更好读,但有时会用力过猛。 这一次,MiniMax 呈现出了一种文学特质,要比上一版本好读得多。例如范晔的这一句: 湍急的河水清澈见底,河床里石洁白光滑宛如史前巨蛋。 MiniMax 处理成了: 河床上铺着光滑雪白的巨石,大如史前之。 「大如史前之」明显好于上一版本「鹅石」;但「光滑雪白」不如范晔的「洁白光滑」读起来顺口。 但它有时会显得用力过猛,把吉卜赛人和马孔多描绘得有点像中国古代传奇小说(比如「方生方始」、「提及之际须以手指勾勒」),稍微偏离了拉丁美洲的魔幻现实主义基调。 MiniMax 甚至整理了翻译札记 坦白说,即便加了 SOP,AI 依然无法彻底超越范晔的版本。范晔译本中那种「史前巨蛋」的精妙比喻、「魔铁」的炼金术色彩,依然是人类灵性的高地。 但令我感到震撼的是,仅仅在我注入那套 SOP 之后,MiniMax 就达成了肉眼可见的进步。这才是 Expert Agents 真正性感的地方:它让「经验」变成了一种可复用的能力。 同理,如果你是一位资深行业专家,你可以将自己多年的关键词挖掘逻辑、竞品分析框架、SOP 上传到知识库。当你把这个 Agent 分享给 AI 实习生时,他就不再是面对一个只会说车轱辘话的通用 AI,而是在使用你的「数字分身」。这种能力的释放,意味着我们只需要做一次「封包」动作,就能让 AI 站在我们的肩膀上工作。 03 Agent 的世界难题:「最后一公里」 第三个实验,我刻意选了一个更容易失败的方向——我想验证,「一人公司」到底是不是一句空话。 于是我设计了一条内容流水线: 先调研小红书科技类目的对标账号,分析他们的内容策略、爆款特征; 然后基于调研结果,批量生成选题和内容; 最后发布到平台上。 第一个任务「深度调研」,MiniMax 调用 Web 搜索工具,检索最近一周的科技要闻、小红书科技博主的对标账号信息。搜索完成后,它自动提取关键信息,生成了一份详细的分析报告,包含账号定位、粉丝量级、内容类型、爆款特点等维度。 MiniMax 生成的深度报告及图表信息 第二个任务「生成内容」。基于调研结果,MiniMax 批量生成了多篇科技类选题,包括封面图、文案、标签建议。 到目前为止,一切都非常丝滑,AI 展现出了惊人的生产力闭环。 说实话,看着它自动打开浏览器,熟练地找到发布入口,试图填入标题和正文,这种从「调研」到「执行」全链路跑通的观感,简直像是在看科幻片。这是我第一次真正意义上目睹 AI 试图独自走完业务的全流程。 但是,当 AI 真正介入到复杂的人类世界时,就会发现到处存在卡点。登录账号、图片上传、页面校验,这些对人来说是肌肉记忆的动作,对 Agent 却是「高摩擦操作」。GUI 本身就是为人类设计的,让 AI 在这种界面里高效操作,本身就违反了 AI 的「天性」;再加上平台严格的风控政策(比如验证码、设备检测),难度就更大了。 MiniMax 生成的小红书帖子,包含小红书标志性的 Emoji 文风,Tag以及增加互动率的引导 整个过程中,MiniMax 提示我需要人工介入的有两个环节,一是登录小红书账号,二是上传 MiniMax 生成的封面图片。 Minimax操作小红书后台 当然,这不妨碍它完成前面 90% 的工作。调研、生成、素材准备,这些原本需要花费数小时甚至数天的任务,它在几分钟内就完成了。 最后那一步的人工介入,与其说是 Agent 的不足,不如说是一个合理的边界划定:涉及账号安全、平台规则的操作,还是需要人类的最终确认。 这可能才是人类和 AI 协作的最理想画面:不要期待 Agent 替你完成一切,而是要理解它的能力边界,然后调整自己的工作流程。让 AI 擅长的事情,让人做人擅长的事情——这可能是一种更健康、更高效的协作模式。 在 MiniMax 操作小红书后台的过程中,用户可以随时暂停、人工介入。 04 一切都关乎「上下文」 跳出具体的功能评测,MiniMax Agent Desktop 的出现,其实引发了我对「资产」两个字的重新思考。 很多公司的核心资产是「经验」和「SOP」。但传统的 SOP 是写在文档里的死文字,新员工看了也不一定懂,懂了也不一定照做。 MiniMax 的 Expert Agents 提供了一种新的可能:你可以把个人和团队的方法论「封装」成可执行的程序。比如你的团队有一套成熟的内容生产流程——调研、选题、写作、排版、发布——你可以把这套流程固化下来,让 Agent 按照同样的标准执行。 这样一来,SOP 不再是纸上的条文,而是可交接、可复用、可执行的数字资产。新人不需要从零开始学习,直接调用专家的「方法论」,就能交付质量稳定的成果。 然后是心态转变。 以前我们用 AI 的感觉像开脑暴会。你说「帮我写个文案」,它给你十个版本;你说「哪个更好」,它分析一通。整个过程是探索性的、发散式的,AI 是你的思考伙伴。 但用 Agent 的感觉完全不同,像带新人。你想清楚了要干什么,然后给它下达任务,用「验收标准」去沟通。它去执行,你来验收。有问题就调整,没问题就通过。 这种转变意味着,你需要把自己的思维方式从「提问」转向「管理」。不是问 AI「你觉得怎么办」,而是告诉 AI「我要什么结果,你帮我办」。 最后是边界重构。 正如开头所说,桌面 Agent 改变的是「上下文」。但这个词背后隐藏着一个更本质的变化:过去是人去适应工具,现在是 Agent 主动进入人的环境。 过去三十年,我们一直在适应软件。鼠标该怎么点、菜单在哪里、快捷键是什么——这些都是人要去学习、去记忆、去适应的。但 Agent 不一样。它不需要你学习它的操作逻辑,而是它来理解你的工作环境、适应你的使用习惯。 这可能才是 MiniMax Agent Desktop 真正的意义:连接「本地资产」与「云端智能」的桥梁。你的知识、你的文件、你的工作成果都在本地;云端的 AI 能力通过 Agent 进入你的环境,为你所用。 有了更多的上下文,Agent 的能力真的可以不一样。 05 总结 三年前,我们还在为 AI 能写出一首打油诗而惊叹;今天,我们已经开始讨论如何让它接管我们的工作流。 Claude Cowork 的推出、MiniMax Agent Desktop 的这次更新,相比 Cloude Code 等 cli 工具,不只是 GUI 界面的更新,更像是一次对未来工作形态的预演。 它并不完美,在 GUI 操作上还有进化的空间,但指明了方向——AI 不应止步于聊天框,它必须深入到我们的硬盘、我们的浏览器、我们的具体业务场景中去。 这可能才是 2026 年真正改变的东西:不是人去适应分散的工具,而是 Agent 主动进入人的环境。 也是 Agent 产品真正走向更大众市场的开始。 $MINIMAX-WP(00100)$","highlighted":1,"essential":1,"paper":2,"link":"https://laohu8.com/post/526045516849320","repostId":0,"isVote":1,"tweetType":1,"commentLimit":10,"symbols":["00100"],"verified":2,"subType":0,"readableState":1,"langContent":"CN","currentLanguage":"CN","warmUpFlag":false,"orderFlag":false,"shareable":true,"causeOfNotShareable":"","featuresForAnalytics":[],"commentAndTweetFlag":false,"andRepostAutoSelectedFlag":false,"upFlag":false,"length":9121,"optionInvolvedFlag":false,"xxTargetLangEnum":"ZH_CN"},"isVote":1,"tweetType":1,"viewCount":163,"commentLimit":10,"likeStatus":false,"favoriteStatus":false,"reportStatus":false,"symbols":[],"verified":2,"subType":0,"readableState":1,"langContent":"CN","currentLanguage":"CN","warmUpFlag":false,"orderFlag":false,"shareable":true,"causeOfNotShareable":"","featuresForAnalytics":[],"commentAndTweetFlag":false,"andRepostAutoSelectedFlag":false,"upFlag":false,"length":27,"optionInvolvedFlag":false,"xxTargetLangEnum":"ZH_CN"},"commentList":[],"isCommentEnd":true,"isTiger":false,"isWeiXinMini":false,"url":"/m/post/528227346411600"}
精彩评论