Mediator
06-28 19:55
Coinbase要求所有请求具备缓存感知能力,尽量复用已有缓存。减少token用量
美国科技企业悄然转向中国AI模型,Coinbase带头用上GLM与Kimi
免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。
分享至
微信
复制链接
精彩评论
我们需要你的真知灼见来填补这片空白
打开APP,发表看法
APP内打开
发表看法
{"i18n":{"language":"zh_CN"},"detailType":1,"isChannel":false,"data":{"magic":2,"id":580065499906616,"tweetId":"580065499906616","gmtCreate":1782647734081,"gmtModify":1782651253701,"author":{"id":3498680662745699,"idStr":"3498680662745699","authorId":3498680662745699,"authorIdStr":"3498680662745699","name":"Mediator","avatar":"https://static.tigerbbs.com/e27d4b46eee1454d2bd4f83bb56ab921","vip":1,"userType":1,"introduction":"","boolIsFan":false,"boolIsHead":false,"crmLevel":1,"crmLevelSwitch":1,"currentWearingBadge":{"badgeId":"e50ce593bb40487ebfb542ca54f6a561-4","templateUuid":"e50ce593bb40487ebfb542ca54f6a561","name":"明星虎友","description":"加入老虎社区2000天","bigImgUrl":"https://static.tigerbbs.com/dddf24b906c7011de2617d4fb3f76987","smallImgUrl":"https://static.tigerbbs.com/53d58ad32c97254c6f74db8b97e6ec49","grayImgUrl":"https://static.tigerbbs.com/6304700d92ad91c7a33e2e92ec32ecc1","redirectLinkEnabled":0,"hasAllocated":1,"isWearing":1,"stampPosition":0,"hasStamp":0,"allocationCount":1,"allocatedDate":"2024.02.21","individualDisplayEnabled":0},"individualDisplayBadges":[],"wearingBadges":[],"fanSize":92,"starInvestorFlag":false},"themes":[],"images":[],"coverImages":[],"title":"","html":"<html><head></head><body><p>Coinbase要求所有请求具备缓存感知能力,尽量复用已有缓存。减少token用量</p></body></html>","htmlText":"<html><head></head><body><p>Coinbase要求所有请求具备缓存感知能力,尽量复用已有缓存。减少token用量</p></body></html>","text":"Coinbase要求所有请求具备缓存感知能力,尽量复用已有缓存。减少token用量","highlighted":1,"essential":1,"paper":1,"likeSize":0,"commentSize":0,"repostSize":0,"favoriteSize":0,"link":"https://laohu8.com/post/580065499906616","repostId":2646314640,"repostType":2,"repost":{"id":"2646314640","kind":"highlight","weMediaInfo":{"introduction":"追踪全球财经热点,精选影响您财富的资讯,投资理财必备神器!","home_visible":1,"media_name":"华尔街见闻","id":"1084101182","head_image":"https://static.tigerbbs.com/66809d1f5c2e43e2bdf15820c6d6897e"},"pubTimestamp":1782635573,"share":"https://www.laohu8.com/m/news/2646314640?lang=zh_CN&edition=full","pubTime":"2026-06-28 16:32","market":"us","language":"zh","title":"美国科技企业悄然转向中国AI模型,Coinbase带头用上GLM与Kimi","url":"https://stock-news.laohu8.com/highlight/detail?id=2646314640","media":"华尔街见闻","summary":"美国科技巨头悄然投向中国AI!Coinbase将智谱与月之暗面设为默认模型,在用量指数级暴增下成功将AI支出“腰斩”。这不仅验证了中国开源模型的卓越商业价值,更直接冲击了美国头部大模型的定价权,正重塑全球企业AI基建新格局。","content":"<html><head></head><body><p style=\"text-align: left;\">美国科技企业正在悄然将中国开源AI模型纳入生产基础设施。随着顶尖美国模型服务成本持续攀升,以<a href=\"https://laohu8.com/S/COIN\">Coinbase</a>为代表的企业开始以中国开源模型作为默认选项,以此在不压制使用量的前提下大幅压缩AI开支。</p><p style=\"text-align: left;\">Coinbase首席执行官Brian Armstrong于上周五晚间在X平台发文披露,公司已将<a href=\"https://laohu8.com/S/02513\">智谱</a>旗下刚刚发布的GLM 5.2以及北京月之暗面旗下的Kimi 2.7,通过内部LLM网关设定为工程师的默认模型。Armstrong表示,在结合路由优化与缓存改进等措施后,Coinbase的AI支出已削减"近一半",而token使用量仍在以指数级增速增长。</p><h2 style=\"text-align: left;\">中国开源模型成本优势被摆上台面</h2><p style=\"text-align: left;\">Armstrong在帖子中明确指出,91%的工程师从未触及原有的使用上限,因此Coinbase并未选择降低上限或增设消费提醒,而是转向"更便宜的默认模型"。</p><p class=\"t-img-caption\"><img src=\"https://community-static.tradeup.com/news/c43ea3d018400ac242ea5660ebfd5235\" data-align=\"center\" tg-width=\"1810\" tg-height=\"1232\"/><span></span></p><p style=\"text-align: left;\">GLM 5.2来自智谱,Kimi 2.7来自北京月之暗面,二者均属开源权重模型。Armstrong表示,这些模型被部署于常规任务场景,而对于需要复杂规划的任务,工程师仍可选用前沿模型。他的逻辑是:在执行层面使用顶级模型往往是"大材小用"。</p><p style=\"text-align: left;\">代码审查环节则采用多模型并行策略,让不同模型相互校验输出结果,以维持质量标准。</p><h2 style=\"text-align: left;\">三层基础设施重构驱动成本削减</h2><p style=\"text-align: left;\">Armstrong列出了三项核心手段。</p><p style=\"text-align: left;\">第一是智能路由:在自定义调度框架中,系统对提示词进行预处理,综合缓存命中率与模型定价,将任务自动分发至最合适、最经济的模型。他表示,最终目标是让AI而非人工来完成模型选择这一任务。</p><p style=\"text-align: left;\">第二是积极缓存:Coinbase要求所有请求具备缓存感知能力,尽量复用已有缓存。以LibreChat为例,在正确实施缓存机制后,缓存命中率从5%跃升至60%。</p><p style=\"text-align: left;\">第三是精简上下文:Armstrong建议在切换任务时开启新会话,缩小文件上下文范围,断开未使用的工具连接。他强调,目标不是减少token使用总量,而是减少"被浪费的token"。</p><h2 style=\"text-align: left;\">效率优先,而非压制使用</h2><p style=\"text-align: left;\">Armstrong将此次成本压缩定性为扩大AI采用规模的前提条件,而非一种限制。他表示,工程师仍可自由使用任意数量的token和任意模型,但公司已将用量数据可视化,并将使用量与业务影响挂钩——"花得越多,我们期望的影响也越大"。</p><p style=\"text-align: left;\">他并未披露具体的绝对支出数字。但从结构上看,在使用量指数增长的同时实现支出近半削减,意味着Coinbase已在一定程度上实现了消耗与成本的解耦。</p><p style=\"text-align: left;\">Armstrong的结论是,这套方法论具有普适性,任何企业均可借鉴,以便在不将成本设为天花板的前提下,实现AI使用规模的可持续扩张。</p></body></html>","collect":0,"html":"<!DOCTYPE html>\n<html>\n<head>\n<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\" />\n<meta name=\"viewport\" content=\"width=device-width,initial-scale=1.0,minimum-scale=1.0,maximum-scale=1.0,user-scalable=no\"/>\n<meta name=\"format-detection\" content=\"telephone=no,email=no,address=no\" />\n<title>美国科技企业悄然转向中国AI模型,Coinbase带头用上GLM与Kimi</title>\n<style type=\"text/css\">\na,abbr,acronym,address,applet,article,aside,audio,b,big,blockquote,body,canvas,caption,center,cite,code,dd,del,details,dfn,div,dl,dt,\nem,embed,fieldset,figcaption,figure,footer,form,h1,h2,h3,h4,h5,h6,header,hgroup,html,i,iframe,img,ins,kbd,label,legend,li,mark,menu,nav,\nobject,ol,output,p,pre,q,ruby,s,samp,section,small,span,strike,strong,sub,summary,sup,table,tbody,td,tfoot,th,thead,time,tr,tt,u,ul,var,video{ font:inherit;margin:0;padding:0;vertical-align:baseline;border:0 }\nbody{ font-size:16px; line-height:1.5; color:#999; background:transparent; }\n.wrapper{ overflow:hidden;word-break:break-all;padding:10px; }\nh1,h2{ font-weight:normal; line-height:1.35; margin-bottom:.6em; }\nh3,h4,h5,h6{ line-height:1.35; margin-bottom:1em; }\nh1{ font-size:24px; }\nh2{ font-size:20px; }\nh3{ font-size:18px; }\nh4{ font-size:16px; }\nh5{ font-size:14px; }\nh6{ font-size:12px; }\np,ul,ol,blockquote,dl,table{ margin:1.2em 0; }\nul,ol{ margin-left:2em; }\nul{ list-style:disc; }\nol{ list-style:decimal; }\nli,li p{ margin:10px 0;}\nimg{ max-width:100%;display:block;margin:0 auto 1em; }\nblockquote{ color:#B5B2B1; border-left:3px solid #aaa; padding:1em; }\nstrong,b{font-weight:bold;}\nem,i{font-style:italic;}\ntable{ width:100%;border-collapse:collapse;border-spacing:1px;margin:1em 0;font-size:.9em; }\nth,td{ padding:5px;text-align:left;border:1px solid #aaa; }\nth{ font-weight:bold;background:#5d5d5d; }\n.symbol-link{font-weight:bold;}\n/* header{ border-bottom:1px solid #494756; } */\n.title{ margin:0 0 8px;line-height:1.3;color:#ddd; }\n.meta {color:#5e5c6d;font-size:13px;margin:0 0 .5em; }\na{text-decoration:none; color:#2a4b87;}\n.meta .head { display: inline-block; overflow: hidden}\n.head .h-thumb { width: 30px; height: 30px; margin: 0; padding: 0; border-radius: 50%; float: left;}\n.head .h-content { margin: 0; padding: 0 0 0 9px; float: left;}\n.head .h-name {font-size: 13px; color: #eee; margin: 0;}\n.head .h-time {font-size: 11px; color: #7E829C; margin: 0;line-height: 11px;}\n.small {font-size: 12.5px; display: inline-block; transform: scale(0.9); -webkit-transform: scale(0.9); transform-origin: left; -webkit-transform-origin: left;}\n.smaller {font-size: 12.5px; display: inline-block; transform: scale(0.8); -webkit-transform: scale(0.8); transform-origin: left; -webkit-transform-origin: left;}\n.bt-text {font-size: 12px;margin: 1.5em 0 0 0}\n.bt-text p {margin: 0}\n</style>\n</head>\n<body>\n<div class=\"wrapper\">\n<header>\n<h2 class=\"title\">\n美国科技企业悄然转向中国AI模型,Coinbase带头用上GLM与Kimi\n</h2>\n\n<h4 class=\"meta\">\n\n\n<a class=\"head\" href=\"https://laohu8.com/wemedia/1084101182\">\n\n\n<div class=\"h-thumb\" style=\"background-image:url(https://static.tigerbbs.com/66809d1f5c2e43e2bdf15820c6d6897e);background-size:cover;\"></div>\n\n<div class=\"h-content\">\n<p class=\"h-name\">华尔街见闻 </p>\n<p class=\"h-time\">2026-06-28 16:32</p>\n</div>\n\n</a>\n\n\n</h4>\n\n</header>\n<article>\n<html><head></head><body><p style=\"text-align: left;\">美国科技企业正在悄然将中国开源AI模型纳入生产基础设施。随着顶尖美国模型服务成本持续攀升,以<a href=\"https://laohu8.com/S/COIN\">Coinbase</a>为代表的企业开始以中国开源模型作为默认选项,以此在不压制使用量的前提下大幅压缩AI开支。</p><p style=\"text-align: left;\">Coinbase首席执行官Brian Armstrong于上周五晚间在X平台发文披露,公司已将<a href=\"https://laohu8.com/S/02513\">智谱</a>旗下刚刚发布的GLM 5.2以及北京月之暗面旗下的Kimi 2.7,通过内部LLM网关设定为工程师的默认模型。Armstrong表示,在结合路由优化与缓存改进等措施后,Coinbase的AI支出已削减"近一半",而token使用量仍在以指数级增速增长。</p><h2 style=\"text-align: left;\">中国开源模型成本优势被摆上台面</h2><p style=\"text-align: left;\">Armstrong在帖子中明确指出,91%的工程师从未触及原有的使用上限,因此Coinbase并未选择降低上限或增设消费提醒,而是转向"更便宜的默认模型"。</p><p class=\"t-img-caption\"><img src=\"https://community-static.tradeup.com/news/c43ea3d018400ac242ea5660ebfd5235\" data-align=\"center\" tg-width=\"1810\" tg-height=\"1232\"/><span></span></p><p style=\"text-align: left;\">GLM 5.2来自智谱,Kimi 2.7来自北京月之暗面,二者均属开源权重模型。Armstrong表示,这些模型被部署于常规任务场景,而对于需要复杂规划的任务,工程师仍可选用前沿模型。他的逻辑是:在执行层面使用顶级模型往往是"大材小用"。</p><p style=\"text-align: left;\">代码审查环节则采用多模型并行策略,让不同模型相互校验输出结果,以维持质量标准。</p><h2 style=\"text-align: left;\">三层基础设施重构驱动成本削减</h2><p style=\"text-align: left;\">Armstrong列出了三项核心手段。</p><p style=\"text-align: left;\">第一是智能路由:在自定义调度框架中,系统对提示词进行预处理,综合缓存命中率与模型定价,将任务自动分发至最合适、最经济的模型。他表示,最终目标是让AI而非人工来完成模型选择这一任务。</p><p style=\"text-align: left;\">第二是积极缓存:Coinbase要求所有请求具备缓存感知能力,尽量复用已有缓存。以LibreChat为例,在正确实施缓存机制后,缓存命中率从5%跃升至60%。</p><p style=\"text-align: left;\">第三是精简上下文:Armstrong建议在切换任务时开启新会话,缩小文件上下文范围,断开未使用的工具连接。他强调,目标不是减少token使用总量,而是减少"被浪费的token"。</p><h2 style=\"text-align: left;\">效率优先,而非压制使用</h2><p style=\"text-align: left;\">Armstrong将此次成本压缩定性为扩大AI采用规模的前提条件,而非一种限制。他表示,工程师仍可自由使用任意数量的token和任意模型,但公司已将用量数据可视化,并将使用量与业务影响挂钩——"花得越多,我们期望的影响也越大"。</p><p style=\"text-align: left;\">他并未披露具体的绝对支出数字。但从结构上看,在使用量指数增长的同时实现支出近半削减,意味着Coinbase已在一定程度上实现了消耗与成本的解耦。</p><p style=\"text-align: left;\">Armstrong的结论是,这套方法论具有普适性,任何企业均可借鉴,以便在不将成本设为天花板的前提下,实现AI使用规模的可持续扩张。</p></body></html>\n\n</article>\n</div>\n</body>\n</html>\n","type":0,"thumbnail":"https://static.tigerbbs.com/1069feea78246ce5b78d89791d3f882f","relate_stocks":{},"source_url":"https://wallstreetcn.com/articles/3775696","is_english":false,"share_image_url":"https://static.laohu8.com/e9f99090a1c2ed51c021029395664489","article_id":"2646314640","content_text":"美国科技企业正在悄然将中国开源AI模型纳入生产基础设施。随着顶尖美国模型服务成本持续攀升,以Coinbase为代表的企业开始以中国开源模型作为默认选项,以此在不压制使用量的前提下大幅压缩AI开支。Coinbase首席执行官Brian Armstrong于上周五晚间在X平台发文披露,公司已将智谱旗下刚刚发布的GLM 5.2以及北京月之暗面旗下的Kimi 2.7,通过内部LLM网关设定为工程师的默认模型。Armstrong表示,在结合路由优化与缓存改进等措施后,Coinbase的AI支出已削减\"近一半\",而token使用量仍在以指数级增速增长。中国开源模型成本优势被摆上台面Armstrong在帖子中明确指出,91%的工程师从未触及原有的使用上限,因此Coinbase并未选择降低上限或增设消费提醒,而是转向\"更便宜的默认模型\"。GLM 5.2来自智谱,Kimi 2.7来自北京月之暗面,二者均属开源权重模型。Armstrong表示,这些模型被部署于常规任务场景,而对于需要复杂规划的任务,工程师仍可选用前沿模型。他的逻辑是:在执行层面使用顶级模型往往是\"大材小用\"。代码审查环节则采用多模型并行策略,让不同模型相互校验输出结果,以维持质量标准。三层基础设施重构驱动成本削减Armstrong列出了三项核心手段。第一是智能路由:在自定义调度框架中,系统对提示词进行预处理,综合缓存命中率与模型定价,将任务自动分发至最合适、最经济的模型。他表示,最终目标是让AI而非人工来完成模型选择这一任务。第二是积极缓存:Coinbase要求所有请求具备缓存感知能力,尽量复用已有缓存。以LibreChat为例,在正确实施缓存机制后,缓存命中率从5%跃升至60%。第三是精简上下文:Armstrong建议在切换任务时开启新会话,缩小文件上下文范围,断开未使用的工具连接。他强调,目标不是减少token使用总量,而是减少\"被浪费的token\"。效率优先,而非压制使用Armstrong将此次成本压缩定性为扩大AI采用规模的前提条件,而非一种限制。他表示,工程师仍可自由使用任意数量的token和任意模型,但公司已将用量数据可视化,并将使用量与业务影响挂钩——\"花得越多,我们期望的影响也越大\"。他并未披露具体的绝对支出数字。但从结构上看,在使用量指数增长的同时实现支出近半削减,意味着Coinbase已在一定程度上实现了消耗与成本的解耦。Armstrong的结论是,这套方法论具有普适性,任何企业均可借鉴,以便在不将成本设为天花板的前提下,实现AI使用规模的可持续扩张。","news_type":1,"symbols_score_info":{"COIA":0.6,"COII":0.6,"COIN":1.95,"CONY":0.6,"CONL":0.6,"ICOI":0.6,"COIW":0.6,"CONI":0.6,"CONX":0.6,"COYY":0.6,"COIO":0.6,"FIAT":0.6,"COIG":0.6}},"isVote":1,"tweetType":1,"viewCount":28,"commentLimit":10,"likeStatus":false,"favoriteStatus":false,"reportStatus":false,"symbols":[],"verified":2,"subType":0,"readableState":1,"langContent":"CN","currentLanguage":"CN","warmUpFlag":false,"orderFlag":false,"shareable":true,"causeOfNotShareable":"","featuresForAnalytics":[],"commentAndTweetFlag":false,"andRepostAutoSelectedFlag":false,"upFlag":false,"length":67,"optionInvolvedFlag":false,"xxTargetLangEnum":"ZH_CN"},"commentList":[],"isCommentEnd":true,"isTiger":false,"isWeiXinMini":false,"url":"/m/post/580065499906616"}
精彩评论