+关注
石头DE
机械工程师 包租公 定居德国 独立量化交易管理人
IP属地:海外
15
关注
5
粉丝
5
主题
0
勋章
主贴
热门
石头DE
03-07
盘前二月非农预测
尝试了一下模型化非农预测,输入数据有限,仅供参考。 输入了:新闻模型(就业相关)、政策模型(就业相关)、近期数据 结果: 历史ADP与NFP的方向同步率:71.43% 预测本次NFP数据(基于ADP误差调整):10.81 万 非农低于预期的概率:80.00% 非农高于预期的概率:20.00%
盘前二月非农预测
石头DE
02-11
$纳指三倍做空ETF(SQQQ)$
逢低买入
石头DE
02-08
$英伟达(NVDA)$
$美国超微公司(AMD)$
来自Mirae Asset Securities Research(韩国未来资产证券)的分析称,V3的硬件效率之所以能比Meta等高出10倍,可以总结为“他们从头开始重建了一切”。在使用英伟达的H800 GPU训练DeepSeek-V3时,他们针对自己的需求把132个流式多处理器(SMs)中的20个修改成负责服务器间的通信,而不是计算任务。变相绕过了硬件对通信速度的限制。 这种操作是用英伟达的PTX(Parallel Thread Execution)语言实现的,而不是CUDA。 PTX在接近汇编语言的层级运行,允许进行细粒度的优化,如寄存器分配和Thread/Warp级别的调整。这种编程非常复杂且难以维护,所以行业通用的做法是使用CUDA这样的高级编程语言。换句话说,他们把优化做到了极致。 PTX仍然是英伟达GPU架构中的技术,它是CUDA编程模型中的中间表示,用于连接CUDA高级语言代码和GPU底层硬件指令。 在实际编译流程中,CUDA代码首先被编译为PTX代码,PTX代码再被编译为目标GPU架构的机器码(SASS, Streaming ASSembler)。CUDA起到了提供高级编程接口和工具链的作用,可以简化开发者的工作。而PTX作为中间层,充当高级语言和底层硬件之间的桥梁。 另外,这种两步编译流程也使得CUDA程序具有跨架构的兼容性和可移植性。 反过来说,像DeepSeek这种直接编写PTX代码的做法,首先不仅非常复杂,也很难移植到不同型号的GPU。有从业者表示,针对H100优化的代码迁移到其他型号上可能效果打折
石头DE
02-06
把回复其他帖子的内容再强调一遍。DeepSeek只是用了20%的PTX,为了提高通讯效率利用了CUDA的中间层汇编语言通讯而已,剩余的80%还是CUDA的高级语言。这个是量化和数学问题常用的方案。和所谓的“绕过”根本不是一回事。将来AI芯片的主要问题是GPU和ASIC的市场再分配。现在的波动只是暂时的,将来
$英伟达(NVDA)$
的财务数据会说明一切。 廉价的方案只会促进LLM的快速产品化,真正走进我们的生活,所以对各类芯片的需求只多不少。 同时关注
$台积电(TSM)$
芯片的制造短期内离不开他家。
石头DE
02-04
$苹果(AAPL)$
营收虽然稳定,但是没有新的内容来支撑继续的高歌猛进,难不成变
$特斯拉(TSLA)$
一样靠故事? 估计近期会在200-250之间来回震荡。
石头DE
02-04
$阿里巴巴(BABA)$
阿里这家公司的管理经营上问题比较多,讲故事可以,长期不看好。 如果到70-80区间可以入手。获利抛的点位看个人决定。
去老虎APP查看更多动态
{"i18n":{"language":"zh_CN"},"userPageInfo":{"id":"4092979624733190","uuid":"4092979624733190","gmtCreate":1629877622021,"gmtModify":1738628026161,"name":"石头DE","pinyin":"stdeshitoude","introduction":"","introductionEn":"","signature":"机械工程师 包租公 定居德国 独立量化交易管理人","avatar":"https://static.tigerbbs.com/8187c1a3b4e51494cd25faa064cbeac1","hat":null,"hatId":null,"hatName":null,"vip":1,"status":2,"fanSize":5,"headSize":15,"tweetSize":7,"questionSize":0,"limitLevel":999,"accountStatus":4,"level":{"id":0,"name":"","nameTw":"","represent":"","factor":"","iconColor":"","bgColor":""},"themeCounts":5,"badgeCounts":0,"badges":[],"moderator":false,"superModerator":false,"manageSymbols":null,"badgeLevel":null,"boolIsFan":false,"boolIsHead":false,"favoriteSize":4,"symbols":null,"coverImage":null,"realNameVerified":null,"userBadges":[{"badgeId":"e50ce593bb40487ebfb542ca54f6a561-2","templateUuid":"e50ce593bb40487ebfb542ca54f6a561","name":"资深虎友","description":"加入老虎社区1000天","bigImgUrl":"https://static.tigerbbs.com/0063fb68ea29c9ae6858c58630e182d5","smallImgUrl":"https://static.tigerbbs.com/96c699a93be4214d4b49aea6a5a5d1a4","grayImgUrl":"https://static.tigerbbs.com/35b0e542a9ff77046ed69ef602bc105d","redirectLinkEnabled":0,"redirectLink":null,"hasAllocated":1,"isWearing":0,"stamp":null,"stampPosition":0,"hasStamp":0,"allocationCount":1,"allocatedDate":"2024.05.29","exceedPercentage":null,"individualDisplayEnabled":0,"backgroundColor":null,"fontColor":null,"individualDisplaySort":0,"categoryType":1001},{"badgeId":"228c86a078844d74991fff2b7ab2428d-3","templateUuid":"228c86a078844d74991fff2b7ab2428d","name":"投资合伙人虎","description":"证券账户累计交易金额达到100万美元","bigImgUrl":"https://static.tigerbbs.com/fbeac6bb240db7da8b972e5183d050ba","smallImgUrl":"https://static.tigerbbs.com/436cdf80292b99f0a992e78750ac4e3a","grayImgUrl":"https://static.tigerbbs.com/506a259a7b456f037592c3b23c779599","redirectLinkEnabled":0,"redirectLink":null,"hasAllocated":1,"isWearing":0,"stamp":null,"stampPosition":0,"hasStamp":0,"allocationCount":1,"allocatedDate":"2023.07.14","exceedPercentage":"93.35%","individualDisplayEnabled":0,"backgroundColor":null,"fontColor":null,"individualDisplaySort":0,"categoryType":1101},{"badgeId":"35ec162348d5460f88c959321e554969-3","templateUuid":"35ec162348d5460f88c959321e554969","name":"传说交易员","description":"证券或期货账户累计交易次数达到300次","bigImgUrl":"https://static.tigerbbs.com/656db16598a0b8f21429e10d6c1cb033","smallImgUrl":"https://static.tigerbbs.com/03f10910d4dd9234f9b5702a3342193a","grayImgUrl":"https://static.tigerbbs.com/0c767e35268feb729d50d3fa9a386c5a","redirectLinkEnabled":0,"redirectLink":null,"hasAllocated":1,"isWearing":0,"stamp":null,"stampPosition":0,"hasStamp":0,"allocationCount":1,"allocatedDate":"2022.09.25","exceedPercentage":"93.09%","individualDisplayEnabled":0,"backgroundColor":null,"fontColor":null,"individualDisplaySort":0,"categoryType":1100},{"badgeId":"976c19eed35f4cd78f17501c2e99ef37-1","templateUuid":"976c19eed35f4cd78f17501c2e99ef37","name":"博闻投资者","description":"累计交易超过10只正股","bigImgUrl":"https://static.tigerbbs.com/e74cc24115c4fbae6154ec1b1041bf47","smallImgUrl":"https://static.tigerbbs.com/d48265cbfd97c57f9048db29f22227b0","grayImgUrl":"https://static.tigerbbs.com/76c6d6898b073c77e1c537ebe9ac1c57","redirectLinkEnabled":0,"redirectLink":null,"hasAllocated":1,"isWearing":0,"stamp":null,"stampPosition":0,"hasStamp":0,"allocationCount":1,"allocatedDate":"2022.02.03","exceedPercentage":null,"individualDisplayEnabled":0,"backgroundColor":null,"fontColor":null,"individualDisplaySort":0,"categoryType":1102},{"badgeId":"518b5610c3e8410da5cfad115e4b0f5a-1","templateUuid":"518b5610c3e8410da5cfad115e4b0f5a","name":"实盘交易者","description":"完成一笔实盘交易","bigImgUrl":"https://static.tigerbbs.com/2e08a1cc2087a1de93402c2c290fa65b","smallImgUrl":"https://static.tigerbbs.com/4504a6397ce1137932d56e5f4ce27166","grayImgUrl":"https://static.tigerbbs.com/4b22c79415b4cd6e3d8ebc4a0fa32604","redirectLinkEnabled":0,"redirectLink":null,"hasAllocated":1,"isWearing":0,"stamp":null,"stampPosition":0,"hasStamp":0,"allocationCount":1,"allocatedDate":"2021.12.28","exceedPercentage":null,"individualDisplayEnabled":0,"backgroundColor":null,"fontColor":null,"individualDisplaySort":0,"categoryType":1100}],"userBadgeCount":5,"currentWearingBadge":null,"individualDisplayBadges":null,"crmLevel":8,"crmLevelSwitch":0,"location":"海外","starInvestorFollowerNum":0,"starInvestorFlag":false,"starInvestorOrderShareNum":0,"subscribeStarInvestorNum":7,"ror":null,"winRationPercentage":null,"showRor":false,"investmentPhilosophy":null,"starInvestorSubscribeFlag":false},"baikeInfo":{},"tab":"post","tweets":[{"id":410882051694968,"gmtCreate":1741341550765,"gmtModify":1741341557254,"author":{"id":"4092979624733190","authorId":"4092979624733190","name":"石头DE","avatar":"https://static.tigerbbs.com/8187c1a3b4e51494cd25faa064cbeac1","crmLevel":8,"crmLevelSwitch":0,"followedFlag":false,"idStr":"4092979624733190","authorIdStr":"4092979624733190"},"themes":[],"title":"盘前二月非农预测","htmlText":"尝试了一下模型化非农预测,输入数据有限,仅供参考。 输入了:新闻模型(就业相关)、政策模型(就业相关)、近期数据 结果: 历史ADP与NFP的方向同步率:71.43% 预测本次NFP数据(基于ADP误差调整):10.81 万 非农低于预期的概率:80.00% 非农高于预期的概率:20.00%","listText":"尝试了一下模型化非农预测,输入数据有限,仅供参考。 输入了:新闻模型(就业相关)、政策模型(就业相关)、近期数据 结果: 历史ADP与NFP的方向同步率:71.43% 预测本次NFP数据(基于ADP误差调整):10.81 万 非农低于预期的概率:80.00% 非农高于预期的概率:20.00%","text":"尝试了一下模型化非农预测,输入数据有限,仅供参考。 输入了:新闻模型(就业相关)、政策模型(就业相关)、近期数据 结果: 历史ADP与NFP的方向同步率:71.43% 预测本次NFP数据(基于ADP误差调整):10.81 万 非农低于预期的概率:80.00% 非农高于预期的概率:20.00%","images":[{"img":"https://static.tigerbbs.com/7fb1d4a38666d51bdcb009c2a542e178","width":"200","height":"200"}],"top":1,"highlighted":1,"essential":1,"paper":2,"likeSize":1,"commentSize":0,"repostSize":0,"link":"https://laohu8.com/post/410882051694968","isVote":1,"tweetType":1,"viewCount":380,"authorTweetTopStatus":1,"verified":2,"comments":[],"imageCount":1,"langContent":"CN","totalScore":0},{"id":402189119918520,"gmtCreate":1739209181613,"gmtModify":1739209225625,"author":{"id":"4092979624733190","authorId":"4092979624733190","name":"石头DE","avatar":"https://static.tigerbbs.com/8187c1a3b4e51494cd25faa064cbeac1","crmLevel":8,"crmLevelSwitch":0,"followedFlag":false,"idStr":"4092979624733190","authorIdStr":"4092979624733190"},"themes":[],"htmlText":"<a href=\"https://laohu8.com/S/SQQQ\">$纳指三倍做空ETF(SQQQ)$ </a> 逢低买入","listText":"<a href=\"https://laohu8.com/S/SQQQ\">$纳指三倍做空ETF(SQQQ)$ </a> 逢低买入","text":"$纳指三倍做空ETF(SQQQ)$ 逢低买入","images":[{"img":"https://static.tigerbbs.com/405c610a51192455e25d47279a205ece","width":"1092","height":"1717"}],"top":1,"highlighted":1,"essential":1,"paper":1,"likeSize":0,"commentSize":0,"repostSize":0,"link":"https://laohu8.com/post/402189119918520","isVote":1,"tweetType":1,"viewCount":344,"authorTweetTopStatus":1,"verified":2,"comments":[],"imageCount":1,"langContent":"CN","totalScore":0},{"id":401338953720440,"gmtCreate":1738990385435,"gmtModify":1739171563398,"author":{"id":"4092979624733190","authorId":"4092979624733190","name":"石头DE","avatar":"https://static.tigerbbs.com/8187c1a3b4e51494cd25faa064cbeac1","crmLevel":8,"crmLevelSwitch":0,"followedFlag":false,"idStr":"4092979624733190","authorIdStr":"4092979624733190"},"themes":[],"htmlText":"<a href=\"https://laohu8.com/S/NVDA\">$英伟达(NVDA)$ </a> <a href=\"https://laohu8.com/S/AMD\">$美国超微公司(AMD)$ </a> 来自Mirae Asset Securities Research(韩国未来资产证券)的分析称,V3的硬件效率之所以能比Meta等高出10倍,可以总结为“他们从头开始重建了一切”。在使用英伟达的H800 GPU训练DeepSeek-V3时,他们针对自己的需求把132个流式多处理器(SMs)中的20个修改成负责服务器间的通信,而不是计算任务。变相绕过了硬件对通信速度的限制。 这种操作是用英伟达的PTX(Parallel Thread Execution)语言实现的,而不是CUDA。 PTX在接近汇编语言的层级运行,允许进行细粒度的优化,如寄存器分配和Thread/Warp级别的调整。这种编程非常复杂且难以维护,所以行业通用的做法是使用CUDA这样的高级编程语言。换句话说,他们把优化做到了极致。 PTX仍然是英伟达GPU架构中的技术,它是CUDA编程模型中的中间表示,用于连接CUDA高级语言代码和GPU底层硬件指令。 在实际编译流程中,CUDA代码首先被编译为PTX代码,PTX代码再被编译为目标GPU架构的机器码(SASS, Streaming ASSembler)。CUDA起到了提供高级编程接口和工具链的作用,可以简化开发者的工作。而PTX作为中间层,充当高级语言和底层硬件之间的桥梁。 另外,这种两步编译流程也使得CUDA程序具有跨架构的兼容性和可移植性。 反过来说,像DeepSeek这种直接编写PTX代码的做法,首先不仅非常复杂,也很难移植到不同型号的GPU。有从业者表示,针对H100优化的代码迁移到其他型号上可能效果打折","listText":"<a href=\"https://laohu8.com/S/NVDA\">$英伟达(NVDA)$ </a> <a href=\"https://laohu8.com/S/AMD\">$美国超微公司(AMD)$ </a> 来自Mirae Asset Securities Research(韩国未来资产证券)的分析称,V3的硬件效率之所以能比Meta等高出10倍,可以总结为“他们从头开始重建了一切”。在使用英伟达的H800 GPU训练DeepSeek-V3时,他们针对自己的需求把132个流式多处理器(SMs)中的20个修改成负责服务器间的通信,而不是计算任务。变相绕过了硬件对通信速度的限制。 这种操作是用英伟达的PTX(Parallel Thread Execution)语言实现的,而不是CUDA。 PTX在接近汇编语言的层级运行,允许进行细粒度的优化,如寄存器分配和Thread/Warp级别的调整。这种编程非常复杂且难以维护,所以行业通用的做法是使用CUDA这样的高级编程语言。换句话说,他们把优化做到了极致。 PTX仍然是英伟达GPU架构中的技术,它是CUDA编程模型中的中间表示,用于连接CUDA高级语言代码和GPU底层硬件指令。 在实际编译流程中,CUDA代码首先被编译为PTX代码,PTX代码再被编译为目标GPU架构的机器码(SASS, Streaming ASSembler)。CUDA起到了提供高级编程接口和工具链的作用,可以简化开发者的工作。而PTX作为中间层,充当高级语言和底层硬件之间的桥梁。 另外,这种两步编译流程也使得CUDA程序具有跨架构的兼容性和可移植性。 反过来说,像DeepSeek这种直接编写PTX代码的做法,首先不仅非常复杂,也很难移植到不同型号的GPU。有从业者表示,针对H100优化的代码迁移到其他型号上可能效果打折","text":"$英伟达(NVDA)$ $美国超微公司(AMD)$ 来自Mirae Asset Securities Research(韩国未来资产证券)的分析称,V3的硬件效率之所以能比Meta等高出10倍,可以总结为“他们从头开始重建了一切”。在使用英伟达的H800 GPU训练DeepSeek-V3时,他们针对自己的需求把132个流式多处理器(SMs)中的20个修改成负责服务器间的通信,而不是计算任务。变相绕过了硬件对通信速度的限制。 这种操作是用英伟达的PTX(Parallel Thread Execution)语言实现的,而不是CUDA。 PTX在接近汇编语言的层级运行,允许进行细粒度的优化,如寄存器分配和Thread/Warp级别的调整。这种编程非常复杂且难以维护,所以行业通用的做法是使用CUDA这样的高级编程语言。换句话说,他们把优化做到了极致。 PTX仍然是英伟达GPU架构中的技术,它是CUDA编程模型中的中间表示,用于连接CUDA高级语言代码和GPU底层硬件指令。 在实际编译流程中,CUDA代码首先被编译为PTX代码,PTX代码再被编译为目标GPU架构的机器码(SASS, Streaming ASSembler)。CUDA起到了提供高级编程接口和工具链的作用,可以简化开发者的工作。而PTX作为中间层,充当高级语言和底层硬件之间的桥梁。 另外,这种两步编译流程也使得CUDA程序具有跨架构的兼容性和可移植性。 反过来说,像DeepSeek这种直接编写PTX代码的做法,首先不仅非常复杂,也很难移植到不同型号的GPU。有从业者表示,针对H100优化的代码迁移到其他型号上可能效果打折","images":[],"top":1,"highlighted":1,"essential":1,"paper":1,"likeSize":0,"commentSize":0,"repostSize":0,"link":"https://laohu8.com/post/401338953720440","isVote":1,"tweetType":1,"viewCount":3000,"authorTweetTopStatus":1,"verified":2,"comments":[],"imageCount":0,"langContent":"CN","totalScore":0},{"id":400704135250216,"gmtCreate":1738835921137,"gmtModify":1738836056166,"author":{"id":"4092979624733190","authorId":"4092979624733190","name":"石头DE","avatar":"https://static.tigerbbs.com/8187c1a3b4e51494cd25faa064cbeac1","crmLevel":8,"crmLevelSwitch":0,"followedFlag":false,"idStr":"4092979624733190","authorIdStr":"4092979624733190"},"themes":[],"htmlText":"把回复其他帖子的内容再强调一遍。DeepSeek只是用了20%的PTX,为了提高通讯效率利用了CUDA的中间层汇编语言通讯而已,剩余的80%还是CUDA的高级语言。这个是量化和数学问题常用的方案。和所谓的“绕过”根本不是一回事。将来AI芯片的主要问题是GPU和ASIC的市场再分配。现在的波动只是暂时的,将来<a href=\"https://laohu8.com/S/NVDA\">$英伟达(NVDA)$</a>的财务数据会说明一切。 廉价的方案只会促进LLM的快速产品化,真正走进我们的生活,所以对各类芯片的需求只多不少。 同时关注<a href=\"https://laohu8.com/S/TSM\">$台积电(TSM)$ </a> 芯片的制造短期内离不开他家。","listText":"把回复其他帖子的内容再强调一遍。DeepSeek只是用了20%的PTX,为了提高通讯效率利用了CUDA的中间层汇编语言通讯而已,剩余的80%还是CUDA的高级语言。这个是量化和数学问题常用的方案。和所谓的“绕过”根本不是一回事。将来AI芯片的主要问题是GPU和ASIC的市场再分配。现在的波动只是暂时的,将来<a href=\"https://laohu8.com/S/NVDA\">$英伟达(NVDA)$</a>的财务数据会说明一切。 廉价的方案只会促进LLM的快速产品化,真正走进我们的生活,所以对各类芯片的需求只多不少。 同时关注<a href=\"https://laohu8.com/S/TSM\">$台积电(TSM)$ </a> 芯片的制造短期内离不开他家。","text":"把回复其他帖子的内容再强调一遍。DeepSeek只是用了20%的PTX,为了提高通讯效率利用了CUDA的中间层汇编语言通讯而已,剩余的80%还是CUDA的高级语言。这个是量化和数学问题常用的方案。和所谓的“绕过”根本不是一回事。将来AI芯片的主要问题是GPU和ASIC的市场再分配。现在的波动只是暂时的,将来$英伟达(NVDA)$的财务数据会说明一切。 廉价的方案只会促进LLM的快速产品化,真正走进我们的生活,所以对各类芯片的需求只多不少。 同时关注$台积电(TSM)$ 芯片的制造短期内离不开他家。","images":[],"top":1,"highlighted":1,"essential":1,"paper":1,"likeSize":4,"commentSize":7,"repostSize":0,"link":"https://laohu8.com/post/400704135250216","isVote":1,"tweetType":1,"viewCount":5223,"authorTweetTopStatus":1,"verified":2,"comments":[{"author":{"id":"4201740931853640","authorId":"4201740931853640","name":"操刀鬼","avatar":"https://static.tigerbbs.com/ce230603dccdfafb8942238ee0457d10","crmLevel":1,"crmLevelSwitch":0,"idStr":"4201740931853640","authorIdStr":"4201740931853640"},"content":"我讲实话,你的嘴硬程度,已经超过了我的想象,麻烦你发帖之前,问问deepseek自己,他能不能用其他芯片训练,无知到这种地步,世所罕见,我来告诉大家:deepseek可以用一切非英伟达的芯片进行训练,不信你去问deepseek,他会告诉你详细答案","text":"我讲实话,你的嘴硬程度,已经超过了我的想象,麻烦你发帖之前,问问deepseek自己,他能不能用其他芯片训练,无知到这种地步,世所罕见,我来告诉大家:deepseek可以用一切非英伟达的芯片进行训练,不信你去问deepseek,他会告诉你详细答案","html":"我讲实话,你的嘴硬程度,已经超过了我的想象,麻烦你发帖之前,问问deepseek自己,他能不能用其他芯片训练,无知到这种地步,世所罕见,我来告诉大家:deepseek可以用一切非英伟达的芯片进行训练,不信你去问deepseek,他会告诉你详细答案"}],"imageCount":0,"langContent":"CN","totalScore":0},{"id":399784306561088,"gmtCreate":1738626322303,"gmtModify":1738627293710,"author":{"id":"4092979624733190","authorId":"4092979624733190","name":"石头DE","avatar":"https://static.tigerbbs.com/8187c1a3b4e51494cd25faa064cbeac1","crmLevel":8,"crmLevelSwitch":0,"followedFlag":false,"idStr":"4092979624733190","authorIdStr":"4092979624733190"},"themes":[],"htmlText":"<a href=\"https://laohu8.com/S/AAPL\">$苹果(AAPL)$ </a> 营收虽然稳定,但是没有新的内容来支撑继续的高歌猛进,难不成变<a href=\"https://laohu8.com/S/TSLA\">$特斯拉(TSLA)$ </a> 一样靠故事? 估计近期会在200-250之间来回震荡。","listText":"<a href=\"https://laohu8.com/S/AAPL\">$苹果(AAPL)$ </a> 营收虽然稳定,但是没有新的内容来支撑继续的高歌猛进,难不成变<a href=\"https://laohu8.com/S/TSLA\">$特斯拉(TSLA)$ </a> 一样靠故事? 估计近期会在200-250之间来回震荡。","text":"$苹果(AAPL)$ 营收虽然稳定,但是没有新的内容来支撑继续的高歌猛进,难不成变$特斯拉(TSLA)$ 一样靠故事? 估计近期会在200-250之间来回震荡。","images":[{"img":"https://static.tigerbbs.com/09b4f672506cdb31a9220cf5d47b5a87","width":"1092","height":"1133"}],"top":1,"highlighted":1,"essential":1,"paper":1,"likeSize":0,"commentSize":2,"repostSize":1,"link":"https://laohu8.com/post/399784306561088","isVote":1,"tweetType":1,"viewCount":950,"authorTweetTopStatus":1,"verified":2,"comments":[{"author":{"id":"20733756400840","authorId":"20733756400840","name":"我是股神的小腿毛","avatar":"https://static.tigerbbs.com/3d2a54ec91bee908d0ce0a36809b8199","crmLevel":1,"crmLevelSwitch":0,"idStr":"20733756400840","authorIdStr":"20733756400840"},"content":"你买了啥?怎么赚这么多","text":"你买了啥?怎么赚这么多","html":"你买了啥?怎么赚这么多"}],"imageCount":1,"langContent":"CN","totalScore":0},{"id":399706310603232,"gmtCreate":1738624640596,"gmtModify":1738990544641,"author":{"id":"4092979624733190","authorId":"4092979624733190","name":"石头DE","avatar":"https://static.tigerbbs.com/8187c1a3b4e51494cd25faa064cbeac1","crmLevel":8,"crmLevelSwitch":0,"followedFlag":false,"idStr":"4092979624733190","authorIdStr":"4092979624733190"},"themes":[],"htmlText":"<a href=\"https://laohu8.com/S/BABA\">$阿里巴巴(BABA)$ </a> 阿里这家公司的管理经营上问题比较多,讲故事可以,长期不看好。 如果到70-80区间可以入手。获利抛的点位看个人决定。","listText":"<a href=\"https://laohu8.com/S/BABA\">$阿里巴巴(BABA)$ </a> 阿里这家公司的管理经营上问题比较多,讲故事可以,长期不看好。 如果到70-80区间可以入手。获利抛的点位看个人决定。","text":"$阿里巴巴(BABA)$ 阿里这家公司的管理经营上问题比较多,讲故事可以,长期不看好。 如果到70-80区间可以入手。获利抛的点位看个人决定。","images":[],"top":1,"highlighted":1,"essential":1,"paper":1,"likeSize":1,"commentSize":0,"repostSize":0,"link":"https://laohu8.com/post/399706310603232","isVote":1,"tweetType":1,"viewCount":339,"authorTweetTopStatus":1,"verified":2,"comments":[],"imageCount":0,"langContent":"CN","totalScore":0}],"hots":[{"id":400704135250216,"gmtCreate":1738835921137,"gmtModify":1738836056166,"author":{"id":"4092979624733190","authorId":"4092979624733190","name":"石头DE","avatar":"https://static.tigerbbs.com/8187c1a3b4e51494cd25faa064cbeac1","crmLevel":8,"crmLevelSwitch":0,"followedFlag":false,"idStr":"4092979624733190","authorIdStr":"4092979624733190"},"themes":[],"htmlText":"把回复其他帖子的内容再强调一遍。DeepSeek只是用了20%的PTX,为了提高通讯效率利用了CUDA的中间层汇编语言通讯而已,剩余的80%还是CUDA的高级语言。这个是量化和数学问题常用的方案。和所谓的“绕过”根本不是一回事。将来AI芯片的主要问题是GPU和ASIC的市场再分配。现在的波动只是暂时的,将来<a href=\"https://laohu8.com/S/NVDA\">$英伟达(NVDA)$</a>的财务数据会说明一切。 廉价的方案只会促进LLM的快速产品化,真正走进我们的生活,所以对各类芯片的需求只多不少。 同时关注<a href=\"https://laohu8.com/S/TSM\">$台积电(TSM)$ </a> 芯片的制造短期内离不开他家。","listText":"把回复其他帖子的内容再强调一遍。DeepSeek只是用了20%的PTX,为了提高通讯效率利用了CUDA的中间层汇编语言通讯而已,剩余的80%还是CUDA的高级语言。这个是量化和数学问题常用的方案。和所谓的“绕过”根本不是一回事。将来AI芯片的主要问题是GPU和ASIC的市场再分配。现在的波动只是暂时的,将来<a href=\"https://laohu8.com/S/NVDA\">$英伟达(NVDA)$</a>的财务数据会说明一切。 廉价的方案只会促进LLM的快速产品化,真正走进我们的生活,所以对各类芯片的需求只多不少。 同时关注<a href=\"https://laohu8.com/S/TSM\">$台积电(TSM)$ </a> 芯片的制造短期内离不开他家。","text":"把回复其他帖子的内容再强调一遍。DeepSeek只是用了20%的PTX,为了提高通讯效率利用了CUDA的中间层汇编语言通讯而已,剩余的80%还是CUDA的高级语言。这个是量化和数学问题常用的方案。和所谓的“绕过”根本不是一回事。将来AI芯片的主要问题是GPU和ASIC的市场再分配。现在的波动只是暂时的,将来$英伟达(NVDA)$的财务数据会说明一切。 廉价的方案只会促进LLM的快速产品化,真正走进我们的生活,所以对各类芯片的需求只多不少。 同时关注$台积电(TSM)$ 芯片的制造短期内离不开他家。","images":[],"top":1,"highlighted":1,"essential":1,"paper":1,"likeSize":4,"commentSize":7,"repostSize":0,"link":"https://laohu8.com/post/400704135250216","isVote":1,"tweetType":1,"viewCount":5223,"authorTweetTopStatus":1,"verified":2,"comments":[{"author":{"id":"4201740931853640","authorId":"4201740931853640","name":"操刀鬼","avatar":"https://static.tigerbbs.com/ce230603dccdfafb8942238ee0457d10","crmLevel":1,"crmLevelSwitch":0,"idStr":"4201740931853640","authorIdStr":"4201740931853640"},"content":"我讲实话,你的嘴硬程度,已经超过了我的想象,麻烦你发帖之前,问问deepseek自己,他能不能用其他芯片训练,无知到这种地步,世所罕见,我来告诉大家:deepseek可以用一切非英伟达的芯片进行训练,不信你去问deepseek,他会告诉你详细答案","text":"我讲实话,你的嘴硬程度,已经超过了我的想象,麻烦你发帖之前,问问deepseek自己,他能不能用其他芯片训练,无知到这种地步,世所罕见,我来告诉大家:deepseek可以用一切非英伟达的芯片进行训练,不信你去问deepseek,他会告诉你详细答案","html":"我讲实话,你的嘴硬程度,已经超过了我的想象,麻烦你发帖之前,问问deepseek自己,他能不能用其他芯片训练,无知到这种地步,世所罕见,我来告诉大家:deepseek可以用一切非英伟达的芯片进行训练,不信你去问deepseek,他会告诉你详细答案"}],"imageCount":0,"langContent":"CN","totalScore":0},{"id":399784306561088,"gmtCreate":1738626322303,"gmtModify":1738627293710,"author":{"id":"4092979624733190","authorId":"4092979624733190","name":"石头DE","avatar":"https://static.tigerbbs.com/8187c1a3b4e51494cd25faa064cbeac1","crmLevel":8,"crmLevelSwitch":0,"followedFlag":false,"idStr":"4092979624733190","authorIdStr":"4092979624733190"},"themes":[],"htmlText":"<a href=\"https://laohu8.com/S/AAPL\">$苹果(AAPL)$ </a> 营收虽然稳定,但是没有新的内容来支撑继续的高歌猛进,难不成变<a href=\"https://laohu8.com/S/TSLA\">$特斯拉(TSLA)$ </a> 一样靠故事? 估计近期会在200-250之间来回震荡。","listText":"<a href=\"https://laohu8.com/S/AAPL\">$苹果(AAPL)$ </a> 营收虽然稳定,但是没有新的内容来支撑继续的高歌猛进,难不成变<a href=\"https://laohu8.com/S/TSLA\">$特斯拉(TSLA)$ </a> 一样靠故事? 估计近期会在200-250之间来回震荡。","text":"$苹果(AAPL)$ 营收虽然稳定,但是没有新的内容来支撑继续的高歌猛进,难不成变$特斯拉(TSLA)$ 一样靠故事? 估计近期会在200-250之间来回震荡。","images":[{"img":"https://static.tigerbbs.com/09b4f672506cdb31a9220cf5d47b5a87","width":"1092","height":"1133"}],"top":1,"highlighted":1,"essential":1,"paper":1,"likeSize":0,"commentSize":2,"repostSize":1,"link":"https://laohu8.com/post/399784306561088","isVote":1,"tweetType":1,"viewCount":950,"authorTweetTopStatus":1,"verified":2,"comments":[{"author":{"id":"20733756400840","authorId":"20733756400840","name":"我是股神的小腿毛","avatar":"https://static.tigerbbs.com/3d2a54ec91bee908d0ce0a36809b8199","crmLevel":1,"crmLevelSwitch":0,"idStr":"20733756400840","authorIdStr":"20733756400840"},"content":"你买了啥?怎么赚这么多","text":"你买了啥?怎么赚这么多","html":"你买了啥?怎么赚这么多"}],"imageCount":1,"langContent":"CN","totalScore":0},{"id":410882051694968,"gmtCreate":1741341550765,"gmtModify":1741341557254,"author":{"id":"4092979624733190","authorId":"4092979624733190","name":"石头DE","avatar":"https://static.tigerbbs.com/8187c1a3b4e51494cd25faa064cbeac1","crmLevel":8,"crmLevelSwitch":0,"followedFlag":false,"idStr":"4092979624733190","authorIdStr":"4092979624733190"},"themes":[],"title":"盘前二月非农预测","htmlText":"尝试了一下模型化非农预测,输入数据有限,仅供参考。 输入了:新闻模型(就业相关)、政策模型(就业相关)、近期数据 结果: 历史ADP与NFP的方向同步率:71.43% 预测本次NFP数据(基于ADP误差调整):10.81 万 非农低于预期的概率:80.00% 非农高于预期的概率:20.00%","listText":"尝试了一下模型化非农预测,输入数据有限,仅供参考。 输入了:新闻模型(就业相关)、政策模型(就业相关)、近期数据 结果: 历史ADP与NFP的方向同步率:71.43% 预测本次NFP数据(基于ADP误差调整):10.81 万 非农低于预期的概率:80.00% 非农高于预期的概率:20.00%","text":"尝试了一下模型化非农预测,输入数据有限,仅供参考。 输入了:新闻模型(就业相关)、政策模型(就业相关)、近期数据 结果: 历史ADP与NFP的方向同步率:71.43% 预测本次NFP数据(基于ADP误差调整):10.81 万 非农低于预期的概率:80.00% 非农高于预期的概率:20.00%","images":[{"img":"https://static.tigerbbs.com/7fb1d4a38666d51bdcb009c2a542e178","width":"200","height":"200"}],"top":1,"highlighted":1,"essential":1,"paper":2,"likeSize":1,"commentSize":0,"repostSize":0,"link":"https://laohu8.com/post/410882051694968","isVote":1,"tweetType":1,"viewCount":380,"authorTweetTopStatus":1,"verified":2,"comments":[],"imageCount":1,"langContent":"CN","totalScore":0},{"id":399706310603232,"gmtCreate":1738624640596,"gmtModify":1738990544641,"author":{"id":"4092979624733190","authorId":"4092979624733190","name":"石头DE","avatar":"https://static.tigerbbs.com/8187c1a3b4e51494cd25faa064cbeac1","crmLevel":8,"crmLevelSwitch":0,"followedFlag":false,"idStr":"4092979624733190","authorIdStr":"4092979624733190"},"themes":[],"htmlText":"<a href=\"https://laohu8.com/S/BABA\">$阿里巴巴(BABA)$ </a> 阿里这家公司的管理经营上问题比较多,讲故事可以,长期不看好。 如果到70-80区间可以入手。获利抛的点位看个人决定。","listText":"<a href=\"https://laohu8.com/S/BABA\">$阿里巴巴(BABA)$ </a> 阿里这家公司的管理经营上问题比较多,讲故事可以,长期不看好。 如果到70-80区间可以入手。获利抛的点位看个人决定。","text":"$阿里巴巴(BABA)$ 阿里这家公司的管理经营上问题比较多,讲故事可以,长期不看好。 如果到70-80区间可以入手。获利抛的点位看个人决定。","images":[],"top":1,"highlighted":1,"essential":1,"paper":1,"likeSize":1,"commentSize":0,"repostSize":0,"link":"https://laohu8.com/post/399706310603232","isVote":1,"tweetType":1,"viewCount":339,"authorTweetTopStatus":1,"verified":2,"comments":[],"imageCount":0,"langContent":"CN","totalScore":0},{"id":402189119918520,"gmtCreate":1739209181613,"gmtModify":1739209225625,"author":{"id":"4092979624733190","authorId":"4092979624733190","name":"石头DE","avatar":"https://static.tigerbbs.com/8187c1a3b4e51494cd25faa064cbeac1","crmLevel":8,"crmLevelSwitch":0,"followedFlag":false,"idStr":"4092979624733190","authorIdStr":"4092979624733190"},"themes":[],"htmlText":"<a href=\"https://laohu8.com/S/SQQQ\">$纳指三倍做空ETF(SQQQ)$ </a> 逢低买入","listText":"<a href=\"https://laohu8.com/S/SQQQ\">$纳指三倍做空ETF(SQQQ)$ </a> 逢低买入","text":"$纳指三倍做空ETF(SQQQ)$ 逢低买入","images":[{"img":"https://static.tigerbbs.com/405c610a51192455e25d47279a205ece","width":"1092","height":"1717"}],"top":1,"highlighted":1,"essential":1,"paper":1,"likeSize":0,"commentSize":0,"repostSize":0,"link":"https://laohu8.com/post/402189119918520","isVote":1,"tweetType":1,"viewCount":344,"authorTweetTopStatus":1,"verified":2,"comments":[],"imageCount":1,"langContent":"CN","totalScore":0},{"id":401338953720440,"gmtCreate":1738990385435,"gmtModify":1739171563398,"author":{"id":"4092979624733190","authorId":"4092979624733190","name":"石头DE","avatar":"https://static.tigerbbs.com/8187c1a3b4e51494cd25faa064cbeac1","crmLevel":8,"crmLevelSwitch":0,"followedFlag":false,"idStr":"4092979624733190","authorIdStr":"4092979624733190"},"themes":[],"htmlText":"<a href=\"https://laohu8.com/S/NVDA\">$英伟达(NVDA)$ </a> <a href=\"https://laohu8.com/S/AMD\">$美国超微公司(AMD)$ </a> 来自Mirae Asset Securities Research(韩国未来资产证券)的分析称,V3的硬件效率之所以能比Meta等高出10倍,可以总结为“他们从头开始重建了一切”。在使用英伟达的H800 GPU训练DeepSeek-V3时,他们针对自己的需求把132个流式多处理器(SMs)中的20个修改成负责服务器间的通信,而不是计算任务。变相绕过了硬件对通信速度的限制。 这种操作是用英伟达的PTX(Parallel Thread Execution)语言实现的,而不是CUDA。 PTX在接近汇编语言的层级运行,允许进行细粒度的优化,如寄存器分配和Thread/Warp级别的调整。这种编程非常复杂且难以维护,所以行业通用的做法是使用CUDA这样的高级编程语言。换句话说,他们把优化做到了极致。 PTX仍然是英伟达GPU架构中的技术,它是CUDA编程模型中的中间表示,用于连接CUDA高级语言代码和GPU底层硬件指令。 在实际编译流程中,CUDA代码首先被编译为PTX代码,PTX代码再被编译为目标GPU架构的机器码(SASS, Streaming ASSembler)。CUDA起到了提供高级编程接口和工具链的作用,可以简化开发者的工作。而PTX作为中间层,充当高级语言和底层硬件之间的桥梁。 另外,这种两步编译流程也使得CUDA程序具有跨架构的兼容性和可移植性。 反过来说,像DeepSeek这种直接编写PTX代码的做法,首先不仅非常复杂,也很难移植到不同型号的GPU。有从业者表示,针对H100优化的代码迁移到其他型号上可能效果打折","listText":"<a href=\"https://laohu8.com/S/NVDA\">$英伟达(NVDA)$ </a> <a href=\"https://laohu8.com/S/AMD\">$美国超微公司(AMD)$ </a> 来自Mirae Asset Securities Research(韩国未来资产证券)的分析称,V3的硬件效率之所以能比Meta等高出10倍,可以总结为“他们从头开始重建了一切”。在使用英伟达的H800 GPU训练DeepSeek-V3时,他们针对自己的需求把132个流式多处理器(SMs)中的20个修改成负责服务器间的通信,而不是计算任务。变相绕过了硬件对通信速度的限制。 这种操作是用英伟达的PTX(Parallel Thread Execution)语言实现的,而不是CUDA。 PTX在接近汇编语言的层级运行,允许进行细粒度的优化,如寄存器分配和Thread/Warp级别的调整。这种编程非常复杂且难以维护,所以行业通用的做法是使用CUDA这样的高级编程语言。换句话说,他们把优化做到了极致。 PTX仍然是英伟达GPU架构中的技术,它是CUDA编程模型中的中间表示,用于连接CUDA高级语言代码和GPU底层硬件指令。 在实际编译流程中,CUDA代码首先被编译为PTX代码,PTX代码再被编译为目标GPU架构的机器码(SASS, Streaming ASSembler)。CUDA起到了提供高级编程接口和工具链的作用,可以简化开发者的工作。而PTX作为中间层,充当高级语言和底层硬件之间的桥梁。 另外,这种两步编译流程也使得CUDA程序具有跨架构的兼容性和可移植性。 反过来说,像DeepSeek这种直接编写PTX代码的做法,首先不仅非常复杂,也很难移植到不同型号的GPU。有从业者表示,针对H100优化的代码迁移到其他型号上可能效果打折","text":"$英伟达(NVDA)$ $美国超微公司(AMD)$ 来自Mirae Asset Securities Research(韩国未来资产证券)的分析称,V3的硬件效率之所以能比Meta等高出10倍,可以总结为“他们从头开始重建了一切”。在使用英伟达的H800 GPU训练DeepSeek-V3时,他们针对自己的需求把132个流式多处理器(SMs)中的20个修改成负责服务器间的通信,而不是计算任务。变相绕过了硬件对通信速度的限制。 这种操作是用英伟达的PTX(Parallel Thread Execution)语言实现的,而不是CUDA。 PTX在接近汇编语言的层级运行,允许进行细粒度的优化,如寄存器分配和Thread/Warp级别的调整。这种编程非常复杂且难以维护,所以行业通用的做法是使用CUDA这样的高级编程语言。换句话说,他们把优化做到了极致。 PTX仍然是英伟达GPU架构中的技术,它是CUDA编程模型中的中间表示,用于连接CUDA高级语言代码和GPU底层硬件指令。 在实际编译流程中,CUDA代码首先被编译为PTX代码,PTX代码再被编译为目标GPU架构的机器码(SASS, Streaming ASSembler)。CUDA起到了提供高级编程接口和工具链的作用,可以简化开发者的工作。而PTX作为中间层,充当高级语言和底层硬件之间的桥梁。 另外,这种两步编译流程也使得CUDA程序具有跨架构的兼容性和可移植性。 反过来说,像DeepSeek这种直接编写PTX代码的做法,首先不仅非常复杂,也很难移植到不同型号的GPU。有从业者表示,针对H100优化的代码迁移到其他型号上可能效果打折","images":[],"top":1,"highlighted":1,"essential":1,"paper":1,"likeSize":0,"commentSize":0,"repostSize":0,"link":"https://laohu8.com/post/401338953720440","isVote":1,"tweetType":1,"viewCount":3000,"authorTweetTopStatus":1,"verified":2,"comments":[],"imageCount":0,"langContent":"CN","totalScore":0}],"lives":[]}