性能与效率兼顾，阿里通义千问320亿参数Qwen1.5-32B模型亮相_老虎社区_美港股上老虎 - 老虎社区

点赞
评论
收藏

性能与效率兼顾，阿里通义千问320亿参数Qwen1.5-32B模型亮相

美股研究社
2024-04-08

美股研究社讯，4月7日,阿里通义千问继上线了5亿、18亿、40亿、70亿、140亿和720亿参数大语言模型后,又开源了一款320亿参数的Qwen1.5-32B模型。这款新模型在性能、效率和内存占用之间实现了更加理想的平衡。

通义千问表示,尽管现有的SOTA模型如Qwen1.5-72B和DBRX等性能卓越,但仍存在内存消耗大、推理速度慢、微调成本高等问题。而当前参数量约300亿的模型很受用户青睐。他们针对这一需求,精心研发了Qwen1.5-32B-Base及Qwen1.5-32B-Chat两款模型。

Qwen1.5-32B-Base模型的性能对标了目前最先进的30B模型水平。Qwen1.5-32B-Chat则在对齐方面(特别是RLHF)有所突破,对话能力提升。相较72B模型,32B系列内存占用显著下降,运行速度明显加快。阿里希望32B模型能帮助用户获得更优的下游应用解决方案。

在基础能力测评中,Qwen1.5-32B展现出颇具竞争力的水平,虽略逊于72B模型,但优于其他30B级别模型。在Chat模型测试中,32B-Chat模型得分超过8分,与72B模型仅有小幅差距。多语言评测也显示,32B具备出色的多语种能力。此外,32B-Chat在长文本场景中也有优异表现。

目前，用户可通过魔搭社区ModelScope、Hugging Face等渠道体验Qwen1.5-32B模型。阿里同时提供了相关的安装部署教程及技术博客,指导用户在不同框架上使用该模型。

免责声明：上述内容仅代表发帖人个人观点，不构成本平台的任何投资建议。

点赞

举报

评论

推荐
最新

empty

暂无评论

热议股票

{"i18n":{"language":"zh_CN"},"data":{"magic":2,"id":293026172219600,"tweetId":"293026172219600","gmtCreate":1712559125265,"gmtModify":1712559808093,"author":{"id":3503452965237041,"idStr":"3503452965237041","authorId":3503452965237041,"authorIdStr":"3503452965237041","name":"美股研究社","avatar":"https://static.tigerbbs.com/a239c7906133df1f3817d0746a8a0ba1","vip":6,"userType":6,"introduction":"玩赚美股最好的资讯平台,你想要的美股行情、热点都在这里！","boolIsFan":false,"boolIsHead":false,"crmLevel":1,"crmLevelSwitch":0,"individualDisplayBadges":[],"wearingBadges":[],"fanSize":59167,"starInvestorFlag":false},"themes":[],"images":[{"img":"https://static.tigerbbs.com/a7098b80aeafdb216862a3240f8a616a","width":"1080","height":"826"}],"coverImages":[{"img":"https://static.tigerbbs.com/a7098b80aeafdb216862a3240f8a616a","width":"1080","height":"826"}],"title":"性能与效率兼顾，阿里通义千问320亿参数Qwen1.5-32B模型亮相","html":"<html><head></head><body><p>美股研究社讯，4月7日,阿里通义千问继上线了5亿、18亿、40亿、70亿、140亿和720亿参数大语言模型后,又开源了一款320亿参数的Qwen1.5-32B模型。这款新模型在性能、效率和内存占用之间实现了更加理想的平衡。</p>\n<p>通义千问表示,尽管现有的SOTA模型如Qwen1.5-72B和DBRX等性能卓越,但仍存在内存消耗大、推理速度慢、微调成本高等问题。而当前参数量约300亿的模型很受用户青睐。他们针对这一需求,精心研发了Qwen1.5-32B-Base及Qwen1.5-32B-Chat两款模型。</p>\n<p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/a7098b80aeafdb216862a3240f8a616a\" tg-width=\"1080\" tg-height=\"826\"></p>\n<p>Qwen1.5-32B-Base模型的性能对标了目前最先进的30B模型水平。Qwen1.5-32B-Chat则在对齐方面(特别是RLHF)有所突破,对话能力提升。相较72B模型,32B系列内存占用显著下降,运行速度明显加快。阿里希望32B模型能帮助用户获得更优的下游应用解决方案。</p>\n<p>在基础能力测评中,Qwen1.5-32B展现出颇具竞争力的水平,虽略逊于72B模型,但优于其他30B级别模型。在Chat模型测试中,32B-Chat模型得分超过8分,与72B模型仅有小幅差距。多语言评测也显示,32B具备出色的多语种能力。此外,32B-Chat在长文本场景中也有优异表现。</p>\n<p>目前，用户可通过魔搭社区ModelScope、Hugging Face等渠道体验Qwen1.5-32B模型。阿里同时提供了相关的安装部署教程及技术博客,指导用户在不同框架上使用该模型。</p>\n<p></p></body></html>","htmlText":"<html><head></head><body><p>美股研究社讯，4月7日,阿里通义千问继上线了5亿、18亿、40亿、70亿、140亿和720亿参数大语言模型后,又开源了一款320亿参数的Qwen1.5-32B模型。这款新模型在性能、效率和内存占用之间实现了更加理想的平衡。</p>\n<p>通义千问表示,尽管现有的SOTA模型如Qwen1.5-72B和DBRX等性能卓越,但仍存在内存消耗大、推理速度慢、微调成本高等问题。而当前参数量约300亿的模型很受用户青睐。他们针对这一需求,精心研发了Qwen1.5-32B-Base及Qwen1.5-32B-Chat两款模型。</p>\n<p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/a7098b80aeafdb216862a3240f8a616a\" tg-width=\"1080\" tg-height=\"826\"></p>\n<p>Qwen1.5-32B-Base模型的性能对标了目前最先进的30B模型水平。Qwen1.5-32B-Chat则在对齐方面(特别是RLHF)有所突破,对话能力提升。相较72B模型,32B系列内存占用显著下降,运行速度明显加快。阿里希望32B模型能帮助用户获得更优的下游应用解决方案。</p>\n<p>在基础能力测评中,Qwen1.5-32B展现出颇具竞争力的水平,虽略逊于72B模型,但优于其他30B级别模型。在Chat模型测试中,32B-Chat模型得分超过8分,与72B模型仅有小幅差距。多语言评测也显示,32B具备出色的多语种能力。此外,32B-Chat在长文本场景中也有优异表现。</p>\n<p>目前，用户可通过魔搭社区ModelScope、Hugging Face等渠道体验Qwen1.5-32B模型。阿里同时提供了相关的安装部署教程及技术博客,指导用户在不同框架上使用该模型。</p>\n<p></p></body></html>","text":"美股研究社讯，4月7日,阿里通义千问继上线了5亿、18亿、40亿、70亿、140亿和720亿参数大语言模型后,又开源了一款320亿参数的Qwen1.5-32B模型。这款新模型在性能、效率和内存占用之间实现了更加理想的平衡。 通义千问表示,尽管现有的SOTA模型如Qwen1.5-72B和DBRX等性能卓越,但仍存在内存消耗大、推理速度慢、微调成本高等问题。而当前参数量约300亿的模型很受用户青睐。他们针对这一需求,精心研发了Qwen1.5-32B-Base及Qwen1.5-32B-Chat两款模型。 Qwen1.5-32B-Base模型的性能对标了目前最先进的30B模型水平。Qwen1.5-32B-Chat则在对齐方面(特别是RLHF)有所突破,对话能力提升。相较72B模型,32B系列内存占用显著下降,运行速度明显加快。阿里希望32B模型能帮助用户获得更优的下游应用解决方案。 在基础能力测评中,Qwen1.5-32B展现出颇具竞争力的水平,虽略逊于72B模型,但优于其他30B级别模型。在Chat模型测试中,32B-Chat模型得分超过8分,与72B模型仅有小幅差距。多语言评测也显示,32B具备出色的多语种能力。此外,32B-Chat在长文本场景中也有优异表现。 目前，用户可通过魔搭社区ModelScope、Hugging Face等渠道体验Qwen1.5-32B模型。阿里同时提供了相关的安装部署教程及技术博客,指导用户在不同框架上使用该模型。","highlighted":1,"essential":1,"paper":2,"likeSize":0,"commentSize":0,"repostSize":0,"favoriteSize":0,"link":"https://laohu8.com/post/293026172219600","repostId":0,"isVote":1,"tweetType":1,"viewCount":5082,"commentLimit":10,"likeStatus":false,"favoriteStatus":false,"reportStatus":false,"symbols":[],"verified":2,"subType":0,"readableState":1,"langContent":"CN","currentLanguage":"CN","warmUpFlag":false,"orderFlag":false,"shareable":true,"causeOfNotShareable":"","featuresForAnalytics":[],"commentAndTweetFlag":false,"andRepostAutoSelectedFlag":false,"upFlag":false,"length":1000,"xxTargetLangEnum":"ZH_CN"},"commentList":[],"hasMoreComment":false,"orderType":2}