9月9日在WAVE SUMMIT深度学习开发者大会2025上百度正式发布文心大模型X1.1深度思考模型。文心大模型X1是基于文心大模型4.5训练而来的深度思考模型升级后的X1.1主要采用了迭代式混合强化学习训练框架一方面通过混合强化学习同时提升通用任务和智能体任务的效果;另一方面通过自蒸馏数据的迭代式生产及训练不断提升模型整体效果。相比文心X1X1.1的事实性提升34.8%指令遵循提升12.5%...
网页链接9月9日在WAVE SUMMIT深度学习开发者大会2025上百度正式发布文心大模型X1.1深度思考模型。文心大模型X1是基于文心大模型4.5训练而来的深度思考模型升级后的X1.1主要采用了迭代式混合强化学习训练框架一方面通过混合强化学习同时提升通用任务和智能体任务的效果;另一方面通过自蒸馏数据的迭代式生产及训练不断提升模型整体效果。相比文心X1X1.1的事实性提升34.8%指令遵循提升12.5%...
网页链接
精彩评论