不只GPT-4o,原来所有大模型都在讨好人类!上个月,GPT-4o更新后化身马屁精引来一片差评,吓得OpenAI赶紧回退到了之前的版本。而最新研究表明,GPT-4o绝非个例,实际上每个大语言模型都存在一定程度的谄媚。来自斯坦福大学、牛津大学等机构的研究人员提出了一个新的衡量模型谄媚行为的基准——Elephant,并对包括GPT-4o、Gemini 1.5 Flash、Claude Sonnet ...
网页链接不只GPT-4o,原来所有大模型都在讨好人类!上个月,GPT-4o更新后化身马屁精引来一片差评,吓得OpenAI赶紧回退到了之前的版本。而最新研究表明,GPT-4o绝非个例,实际上每个大语言模型都存在一定程度的谄媚。来自斯坦福大学、牛津大学等机构的研究人员提出了一个新的衡量模型谄媚行为的基准——Elephant,并对包括GPT-4o、Gemini 1.5 Flash、Claude Sonnet ...
网页链接
精彩评论