您现在的位置:东方在线 正文

近期,上海人工智能实验室宣布,其研发的“书生·浦语”大模型已面向社会用户开放。在此大模型平台上,实验室还推出了全新研发的强推理模型——InternThinker,也被称为“书生思想者”。该模型具备出色的长时思维能力,能够在推理过程中进行自我反思和及时纠错,这使得它在处理数学问题、代码编写以及复杂推理谜题等多种需要高度推理能力的任务上,能够展现出更为卓越的表现和更优的解题效果。

据相关介绍,上海人工智能实验室致力于强推理模型的原创性研究,并成功探索出一条构建高质量思维链的高效途径。在训练数据方面,实验室在国内率先研发出大规模合成数据技术,这一技术的应用大大提升了模型的训练效果。在任务场景方面,InternThinker模型在数学、代码编写、推理谜题等多个领域均表现出卓越的推理能力,并且具备良好的任务泛化性,能够适应不同的应用场景。

实验室研发团队采用了更接近人类学习方式的路径,设计了一系列“元动作”来引导模型解决问题的过程,如对问题的理解、知识回忆、规划、执行、反思、总结等。InternThinker在面对复杂任务时,会动态地选择“元动作”,再进一步展开相关动作的具体思维过程。

此外,研究团队深入探索,专门为专业领域任务打造了一个超大规模的模拟沙盒环境。这一环境旨在为那些需要可形式化验证的推理任务提供强有力的反馈信号。通过运用自动化专家模型和先进的协同人机策略等多种技术手段,他们成功构建了超过50种各具特色的逻辑思维方式,用以模拟推理任务的思考过程。这些多样化推理任务的执行能力,已经被巧妙地整合进了InternThinker系统中,从而极大地提升了其在专业任务执行方面的综合能力。

责任编辑:admin

免责声明: 转载目的在于传递更多信息,文章版权归原作者所有,内容为作者个人观点。本站只提供参考并不构成任何投资及应用建议。如涉及作品内容或其它问题,请在30日内与工作人员联系(18731251601),我们将第一时间与您协商。谢谢支持!

进入新闻频道新闻推荐
商讯新闻商讯新闻
新闻快讯新闻快讯