谢邀, 很高兴和大家分享Kimi智能体(Agent)首个产品Kimi Researcher背后的一些技术思考。
Kimi-Researcher,是一个人类最后一场考试(Humanity’s Last Exam)达到SOTA 26.9%、可生成万字追溯报告的模型Agent,也是我们用端到端强化学习(RL)从0到1打磨出来的首个大模型Agent产品。
我们构建Kimi-Researcher的核心理念是:我们并非在搭建一个“搜索工具”,而是在训练一个真正会“做研究”的AI Agent。
为了实现这一点,我们…。
Copyright © 2012-2023 某某博客 版权所有 TEL: 400-123-4567
地址:广东省广州市天河区88号 邮箱:admin@admin.com