上海人工智能实验室发布了我国首个种业大语言模型“丰登”

时间：2024-04-30 18:38 作者：admin 来源：东方广播网返回首页

　　上海人工智能实验室、崖州湾国家实验室和中国农业大学合作发布了一种全新的种业大语言模型——“丰登”(SeedLLM)，标志着我国在农业领域的人工智能研究迈出了重要一步。这款模型是在上海人工智能实验室自主研发的大语言模型“书生·浦语”2.0基础上训练的，使用了大量来自科技文献、产业实践报告等海量专业数据，具备强大的理解和分析能力。“丰登”大语言模型的发布，有望大幅降低育种领域的学习门槛，提升从业人员的科研和实践效率。它可以帮助人们更快速、准确地获取和分析育种领域的信息，为农业生产提供重要的科技支撑，为“人工智能+生物育种”探索提供了新的路径。

　　科研团队介绍，科学高效的生物育种对粮食安全和经济效益意义重大，但由于作物和畜类品种的多样性，育种信息一直缺乏统一的平台，数据知识呈现出“孤岛式”分布，给育种知识普及造成了壁垒。同时，生物育种涉及生物学、遗传学、气象学、土壤学等多学科交叉，专业人员在从事育种工作时不得不查阅众多领域的文献和数据，甚至需要编写代码进行数据访问，工作效率受到很大限制。为了解决这些问题，我们研发了一种全新的生物育种信息平台，旨在提供一个多学科交叉、共享、互惠的平台，以便于科研人员更高效地获取和使用育种信息。该平台将各种育种信息资源整合在一起，为用户提供了一个集成化的数据资源库，包括基因型、表现型、育种价值等多种数据类型，用户可以轻松地搜索和使用这些数据，以便于进行遗传图谱构建、品种选育、遗传病诊断等领域的研究。

　　为此，上海人工智能实验室联合团队提出了大模型赋能生物育种这一思路，把“丰登”训练成具有“AI研究员”潜力的大模型。它可通过自主学习，发掘生物、遗传、气象和土壤间的复杂关联，形成新的知识结构。育种领域涉及的知识资源包含学术文献、田间日志和政府公示等，呈分散状态。针对这种情况，科研人员对相关知识进行了深度挖掘，将文本信息中提炼出的知识汇聚到模型权重中，再将分散在不同文献中的同一知识点进行整合归纳，最终使育种专业知识以结构化的方式呈现。

　　经联合攻关，这个大模型已具备品种选育、农艺性状、栽培技术、推广区域等4个领域的解释和回答能力。它采用自然语言对话接口，用户可直接提出问题，并获得易于理解的信息。

　　种业领域的标准化人工评估评测显示，这个大模型在最佳答案个数和综合分数上的表现超出预期，超越了业界公认的高性能大模型Claude 3和GPT-4.其综合得分是相关专业本科生的4.87倍。大模型在种业领域的人工评估评测中表现优异，其综合得分远超过业界公认的高性能模型Claude 3和GPT-4.此外，大模型在最佳答案个数和综合分数上均表现出众，超过了相关专业本科生的水平。这一卓越的表现使得大模型在种业领域中得到了广泛的应用和关注。目前，隆平高科、正大集团、中国科学院、中国农业科学院、上海市农业科学院、广东省农业科学院、华中农业大学、华南农业大学、复旦大学等单位和机构已加入了“丰登”测试，以评估和比较不同模型的性能和表现。通过这次测试，大模型在评估中表现突出，证明了其在该领域中的高效性和可靠性。

声明：本网站所提供的信息仅供参考之用,并不代表本网赞同其观点，也不代表本网对其真实性负责。您若对该稿件内容有任何疑问或质疑，或内容、图片侵犯了您的合法权益，请尽快与我公司联系，本网将迅速给您回应并做相关处理。联系方式:284598818@qq.com

上一篇：第六届上海国际兰展将展出200余种（含品种）、2万余株兰花

下一篇：上海公安机关在全市范围组织开展第九次集中清查整治行动