专注具身智能大模型研发

2023年以来,具身智能一直是备受瞩目的热门话题。

在若愚科技CEO孙腾看来,机器人是大模型最理想的落地载体和应用平台,大模型的引入彻底改变了机器人仅能在单一场景下执行单一任务的困境,使机器人智能化水平显著提升,变得更聪明,能够承担更复杂的任务。

目前部分机器人公司会选择将外部大模型(比如调用Chatgpt)直接加载在机器人上,然而,这些大模型并没有针对机器人具身智能使用特定机器人相关数据进行训练,可能导致大模型对机器人执行代码与外部环境不适配,从而降低指令分解能力和执行成功率。同时,云端加载的大模型也会带来时延的问题,制约了基于大模型驱动的多型机器人的域适应能力。

若愚科技致力于通用机器人大脑的研究,并期望与工业机械臂、服务机器人等机器人厂商合作,提供先进的机器人大脑产品。

若愚科技的基于多模态大模型的通用机器人大脑研究主要聚焦在两个方向:一是负责感知层面的感知模型,二是控制层面的控制模型。感知模型通过语音交互、视觉信息传感器信号提取等方式获取外部环境信息;控制模型则在感知环境后将接收到的诉求转化成机器人可操作、可执行的控制指令,如指令拆解、代码生成等控制层面的调优工作。

若愚科技与哈工深联合研发了语言大模型基座—立知和多模态大模型基座—九天,总参数规模达130亿,训练数据超1500B tokens, 能完成多任务、多轮对话、中英翻译、思维链、工具使用等多种类型的指令数据, 在逻辑推理、关系推理、感知能力上都能呈现出较好的效果。

基于自研的基于语言大模型和多模态大模型,若愚科技构建了多模态具身决策大模型,凭借人类世界通用知识和强大的机器人领域专有代码生成能力,实现对外部环境的深度理解和多型机器人的智能控制。在产品形式上,若愚科技为机器人厂商提供两种类型的标准化产品:一类为SDK的软件形式,加载在机器人端侧的公共机上或者本地私有化部署;另一类则是将机器人大脑与算力芯片相结合,提供软硬件一体的板卡解决方案。

若愚科技所开发的机器人大脑可直接部署在机器人体系结构内部开发端,与机器人的应用层和中间件直接沟通,通过代码自动生成的方式,降低了传统机器人厂商的开发工作量并简化了开发难度,有助于传统机器人厂商开发各种不同的应用功能。

若愚科技推出九天机器人大脑,大模型总参数规模达130亿

若愚九天机器人大脑架构

若愚科技选择将和头部服务器厂商合作,通过服务器厂商的核心需求,来覆盖不同领域的70%、80%的场景。未来,公司计划在与中长尾客户合作时,进一步增加客户需要的功能。

若愚科技已经完成130亿参数的基座模型的研发,机器人大脑架构设计、产品设计研发也颇有进展,公司正在进行面向覆盖不同领域和不同形态机器人的功能开发,预计2024年上半年完成机器人大脑的开发。

此外,公司将于2024年二季度开放免费的机器人大脑SDK,以更好地了解市场需求和推动迭代产品。

在硬件层面,若愚科技也会加强机器人领域不同形态及接口的打通,实现从数据接口执行指令到与不同硬件厂商的协同工作。

创始团队方面,若愚科技的创始团队出自哈尔滨工业大学(深圳)计算机科学与技术学院,团队拥有多媒体计算、自然语言处理、具身智能和大模型量化压缩等方向的国家级高层次人才数十位,依托深圳哈深资产经营有限公司进行科技成果转化。公司联合创始人兼CEO孙腾是人工智能专业的博士,且有着连续创业的经验。

文章来自 “ 36kr ”,作者 杨逍

关联网址

关联标签

文章目录

发评论,每天都得现金奖励!超多礼品等你来拿

后,在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则
暂无评论...