AInno-75B正式亮相,AI在视觉识别和工业设计领域的应用范围进一步拓宽。

Chat GPT、Sora、Suno等AI技术的接连问世,让人类社会经历了一场认知的革命。世人开始意识到,AI不仅是单一的工具本身,更是推动人类文明进步的新引擎。在这个数据驱动、智能互联的时代,我们不禁发问:当AI的触角延伸到工业的每一个角落,它将如何重塑工业的未来?

3月27日,“AI+制造”第一股创新奇智(2121.HK)率先给出答案。在北京举办的「智领工业未来—奇智孔明工业大模型升级发布会暨大模型技术应用研讨」活动上,奇智孔明工业大模型2.0版本(AInno-75B)正式面世,多款大模型原生应用一并亮相。

OpenAI在论文《Scaling Laws for Neural Language Models》中提出了Scaling Laws这一规律。根据Scaling Laws,随着模型规模的增大,模型的能力也会相应增强。目前,业界已经形成共识,即参数的提升可以让模型性能得到提升。

去年9月,创新奇智就发布了超过150亿参数量的工业大模型 AInno-15B。经过半年努力,本次升级后的奇智孔明工业大模型AInno-75B,重点在于引入了多模态大模型能力。与AInno-15B相比,AInno-75B在规模和性能上都有显著进步。

创新奇智CTO张发恩对此解释道,升级后的多模态大模型支持各种各样的模态,例如文本、图片、视频甚至工业场景中的单独模态(如CAD、EEG),能够输出文本、图片、视频、CAD或者actions。

工业大模型也能图片、视频、CAD一键生成?「创新奇智」给出新思路

创新奇智CTO 张发恩

ChatVision:AI视觉识别的新篇章

基于AInno-75B模型和服务引擎的诸多ChatX应用中,ChatVision是本次发布会的首款主打产品,也是瞄准企业安全生产领域推出的创新应用。

众所周知,在工业安全监管中,实时监控和图像分析发挥着至关重要的作用。通过实时捕捉和分析图像数据,监管人员能够及时发现潜在的安全隐患,预防事故发生,从而保障工人的生命安全和工厂的稳定运行。

不过,传统的监控模式中往往存在效率低下(大量数据需要人为翻查)、滞后分析(出事了才调度相应片段)等缺点。针对这些漏洞,ChatVision基于AInno-75B工业大模型,能够对视频流、视频文件、图片文件等进行交互式智能分析,及时理解、识别监测画面中的安全漏洞,并将违规信息发送给管理员,或是触发报警系统。

现场DEMO效果演示环节,36氪观察到,ChatVision能够分析并准确理解“仔细观察当前画面,告诉我这可能是个什么地方”的综合性指令,也能响应“找出画面中的电源插座”,“找出白色的安全帽”等小目标识别指令。

这两个指令看似简单,但是在过去,每个细微识别都需要相应的算法工程师进行开发、调试、部署小模型,且由于一旦部署后无法更改(是静态的),存在成本居高不下、开发周期较长等问题。如今,结合最新的大模型技术,其泛化能力、自学习能力都有了质的提升。“面对一个新的场景可以快速做检测,而且小插座这种小目标识别效果也很好。”技术副总裁郭江亮补充道。

至于更为复杂的高密度指令,ChatVision表现如何?

当现场的画面中出现有人摘下工帽玩手机、未按要求穿着安全衣等违反安全规则的行为时,对ChatVision输入“请仔细分析这个画面,如果有违规的地方,发邮件给管理员”后,便开始进行理解,同时调用后台安全监测技能进行识别;而后将标出来的违规之处进行截图,且将发送邮件发送至管理员处。这一系列操作,充分体现了工业大模型任务自动规划的智能化编排能力。

工业大模型也能图片、视频、CAD一键生成?「创新奇智」给出新思路

图:ChatVision对“未戴安全帽”的目标进行监测

工业大模型也能图片、视频、CAD一键生成?「创新奇智」给出新思路

图:进行画面解析后,ChatVision发送邮件发送至管理员处

36氪在现场了解到,过去几年中,创新奇智的研发团队积累了超过200项视觉算法和模型资产,“发现企业安全领域市场需求依然广泛”。如今,有了工业大模型以后,团队不仅可以通过大模型的智能编排能力充分利用已有的模型资产,还能充分发挥ChatVision的多模态能力,在企业安全领域带来更多易于操作的解决方案。

ChatVision的出现意味着,未来在工业企业的生产车间中,管理者想知道生产过程是否合规、合理,都可以通过视频进行理解,在风险的源头环节进行有效干预。

国机集团中国中元公司经营总负责人王先看完创新奇智发布的工业大模型产品之后坦言:“这让我产生了危机意识,因为这些产品是可以真正落地在制造业的。在工程领域,安全是大于一切的。我们总包商通常必须对施工现场进行安全培训和安全交底,但很难做到现场安全隐患的实时排查。创新奇智发布的ChatVision给工程承包、工程监理业务带来很大的帮助,在应用层面上具备很强的落地可能。”

ChatCAD:AI与工业设计的融合 

DALL-E、Stable Diffusion、Midjourney等面向C端的大模型让人们意识到文生图片的魅力。在B端,大模型同样开始在图片生成领域崭露头角。

计算机辅助设计(CAD)软件市场是工业软件领域的重要组成部分,不仅涉及到产品设计的创新和优化,还与生产流程的效率和质量控制紧密相关。在产业链上游,CAD软件为技术服务行业、业务推广服务行业、其他软件开发行业以及硬件设备行业提供了关键支持。长期以来,中国的CAD软件市场受到国外厂商主导,然而,国外CAD软件通常具有复杂的用户界面和较高的使用门槛。

针对这个局面,创新奇智将工业大模型技术引入工业设计领域,推出自主可控的Text-to-CAD类应用—“ChatCAD生成式辅助工业设计”。通过简单的对话问答形式,ChatCAD便能迅速理解设计师的创意意图,并自动生成符合要求的工业设计图,还支持导出到传统工业设计软件进行手动微调。

具体到使用体验上,ChatCAD也带来了诸多惊喜。

一是全新的交互体验。在传统的CAD软件使用过程中,设计师的工作通常为枯燥而繁复的手绘,或是使用鼠标作图;眼下,设计师只需对ChatCAD说出需求,就能一键生成设计图纸。

工业大模型也能图片、视频、CAD一键生成?「创新奇智」给出新思路

图:ChatCAD正在生成设计图

二是能够智能理解使用者的需求,包括具体的工业部件和相应参数。例如对软件下达“帮我设计一个工业滑轮,参数如下:滑轮半径为6,厚度为5,滑轮边缘向外突出0.8,突出部分厚度为0.5,滑轮中心轴高度为5,半径为4”的复杂指令,便能生成一个完全符合参数要求的工业滑轮。

三是生成专业的CAD设计结果。例如需要对上文的滑轮进行细节优化时,ChatCAD也能够对边缘突出部分等细微处进行符合施工要求的修改。

四是兼容传统CAD软件。“打个比方,也许之前他自己画需要十个小时,还需要经常翻箱倒柜找过往画过的东西,我们希望他十个小时减成一个小时,生成90%完成度的东西,剩下的10%再做一下优化。”张发恩强调,ChatCAD的目标不是替代所有的设计院的工程师,而是当他们最佳的助手。同时,其不仅能够自由导出设计结果,更重要的是,导出的设计图能够兼容传统CAD软件,便于后续的修改和优化(例如可以到SolidWorks中进一步编辑)。

技术思路方面,张发恩提到了谷歌不久前发布的Alpha Geometry——这款应用将大型机器学习模型应用于解决数学奥林匹克竞赛中的几何问题。“ChatCAD的原理是类似的。”正如Alpha Geometry的推出标志着AI在数学领域的应用迈出了重要一步,本次ChatCAD的亮相,亦是AI在工业设计领域落地创新的象征性事件之一。

张发恩透露,本次亮相的ChatCAD是0.1版本的产品。同时,据初步调研,创新奇智也是全球范围内率先进行这一产品创新的企业。 

聚焦工业,创新奇智的“AI+制造”战略

无论ChatVision还是ChatCAD,其研发初心均是源于来自客户普遍性的诉求。那么,“AI+制造”的商业化能力如何,能成为创新奇智的“底气”吗?我们不妨从财报中一探究竟。

3月28日,创新奇智对外公布了2023年度业绩报告。

首先是整体增速方面。年报显示,集团2023年总营收达17.51亿元,同比增长12.4%,毛利额达5.88亿元,同比增长16.1%;毛利率达到33.6%,相较去年同期提高1个百分点。经调整净亏损1.54亿,经调整净亏损率持续缩窄至8.8%;经营活动所用现金净额较上一财年显著进步,同比大幅改善40.7%。

毛利额的提升意味着集团在提升产品与服务价值的同时,也在有效控制成本,从而增加了利润空间;结合毛利率的改善,也说明了盈利效率的进步。

至于AI公司普遍绕不过的亏损难题,创新奇智的表现也可圈可点。年报显示,尽管公司目前仍处于经调整后的净亏损状态,但净亏损额为1.54亿元,亏损率已经连续缩窄至8.8%。

现金流的显著改善也是这份报告中的亮点之一。数据表明,集团2023年经营活动所用现金净额同比大幅改善了40.7%。结合来看,亏损面持续收窄的同时,现金流更为健康,都为日常运营和未来的扩张提供了坚实的资金支持。

值得注意的是,这份年报中还披露,创新奇智2018年至2023年的复合年增长率为116.0%,在近五个年度保持持续增长。这一趋势表明,公司正在通过优化财务模型和业务结构,稳步迈向盈利。

整体而言,创新奇智的2023年“成绩单”基本算得上稳中求进,且朝着健康的方向发展。

客户端的反馈也传递出一些市场态度。

年报显示,创新奇智在2023年服务的客户数量达到了397家,同比增加36.0%。具体到客户类型,在制造业领域,相关客户为集团带来的营收占比高达67.2%。

“AI+制造”的业务板块是体现集团发展趋势的重要依据。从年报来看,聚焦专精特新领域,2023年创新奇智在“AI+制造”业务板块的收入达到了11.76亿元,同比增长24.1%。“AI+制造”占整体营收比例进一步提升至67.2%,同比大幅提升6.3个百分点。

这是集团长期努力的结果。把时间线往回拉到2018年,彼时,以“四小龙”为首的一众AI创业公司普遍将安防和金融领域视为兵家必争之地;而创新奇智在创立之时就将目光锁定B端的AI业务,并把重点聚焦在“AI+制造”领域,显得有些“另辟蹊径”。如今,从制造业客户端取得的效益看来,这一决策无疑是适合集团发展的可持续方向。

以上种种向好的财务指标表明,在“AI+制造”的战略部署下,集团正在逐步改善财务状况,经营效率处于提高状态。

无疑,在工业领域,AI技术将在设计创新、生产优化、质量控制等多个环节发挥关键作用。以本次发布会为起点,随着ChatCAD和ChatVision等AI工具的不断升级和完善,未来的工业生产将更加智能化、自动化和个性化。下一阶段,“AI+制造”会如何改写创新奇智,甚至是工业智能化的未来?值得市场期待。 

本文文章来自36氪,由「蚩梦」原创出品

关联网址

关联标签

文章目录

发评论,每天都得现金奖励!超多礼品等你来拿

后,在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则
暂无评论...