在AIGC 的浪潮中,对已有图片做编辑的图像编辑(image editing)技术受到了越来越多的关注。图像编辑(image editing)的原子操作包括增、删、改。 「增」是指在图像中添加元素,该研究方向叫做图像合成(image composition) 「删」是指从图像中擦除元素,该研究方向叫…
AI的风刮了两年,哪些产品胜出了? 两年前,ChatGPT爆火,掀起全球范围内的大模型开发热潮。国内大厂和创业公司纷纷入场,试图在AIGC时代占据一席之地。 如今,各家的产品都已铺开落地,和各行各业紧密结合。有数据显示,中国AI原生应用已经拥有了1.2亿月活跃用户。一大批已经习惯使用AI的人,率先…
试水AI陪伴,存在技术难度高、成本高、效果难保障等痛点。 生成式 AI正在以前所未有的速度重新定义人与机器的互动。 2023年,AI陪伴开始走进日常生活,2024年,便已经不再局限文本交流,而是以数字人化身的形式出现,并实现实时语音对话。两年时间里,不管是用户规模,还是商业收入,或是技术能力,AI陪…
一鱼多吃的妙处。 之前还是一个小透明,现在立马变成下一个 ChatGPT。 它是谷歌目前最成功的 AIGC 产品。 很多人喜欢在它前面再加一个形容词,「像病毒一样( a viral AI product)」。前特斯拉自动驾驶负责人、前 OpenAI 科学家 Andrej Karpathy 毫不掩饰对…
技术到头了吗?远远没有 本期AGI路线图中关键节点:DiT架构、Stable Diffusion 3.0、Flux.1、ControlNet、1024×1024分辨率、医学影像、英伟达Eagle模型、谷歌Med-Gemini系列模型、GPT-4o端到端、Meta Transfusion模型。 得益于…
视频生成模型大乱斗。 今年2月OpenAI通过Sora的发布,为AI视频生成明确了依靠DiT(Difffusion Transfomer)架构获得突破的技术路径。随后,快手、阿里巴巴、字节跳动、美图、生数科技、智谱AI、MiniMax纷纷入局其中,持续提升着AI视频生成的赛道热度。 9月,国产视频生…
2023年,有两波力量,同时涌向AI风口。 第一波力量是光鲜的、显眼的。你能轻而易举地在“世界人工智能大会”之类的高档展会中找到这群人:名校出身、文章发顶级期刊、有海外经历。 他们的对话中常常出现的,是“AGI(通用人工智能)”“超越OpenAI”“Killer App(杀手级应用)”之类的宏大话题…
由人的工具变成“隔离人”的工具 人与人之间的工作生活交流,AI场景越来越多。 “参加了四五次面试,连真人面试官的影子还都没看到”,一位参加秋招的应届生源源向AI鲸选社吐槽到。 她八月底开始准备秋招,看了无数攻略,准备了半个月的简历投出去,却只收到了几家公司的回信,但令人无奈的是,接到的都是AI面试。…
AI大模型技术商业化探索与竞争加剧。 从业者们从技术浪漫到商业务实的心态转变,正不断推高大模型市场竞争的激烈程度。 焦虑裹挟中,国内AI大模型圈正不断加速。 融资速度,率先成为最显性的角逐点。大模型需要消耗大量算力和资源,于是资金成了入场券。 2024年以来,每隔一段时间,就会传出大模型公司拿到新融…
风平智能获AI数字人赛道的最大笔融资 风平智能(Fullpeace)近日宣布完成了近亿元人民币的A轮系列融资。该轮融资由璀璨者资本和华为系企业家华鲲资本基金领投,汇财资本和北京大学人工智能创新中心主任雷鸣等一众老股东也全数跟投。 这是当前国内AI数字人行业的最大笔融资,也是对风平智能五年来在AI大模…