内容持续更新中
我们需要更全面和深入地共享。 开源模型正展现着它们蓬勃的生命力,不仅数量激增,性能更是愈发优秀。图灵奖获得者 Yann LeCun 也发出了这样的感叹:「开源人工智能模型正走在超越专有模型的路上。」 …
在「小搏大」这条技术发展路线上,微软一直在前进。 上个月,微软 CEO 纳德拉在 Ignite 大会上宣布自研小尺寸模型 Phi-2 将完全开源,在常识推理、语言理解和逻辑推理方面的性能显著改进。 今…
本文介绍了一个名为Alph-CLIP的框架,它在原始的接受RGB三通道输入的CLIP模型的上额外增加了一个alpha通道。在千万量级的RGBA-region的图像文本对上进行训练后,Alpha-CLI…
最近,来自南大等机构的研究人员开发了一个通用的框架,用一段音频就能让照片上的头像讲多国语言。不论是头部动作还是嘴型都非常自然,看到很多不错的 一段音频+一张照片,瞬间照片里的人就能开始讲话了。 生成的…
最近,一张美国科技大厂的薪酬表曝出,OpenAI以500万起薪领衔。初创公司给出的薪酬,竟然超过了所有大型科技公司。不过初级码农,时薪却低至85元。 顶级公司的AI工程师能挣多少钱? 最近,这张美国科…
在视频生成场景中,用 Transformer 做扩散模型的去噪骨干已经被李飞飞等研究者证明行得通。这可算得上是 Transformer 在视频生成领域取得的一项重大成功。 近日,一项视频生成研究收获了…
都快到年底了,大模型领域还在卷,今天,Microsoft发布了参数量为2.7B的Phi-2——不仅13B参数以内没有对手,甚至还能和Llama 70B掰手腕! 大模型现在真的是越来越卷了! 11月Op…
如何让 LLM “忘记” 学到的有害内容? 随着大型语言模型(LLM)的发展,从业者面临更多挑战。如何避免 LLM 产生有害回复?如何快速删除训练数据中的版权保护内容?如何减少 LLM 幻觉(hall…
计算芯片未来可能不是英伟达的专长,AMD也要来了。 12月7日,AMD在美国加州圣何塞举办的Advancing AI大会上正式揭晓了两款旗舰级AI芯片产品,分别为Instinct MI300X与MI3…
AIGC丨研究报告 核心摘要: 古人有云:日就月将,学有缉熙于光明。人类对人工智能学的潜心钻研终于再度获得重大突破,大模型的涌现能力与AIGC的应用普及为那不一定是AGI但一定更AI的未来提供了确定性…
AI对人类世界的学习能力,到目前为止仍然停留在语言层面。 喂给大模型语料——最初是维基百科和Reddit,后来扩展到音频、视觉图像甚至雷达和热图像——后者广义上说是换了种表达方式的语言。也因此有生成式…
在 AI 取代人类的危机之下,一个程序员的焦虑治愈之路。 【作者有话说】2023 年对我来说是神奇的一年,我意外地从一个程序员变成了一个 AI 资讯届的“网红”,到年底时我在 X 平台的阅读量超过 1…
LiveEO目前年收入可达数百万美元。此前,公司已获得1900万欧元的资金。 36氪获悉,AI遥感应用企业LiveEO完成1000万美元融资,由绿色科技风险投资Greencode Ventures领投…
CEO掌舵,大模型驶入“业务深水区” 没有任何一种绝对的理想主义或现实主义,在商业领域,只有仰望星空的同时脚踏实地。或许在“虚假繁荣”的技术泡沫悉数褪去后,大模型才开始真正地拥抱未来。 21世纪是否…
蚂蚁集团20篇论文入选AI顶会NeurlPS,7成论文聚焦生成式AI。 人工智能新浪潮如火如荼,中国互联网企业奋力逐浪并行。 12月10日,为期六天的全球AI顶级会议NeurlPS在美国路易斯安那州新…
幂律智能已经获得近百家互联网、制造业、连锁零售、金融、医疗等行业头部客户的认可,公司业务较去年增长超200%。 36氪获悉,近日AI法律创业公司公司「幂律智能」宣布完成近8000万元Pre-B轮融资,…
时值年末,正是各类年度总结任务集中涌来之时,也催热了AI代写业务。相比千字60元-80元的人工写作价格,AI代写只要不到30元的价格,就能“一键生成”年终总结报告。记录显示,有的店铺2小时就卖出了上百…
进入多模态时代,大模型也会操纵无人机了! 只要视觉模块捕捉到启动条件,大模型这个“大脑”就会生成动作指令,接着无人机便能迅速准确地执行。 北京航空航天大学智能无人机团队周尧明教授团队等研究人员,提出了…
由真实人脑细胞构建的“迷你大脑”和微电极组成的AI系统,已经能够进行语音识别—— 从数百个声音片段中准确认出某个特定人的声音的那种。 最近,一项颇为前沿的类脑研究登上了Nature子刊。 这个特别的A…
大模型创业,“最安全”的人来了! 吴翰清,前阿里云首席安全科学家、P10级研究员在今年5月离职阿里后,现在被曝投身AI创业。 量子位了解到,他在杭州成立了一家名为KMind的公司,年中时已经完成一轮融…
一条神秘磁力链接引爆整个AI圈,现在,正式测评结果终于来了: 首个开源MoE大模型Mixtral 8x7B,已经达到甚至超越了Llama 2 70B和GPT-3.5的水平。 (对,就是传闻中GPT-4…
Runway突然发布公告,宣称要开发通用世界模型,解决AI视频最大难题,未来要用AI模拟世界。 最近AI视频赛道的Pika 1.0大火,两位华人创始人团队半年做出的产品几乎碾压了Runway接近两年的…
UCLA等机构研发的Chameleon框架,在AI界引起广泛关注,获得超过100次学术引用,AlphaSignal评选其为「周最佳论文」。 在自然语言处理任务中取得显著成就的大型语言模型(LLMs)尽…
NeurIPS 2023杰出论文正式公布了!今年共有6篇获奖论文,斯坦福谷歌摘得「杰出论文」桂冠。此外,Ilya Sutskever、Jeff Dean团队十年前的word2vec论文获得了「时间检验…
今天,李飞飞携斯坦福联袂谷歌,用Transformer生成了逼真视频,效果媲美Gen-2比肩Pika。2023年俨然已成AI视频元年! 视频大数据时代,真的来了! 刚刚,李飞飞的斯坦福团队同谷歌合作,…
老冤家背道而驰。 ChatGPT 爆火一年,大模型的竞争走到哪一步了? 从微信指数的数据,可以管中窥豹到各家大模型的感知度,ChatGPT 遥遥领先,依然是国内大模型们追赶的对象。 而国内互联网大厂的…
如何打通物理世界和数字世界之间的屏障? 多模态 AI 正处于爆发前夜。 从 GPT-4V 的“惊艳亮相”,到 AI 视频生成工具 Pika 1.0 的“火爆出圈”,再到谷歌 Gemini 的“全面领先…
创新要靠企业家精神,躺平和企业家精神是相违背的。 图片来源|会议现场 12月9日~10日,由《中国企业家》杂志社主办的“第二十一届中国企业领袖年会”隆重举行。在12月10日举办的闭幕演讲环节,360公…
对于行业来说,这是一种负责任的态度。 披头士早前发布了一首新歌,媒体的标题几乎都带上了人工智能。The Verge的标题是,“感谢AI,披头士最后一首歌上线了”,WIRED的标题是,“多亏了彼得·杰克…
二次刷屏的妙鸭相机,“整顿”美颜市场。 “这才是真正的科技与狠活吧,闭眼照都能修好。”最近,木木迷上了“AI修脸”。 先上传至少15张照片,生成一个数字分身,随后打开AI修脸选项,上传要修的图片,就可…
Soul加快AIGC与社交场景深度融合。 近日,新型社交平台Soul正式上线自研语言大模型SoulX。作为生成式人工智能基础、核心的工具,SoulX将作为Soul “AIGC+社交”布局的重要基建,垂…
AI正成为一种隐忧? 如果评选2023年最令人着迷的新技术,那非ChatGPT莫属。从美国的硅谷、华尔街到中国的后厂村、中关村,几乎所有的科技大厂们都在讨论“生成式AI”。ChatGPT之后,几乎每周…
剑桥大学最新研究显示,AI模型和人脑神经结构有不少相似,也许未来会成为AI模型设计的关键。 人脑作为地球上最复杂的智能载体,一个最大的特点就是能高能效地产生智能。如果能尽可能按照人脑的工作原理来创建A…
由厦门大学等机构提出的全新视觉感知基础模型APE,只需一个模型外加一套参数,就能在160个测试集上取得当前SOTA或极具竞争力的结果。而且训练和推理代码以及模型权重全部开源,无需微调,开箱即用。 最近…
上周末,Mistral甩出的开源MoE大模型,震惊了整个开源社区。MoE究竟是什么?它又是如何提升了大语言模型的性能? Mistral上周末丢出的磁力链接震惊了开源圈子,这个7B×8E的开源MoE大模…
前几日,一条MoE的磁力链接引爆AI圈。刚刚出炉的基准测试中,8*7B的小模型直接碾压了Llama 2 70B!网友直呼这是初创公司版的超级英雄故事,要赶超GPT-4只是时间问题了。有趣的是,创始人姓…
随着大模型技术的发展与落地,「模型治理」已经成为了目前受到重点关注的命题。只不过,在实践中,研究者往往感受到多重挑战。 一方面,为了高其在目标任务的性能表现,研究者会收集和构建目标任务数据集并对大语言…
替代注意力机制,SSM 真的大有可为? 为了用更少的算力让扩散模型生成高分辨率图像,注意力机制可以不要,这是康奈尔大学和苹果的一项最新研究所给出的结论。 众所周知,注意力机制是 Transformer…
各家大模型纷纷卷起上下文窗口,Llama-1时标配还是2k,现在不超过100k的已经不好意思出门了。 然鹅一项极限测试却发现,大部分人用法都不对,没发挥出AI应有的实力。 AI真的能从几十万字中准确找…