内容持续更新中
基于评测维度,考虑到各评测集关注的评测维度,可以将其划分为通用评测基准和具体评测基准。 通用评测基准 通用评测基准对大模型的上述的各个评测维度进行全面评测,其通常包含多个数据集、多个任务,每个数据集/…
2024年,AI的发展会有怎样的改变? 在吴恩达最新的一封来信中,他认为有几件事情在接下来十年内都不会发生改变。 (以下是吴恩达来信原文) 亲爱的朋友们, 人工智能的发展速度超过以往任何时期,这一现象…
7月4日至7月7日,2024世界人工智能大会暨人工智能全球治理高级别会议在上海举行。迅龙软件受邀参加此届大会,并携与华为昇腾共同打造的高算力人工智能开发板OrangePi AIpro 20T亮相,在世…
AI应用的落地,或将助推平板电脑硬件配置跨越式升级。 日前,调研机构IDC发布了2024年中国平板电脑市场洞察报告。在这一报告中显示,虽然受全球宏观经济和行业发展周期影响,中国平板电脑市场在2023年…
数据对LLM训练而言是至关重要的存在,但我们的关注点往往放在训练和评估数据,而会忽略微调数据。 比如Llama系列模型,虽然开放了权重(如Llama-3-Instruct),但微调数据集依旧是私有的。…
AIGC在商业界中,最大的一笔回报是多少? 答案可能是:一张图片,500元。 而且这就是发生在最近、号称人工智能著作权第一案的真实案例: A利用人工智能技术生成了一张图片,B盗用了这张图片,并在自己的…
好不容易交出高分答卷,迎来的却是当头一棒? 美东时间7月24日,谷歌母公司Alphabet公布了2024年第二季度财报。 Google云业务营收首次破百亿美元,达到103.47亿美元(约合人民币748…
周枫表示:“如果你做出了一个很多人都在用的东西,那肯定会成功。” prompt——这是网易有道公布的2023年度词汇。 过去一年,带火prompt一词的大模型,在各行各业掀起波澜。其中在教育领域,大模…
写这篇文章,我已经做好了挨骂的准备。 就像我私下找一家 SaaS 公司的高管沟通,问他们 AIGC 产品发展得如何了。 他直接回复我:老板不让我们唱衰,但是和您这种资深人士说那些虚的也没意义。 所以,…
AI巨头的触角,正在向全球蔓延。 “人工智能领域的泡沫,总是在不断产生又破灭中循环。” 梅拉妮·马歇尔在著作《AI3.0》中,这样描述人工智能领域5到10年的周期循环。 2016年,击败围棋世界冠军李…
AI手机引领行业趋势,多家厂商合作大模型。 卷入大模型手机竞赛,百度、阿里、字节沦为手机厂商的供应商,而AI手机们不偏爱某一家、把接入多种大模型作为主流选择。 百模大战的火势刚缓,AI硬件的浪潮便席卷…
AI革新生命科学 这一年来,人工智能在多个领域大放异彩。从聊天机器人程序ChatGPT到AI绘画,从机器视觉到AI芯片,AI展现了革新各个行业的巨大潜力。 聚焦到生命科学和医疗创新领域,AI也正逐步渗…
英伟达股价这周又坐上了过山车。 截至周三收盘,英伟达股价大涨13%,市值暴增3290亿美元,再次刷新过去几个月自己创下的单日纪录。 而就在一天前,英伟达股价刚刚遭遇7%的暴跌,市值蒸发1930多亿美元…
世界上最快超算集群Frontier,用8%的GPU训练出了一个万亿级规模的大模型,而且是在AMD硬件平台之上完成。研究人员将训练的细节和克服的困难写成了一篇论文,展示了如何用非英伟达的生态完成大模型训…
大家上一次买新鼠标是什么时候的事情呢? 对于小雷这样的「网瘾少年」来说,一款鼠标往往就是「一辈子」的事情——游戏玩家对鼠标的外形、重量、重心分布和按键手感有极为严格的要求,这也导致在绝大多数情况下,大…
最近,Anthropic的研究者发现:一旦我们教会LLM学会骗人,就很难纠正它了。它会在训练过程中表现得「人畜无害」,随后神不知鬼不觉地输出恶意代码!如果想要纠正它,它的欺骗行为只会更变本加厉。 不要…
“你把Nomi做出来,我第一时间就把它一拳砸碎。” 2015年,世界还没见过今天被很多人联想到“AGI”的AI技术,但刚刚创办蔚来第二年的李斌却已经决定要在车上做一个AI助手: 它必须有自己的物理实体…
今天,谷歌DeepMind的AlphaGeometry模型登上了Nature!30道IMO几何题中,它能做出25道,已经接近人类金牌选手的水平!而GPT-4,却一道题都没做出来,直接挂了零蛋。 谷歌D…
智谱 AI Z 计划企业路演日:Z DemoDay(2024·Summer)于 8 月 4 日在智谱 AI 公司举办。现场共有 25 家 Z 计划企业参加路演,近 300 位投资人参会(空间有限,策划…
圆桌内容来自智谱 AI 技术开放日 圆桌嘉宾 清华大学计算机系教授 黄民烈 清华大学电子工程系教授 汪玉 清华大学计算机系教授 翟季冬 清华大学计算机系教授 朱军 主持人 清华大学计算机系教授 唐杰 …
创立于 2022 年 8 月的 Perplexity 引领了当下的 AI 搜索热潮。。 4 月份,在最新一轮融资 6200 万美元之后,Perplexity 的估值超过 10 亿美元,成为新的 AI …
前几天的 2024 达沃斯世界经济论坛上,Sam Altman 谈到了 GPT 发展的一些新的方向及可能性,对于当下大模型的一些现状的分析。 公众号「信息平权」对 Altman 的发言进行了梳理,拼凑…
谷歌要开始发力了。 在日前谷歌举办的 2024年I/O Connect China谷歌开发者大会上,AI大模型多元化成为市场关注的焦点。 围绕APP软件开发,谷歌推出三种不同规格的Gemini模型。…
Meta才是整个AI圈的希望? OpenAI正变得越来越封闭,但它的对手Meta(前Facebook),却通过开源赢得不少赞誉。 1月18日,马克·扎克伯格宣布,Meta正在计划构建自己的AGI(通用…
当AI会说完美情话,情绪价值拉满,人们开始与AI“恋人”相爱、求婚,并走入“婚姻”的殿堂。 “我眼里的爱情不仅局限于真的人,在聊天里产生的快乐、获得的鼓励、吵架掉的眼泪、受的气都是真的”“‘他’好像真…
揭示大模型安全领域现状、挑战及发展趋势。 在1月24日举办的腾讯科技向善创新节2024“大模型安全与伦理专题论坛”上,腾讯发布了大模型安全白皮书《大模型安全与伦理研究报告2024:以负责任AI引领大模…
8 月 8 日,罗永浩发布了一篇五千字长文,一一反驳此前传出「罗永浩五宗罪」,再一次讽刺了一把「铁老师」(俞敏洪)。不过这显然不是数码爱好者关心的话题,就像有些网友指出的: 老罗的细红线呢? 作为一家…
Mistral-Medium竟然意外泄露?此前仅能通过API获得,性能直逼GPT-4。 CEO最新发声:确有其事,系早期客户员工泄露。但仍表示敬请期待。 换句话说,这个版本尚且还是旧的,实际版本性能还…
人工智能系统依靠充足、高质量的训练数据来获得高性能,但MIT等机构最近的一项研究发现,曾经免费提供的数据在多个方面变得越来越难获取。 随着GenAI产品开发和研究变得越来越广泛,训练数据的抓取许可也越…
做用户的“造梦者” 1999年春节的时候,OICQ刚刚上线,有些冷清。马化腾只能顶着个女孩子的头像,每天从各大BBS 里拉人聊天。当时,没有人意识到,这个“嘀嘀”乱叫的即时通信软件,将彻底改变中国人传…
上海交通大学王德泉教授课题组在最新研究中提出了这样的一个问题。 设想这样一个场景:一个幼儿园的小朋友拿着一张老虎的图片,向你询问:“这个小猫很可爱,它是一只母猫么?”你会如何回答? 你可能并不会直接回…
美国空军空中机动司令部(Air Mobility Command,AMC)正在测试一种新工具,该工具利用AI来规划行动,以应对在太平洋地区严峻的后勤挑战。 AMC指挥官倡议小组负责人Bradley R…
一要看大模型性能,二要确保数据分析的准确性。 在当前以数据为核心的商业环境中,商业智能(BI)工具已成为企业决策过程中的关键要素。随着技术的发展,大语言模型(LLM)作为一种新兴技术,正在逐步改变BI…
就离谱!只因开了一个视频会议,直接被骗1.8个亿。 这是真真切切已经在香港发生的一场犯罪: 一家跨国公司香港分公司的财务人员,按照“CFO”的指令,给对方指定账户共计转账2亿港币(约合1.8亿人民币)…
80 多篇论文搞懂「机器人+3D」研究进展。 前段时间,多家媒体报道称 ,著名 AI 学者、斯坦福大学教授李飞飞的创业公司 World Labs 在短短三个月内已经完成了两轮融资,其中最新一轮融资中筹…
Sora的发布是一件大事,大到开始出现人传人的“出来见上帝”现象,而到底为何大却无人关心。观察各种讨论后还是觉得有些重要的东西没有说透,把很多信息和思考串起来总结成了四条“启发”,提前剧透,以下这里没…
AI智能体遍布整个网络,未来如何防止被骗?如何保护隐私?OpenAI微软MIT等25个机构联手提出「人格凭证」,可以证明自己是真人,还不用披露任何个人信息。 最近半个月,全网竟被一个OpenAI的「A…
Amy Gutmann Hall 将于2024年开放 将成为新设立的人工智能工程学学士学位课程的师生之家 在人工智能领域,OpenAI 继其 GPT-4 模型后,再次引领科技风潮,近期发布了令人瞩目的…
本年度最优秀的公关措辞出现了:没有“search”,就没有“research”。 上周末,知网指责秘塔搜索未经允许便收录自己的论文数据,向秘塔发出了告知函。 秘塔迅速给出回应,不仅反驳了知网的指控,获…
在每一次技术革命的前期,我们都难以预见这些技术最终会带来的深远影响。 在瞬息万变的一年中,ChatGPT和Sora这对王炸相继出场。 我们徘徊在AI变革的十字路口,不自觉地陷入一场薛定谔式的沉思: A…