这张图片展示的是初创公司Cerebras Systems,位于美国加利福尼亚州圣克拉拉的一个数据中心的新型AI超级计算机Andromeda
2023年8月30日(路透社)报道,由一组工程师、研究人员和一家硅谷的芯片公司一起合作,发布了一个阿拉伯语言的生成式人工智能模型。
这个名为JAIs的新大型语言模型包含130亿个参数,是由大量结合了阿拉伯语和英语数据的组合而成。
这个团队之所以包含学者和工程师,部分原因是他们认为很少有双语的大型语言模型。
根据穆罕默德·本·扎耶德人工智能大学的教授蒂莫西·鲍德温告诉我们,由于没有足够的阿拉伯语数据来训练Jais这种规模的模型,所以使用了部分计算机代码帮助训练了模型。
鲍德温告诉路透社:“(代码)在推理能力方面为模型提供了很大的帮助,因为它可以详细说明(逻辑)步骤。”
训练模型的团队是在由Cerebras与G42公司合作建造的名为Condor Galaxy的超级计算机上进行训练的。今年,Cerebras宣布将与G42建造三台这样的计算机,第一台今年已经完成,另外两台计划于2024年交付。
Cerebras的首席执行官安德鲁·费尔德曼表示:“尽管此前做了几个月的准备工作,但是这个模型从开始训练到结束,一共训练了130亿个参数,在三天半内就完成了。
文章转载自reuters,作者Max A. Cherney
文章目录
暂无评论...
发评论,每天都得现金奖励!超多礼品等你来拿
登录 后,在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则