离职谷歌的Transformer作者创业，连发3个模型（附技术报告）

2024-03-25 阅读 8 收藏 0 评论 0 限时评论得现金

零小柒

粉丝 0 文章 6432 收藏 0

技术详解

技术报告介绍了 Evolutionary Model Merge 这种通用进化方法。

离职谷歌的Transformer作者创业，连发3个模型（附技术报告）

报告地址：https://arxiv.org/pdf/2403.13187.pdf

本文的目标是创建一个统一的框架，能够从选定的基础模型中自动生成合并模型，以确保该合并模型的性能超过集合中任何个体的性能，方法的核心是进化算法。研究者首先将合并过程剖析成两个不同的、正交的配置空间，并分析它们各自的影响。基于此分析，他们随后引入了一个无缝集成这些空间的内聚框架。图 1 为示意图。

离职谷歌的Transformer作者创业，连发3个模型（附技术报告）

Evolutionary Model Merge 结合了：（1）合并数据流空间（Data Flow Space）中的模型，以及（2）合并参数空间（权重）中的模型。

数据流空间：是通过进化来发现不同模型各层的最佳组合以形成新模型。下面是这种方法的一个示例：

离职谷歌的Transformer作者创业，连发3个模型（附技术报告）

参数空间：第二种方法是开发混合多个模型权重的新方法，混合不同模型的权重以形成新的模型。下面视频为两种不同模型混合权重的过程说明：

离职谷歌的Transformer作者创业，连发3个模型（附技术报告）

数据流空间和参数空间这两种方法也可以结合在一起来开发新的基础模型：

离职谷歌的Transformer作者创业，连发3个模型（附技术报告）

该研究希望通过进化的方法来帮助找到更好的模型合并方法，通过实验，研究者证明了该方法能够创建具有以前不存在的、新的、具有新兴组合功能的新模型。实验中，研究者使用这种自动化方法生成了两个新模型：一个日语数学 LLM 和一个支持日语的 VLM，它们都是使用这种方法演化而来的。

具有 SOTA 性能的基础模型

该研究提出了三种模型：大型语言模型（EvoLLM-JP）、视觉语言模型（EvoVLM-JP）以及图像生成模型（EvoSDXL-JP）。

EvoLLM-JP

EvoLLM-JP 是一个可以用日语解决数学问题的 LLM。为了构建这样的模型，该研究使用进化算法来合并日语 LLM（Shisa-Gamma）和特定于数学的 LLM（WizardMath 和 Abel）。

实验过程中，研究者允许模型不断的进化迭代，最终模型采用的是在 100-150 次的进化中表现最好的模型。研究者在 MGSM 数据集上进行了评估，以下是评估结果：该表格比较了不同 LLM 用日语解决数学问题的表现，MGSM-JA 列显示正确答案的百分比。模型 1-3 为原始模型，模型 4-6 为优化后的合并模型。模型 7-10 是用于比较的 LLM 得分。

离职谷歌的Transformer作者创业，连发3个模型（附技术报告）

上表为进化后的 LLM 结果。其中模型 4 在参数空间中进行了优化，模型 6 使用模型 4 在数据流空间中进行了进一步优化。这些模型的正确响应率明显高于三个源模型的正确响应率。

不过研究者表示根据以往的经验，手动将日语 LLM 与数学 LLM 结合起来非常困难。但经过迭代努力，进化算法能够有效地找到一种将日语 LLM 与数学 LLM 结合起来的方法，成功地构建了一个兼具日语和数学能力的模型。

除了数学能力外，研究者还评估了模型的日语能力。令人惊讶的是，该研究发现这些模型在一些与数学无关的任务上也取得了高分。值得注意的是，模型并没有经过特定优化，但实际效果还不错。

离职谷歌的Transformer作者创业，连发3个模型（附技术报告）

LLM 日语整体能力比较，其中 Avg 栏是 9 个任务得分的平均值，数值越高，代表 LLM 日语整体能力越高。

EvoVLM-JP

该研究发现，进化算法还可以进化成不同架构的模型。他们通过应用进化模型合并生成了一个日语视觉语言模型 (VLM)。

在构建日语 VLM 时，该研究使用了流行的开源 VLM (LLaVa-1.6-Mistral-7B) 和功能强大的日语 LLM (Shisa Gamma 7B v1)。研究者表示，这是合并 VLM 和 LLM 的第一次努力，其证明了进化算法可以在合并模型中发挥重要作用。以下是评估结果。

离职谷歌的Transformer作者创业，连发3个模型（附技术报告）

上表中，JA-VG-VQA-500 和 JA-VLM-Bench-In-the-Wild 都是关于图像问答的基准。分数越高，表示用日语回答的答案越准确。

以下为模型在回答有关图像问题的示例展示。两种基线模型经常给出错误的答案，而 EvoVLM-JP 给出正确的答案。

例如用户询问交通信号灯现在是什么颜色时，通常来讲，正确答案是绿色，但是在日语习惯中，都会说成蓝色。可以看出 EvoVLM-JP 比较贴合日语习惯。

离职谷歌的Transformer作者创业，连发3个模型（附技术报告）

EvoSDXL-JP

该研究发现，进化也可以自动发现合并不同扩散模型的方法。

离职谷歌的Transformer作者创业，连发3个模型（附技术报告）

本文来源于公众号机器之心，作者陈萍、小舟

离职谷歌的Transformer作者创业，连发3个模型（附技术报告）

讨论下一个token预测时，我们可能正在走进陷阱

关联网址

关联标签

#AI

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

后，在评论区留言并审核通过后，即可获得现金奖励，奖励规则可见：查看奖励规则

暂无评论...

10 款教育 AI 工具用例

2824 用户在看

AI写作网站自动的生成文章可以用吗？

137 用户在看

2023年你必须知道的顶级国产AI工具有哪些？全面解析！

74 用户在看

“如何选择最佳AI写作工具？这些秘诀一定要知道！”

63 用户在看

离职谷歌的Transformer作者创业，连发3个模型（附技术报告）

技术详解

具有 SOTA 性能的基础模型

EvoVLM-JP

EvoSDXL-JP

讨论下一个token预测时，我们可能正在走进陷阱

词曲创作只需几秒，「AI作曲家」Suno引爆音乐圈，第一手体验和攻略来了

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

搜索

近期热门

10 款教育 AI 工具用例

2824 用户在看

AI写作网站自动的生成文章可以用吗？

137 用户在看

2023年你必须知道的顶级国产AI工具有哪些？全面解析！

74 用户在看

“如何选择最佳AI写作工具？这些秘诀一定要知道！”

63 用户在看

离职谷歌的Transformer作者创业，连发3个模型（附技术报告）

技术详解

具有 SOTA 性能的基础模型

EvoVLM-JP

EvoSDXL-JP

讨论下一个token预测时，我们可能正在走进陷阱

词曲创作只需几秒，「AI作曲家」Suno引爆音乐圈，第一手体验和攻略来了

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿