想在手机上本地跑AI？还是让子弹飞一会吧

2023-11-16 阅读 40 收藏 0 评论 0 限时评论得现金

零小柒

粉丝 0 文章 6432 收藏 0

01 7B，10B，13B参数AI模型，这个B是个什么玩意？

想在手机上本地跑AI？还是让子弹飞一会吧

AI生成-Midjourney

相信很多小伙伴都看到“高和联”两家旗舰芯片的宣发时都会注意到，他们都将成功运行XXB（多少亿）参数AI大语言模型的字眼作为营销重点。

想在手机上本地跑AI？还是让子弹飞一会吧

那么这个B或者说参数量级是什么意思？在AI模型领域，”B” 通常代表 “billion”，也就是十亿，它指的是模型参数的数量。例如，”LLama-2-7B” 中的 “7B” 意味着这个模型有大约70亿个参数。

想在手机上本地跑AI？还是让子弹飞一会吧

Meta开发的LLama-2-7B模型，服务于移动设备或低功耗PC

参数数量是衡量模型复杂度的一个重要指标。一般来说，参数越多，模型的复杂度越高，对数据的拟合能力越强。简单说，这个数字很是关键，通常情况下，参数越多，模型的处理能力和理解复杂性越强，但也需要更多的计算资源。

想在手机上本地跑AI？还是让子弹飞一会吧

丰富的模型参数数量如同给一位厨师以丰富的食材原料(AI生成-Midjourney)

02 那参数量是越大越好吗？

不见得，在某些情况下，特化的小模型可能在特定任务或场景上表现得比大模型更好。这是因为小模型可以更好地针对特定的任务进行优化，而大模型可能在尝试适应更广泛的任务时失去了一些特定性。

例如，假设我正在开发一款专注于美容美颜主题的AI大语言模型。我收集了所有关于美容养颜的网络资料，最终模型的参数量达到了30亿（3B）。尽管参数量较小，但模型能够更精确地针对特定任务进行优化，有效避免过拟合问题。同时，模型可以专注于与特定任务相关的特征，无需学习大型模型中的无关特征。相比之下，这种专注性使得小型模型在某些方面超越了参数量为30B或50B的通用大型模型。

想在手机上本地跑AI？还是让子弹飞一会吧

AI生成-Midjourney

从某开源AI模型的测试成绩中，我们也可以看到这一点。在这次测试中，LLaMA2-13B模型的子项分数和平均分数均优于Aquila2-34B模型。

想在手机上本地跑AI？还是让子弹飞一会吧

03 主流的AI大语言模型的参数量是多少？

以我们熟知的ChatGPT为例，其GPT-3.5版本（于2022年12月发布）拥有1750亿（175B）参数。而目前我们最常用、最熟悉的GPT-4在完整的120层模型中拥有18000亿（1800B）参数。另一个表现出色的模型，Claude 2，其参数量为1300亿（130B）。

想在手机上本地跑AI？还是让子弹飞一会吧

在国产模型方面，尽管百度的文心一言没有公开其参数量，但根据我们的推算，其最新的4.0版本的参数量预计也已超过千亿，即1000亿（100B）以上。最近流行的国内大模型月之暗面（Moonshot）的参数量也超过了千亿。在部分小模型中，阿里云的通义千问开源版本达到了140亿（14B）参数量。

想在手机上本地跑AI？还是让子弹飞一会吧

04 移动端处理AI性能的能力

尽管MTK 9300和高通8gen3这两款旗舰芯片没有公开其实际运行模型的测试过程，我们仍可以从它们的声明中获取一些信息。MTK 9300强调，它可以在运行参数量为70亿（7B）的模型时实现20 tokens/s的性能。

需要注意的是，”tokens”这个词在这里的含义可能会有所不同，它可能指一个词、一个字符，或者在某些语言中的一个字母。

想在手机上本地跑AI？还是让子弹飞一会吧

在高通方面，他们声明其8gen3芯片在运行Meta开发的Llama 2模型时（Llama 2有7B、13B和70B版本，如果没有特别强调，那么一般指的是7B版本）可以达到15 tokens/s的性能。

想在手机上本地跑AI？还是让子弹飞一会吧

高通骁龙8Gen3官方宣传资料

根据一些经验来判断，在7B大小的模型中，二者的速度都已经够快了，可以较为流畅自然的速度来实现文字对话或者实时的语音识别与翻译。

05 移动端处理AI性能的性能巨大消耗

虽然移动设备如手机和平板电脑确实可以在本地运行AI模型，但由于这些设备更多地用于个人用途，运行AI模型时会调用一些特定的资源。首当其冲的便是神经处理单元（NPU），这是今年几款旗舰SoC芯片（如A17pro、8Gen3、9300、X Elite等）都在强调的部分。NPU是专门用于神经网络处理的处理器，拥有高效的矩阵乘法和卷积运算能力。在处理AI任务时，NPU主要用于执行模型的推理。

此外，手机的中央处理单元（CPU）和图形处理单元（GPU）也会实时参与其中，负责执行模型的解码、预处理和后处理等任务。同时，手机的随机存取内存（RAM）也会被大量使用。对于熟悉AI模型的用户来说，无论是在PC本地的LLMS还是SDXL上，对内存和显存的占用都是相当大的。在移动设备上，RAM主要用于存储AI模型、数据和中间结果。在处理AI任务时，内存的带宽和容量是影响性能的重要因素。

想在手机上本地跑AI？还是让子弹飞一会吧

对用户实际使用影响最大的部分是大量的RAM消耗。在MTK 9300的官方发布中，联发科官方介绍说，一个拥有1300亿参数的AI大模型大约需要13GB的内存（在INT8精度下）才能运行。因此，即使是一个拥有70亿参数的模型，也大约需要7GB的内存。尽管存在一些技术，如INT4量化（通过降低计算精度以减少内存消耗），但是在完整调用运行一个7B的AI模型时，也需要至少4GB的内存消耗。这对于RAM资源本就非常宝贵的Android系统来说，无疑是雪上加霜。

想在手机上本地跑AI？还是让子弹飞一会吧

可以想象，如果未来本地的AI模型普及开来，当前主流的8GB手机RAM肯定是不够用的。一旦打开AI程序，用户可能会面临其他应用被强制关闭，以及由于反复调用部分应用而导致的系统卡顿等问题。

06 AI 落地移动端？让子弹飞一会

不少小伙伴看到这里，都以为我在唱空移动端侧AI，但其实错了，其实我对于移动端AI应用是一个多头。毕竟手机是我们日常生活中最常用的智能设备，而且我们也看到，从OpenAI布局移动版的ChatGPT，到国内大模型纷纷转战移动端APP，再到手机厂商的“百模大战”，还有智能汽车领域的算力大辩论，都表明移动端的AI应用潜力巨大。

想在手机上本地跑AI？还是让子弹飞一会吧

而发展方向上，我认为移动端侧当前十分强调的本地LLMs（大语言模型）并不会是最终的发力方向，因为由于在精度的限制，本地LLMs的质量可能堪忧，即使可以输出较长的对话内容，但其逻辑性与合理性上都会与已知的PC端产品有较大的差距。

那么移动端该如何发展本的AI呢？我认为首当其冲的应该是图像识别与TTS（语音合成系统）。移动设备（涵盖手机与智能汽车）作为视觉与听觉传播的重要媒介，其能带来的远不止文字流的输出。

关于图像识别功能，随着手机摄像头技术的不断进步，图像识别在移动端的应用越来越广泛。例如，人脸识别、物体识别、场景识别等。未来，随着手机端AI算力的提升，图像识别的准确性和实时性将得到显著改善。

想在手机上本地跑AI？还是让子弹飞一会吧

GPT长眼睛了，史诗级功能悄咪咪发布！

此外，随着智能汽车移动端AI计算能力的提升，图像识别技术在智能汽车中的应用将变得更加广泛和精准。例如，自动驾驶系统可以借助图像识别技术实时识别路况、标志牌、行人以及其他车辆，从而做出准确的驾驶决策。同时还可以衍生出图像识别可以用于识别车辆的周围环境，并提供相关的服务信息。例如，车辆可以通过图像识别来识别附近的餐厅、酒店等信息，并提供导航和预订等服务，催生新的业态。

另外一点就是语音合成（TTS）这也是本次OpenAI开发者大会中提及的重点内容，该技术结合AI，可以将文本转换为自然语音，广泛应用于智能助手、语音导航、语音阅读等场景。随着手机端AI算力的提升，TTS技术将更加成熟，生成的语音将更加自然、流畅。配合智能AI助理等功能来实现钢铁侠中“贾维斯”的科幻场景落实。

想在手机上本地跑AI？还是让子弹飞一会吧

同时，移动端侧越来越强大的AI算力，还可以让V2V（车车互联）慢慢实现，通过AI和V2V技术，车辆可以共享路况信息，如拥堵情况、事故、路面状况等。这些信息可以帮助驾驶员或自动驾驶系统做出更好的导航决策，提高道路使用效率。甚至，可以自动与同目的地的车辆组成车队，AI可以控制一组车辆以固定的速度和距离行驶，从而提高燃油效率和道路容量。

想在手机上本地跑AI？还是让子弹飞一会吧

在对未来人工智能市场的展望中，可以明确地预见到，在日常民用领域，移动端将无疑占据主导地位。目前，移动设备在运行大规模AI模型时，的确面临着内存和计算资源的限制。然而，随着科技的持续进步，我们有理由相信这些挑战将会被逐步克服。

作为消费者，在面对如潮水般涌来的AI营销攻势时，我们需要保持清醒的判断力，同时也应对新兴技术抱有好奇心和期待。毕竟，自信息技术革命以来，很少有哪一项技术能引发如此广泛的关注，并激发全球科技巨头展开如此激烈的竞争。人类历史已经多次证明，只有竞争的时代才是科技进步最快的时代，才是人类文明的闪耀时刻。

想在手机上本地跑AI？还是让子弹飞一会吧

本文来自微信公众号“PConline太平洋科技”（ID:pconline_cn），作者：PC

FDA批准一款AI医疗影像，一分钟识别脑出血

关联网址

关联标签

#AI #AI技术 #AI模型 #文心一言

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

后，在评论区留言并审核通过后，即可获得现金奖励，奖励规则可见：查看奖励规则

暂无评论...

10 款教育 AI 工具用例

3661 用户在看

AI写作网站自动的生成文章可以用吗？

261 用户在看

2023年你必须知道的顶级国产AI工具有哪些？全面解析！

184 用户在看

清华孵出一家Chiplet黑马！连拿亿级融资，首款AI芯片已跑通，ZAKER对话创始人

155 用户在看

想在手机上本地跑AI？还是让子弹飞一会吧

01 7B，10B，13B参数AI模型，这个B是个什么玩意？

02 那参数量是越大越好吗？

03 主流的AI大语言模型的参数量是多少？

04 移动端处理AI性能的能力

05 移动端处理AI性能的性能巨大消耗

06 AI 落地移动端？让子弹飞一会

FDA批准一款AI医疗影像，一分钟识别脑出血

微软深夜连甩三大炸弹！Bing Chat更名Copilot，自研芯片问世，还加入GPTs功能

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿

搜索

近期热门

10 款教育 AI 工具用例

3661 用户在看

AI写作网站自动的生成文章可以用吗？

261 用户在看

2023年你必须知道的顶级国产AI工具有哪些？全面解析！

184 用户在看

清华孵出一家Chiplet黑马！连拿亿级融资，首款AI芯片已跑通，ZAKER对话创始人

155 用户在看

想在手机上本地跑AI？还是让子弹飞一会吧

01 7B，10B，13B参数AI模型，这个B是个什么玩意？

02 那参数量是越大越好吗？

03 主流的AI大语言模型的参数量是多少？

04 移动端处理AI性能的能力

05 移动端处理AI性能的性能巨大消耗

06 AI 落地移动端？让子弹飞一会

FDA批准一款AI医疗影像，一分钟识别脑出血

微软深夜连甩三大炸弹！Bing Chat更名Copilot，自研芯片问世，还加入GPTs功能

关联网址

关联标签

文章目录

发评论，每天都得现金奖励！超多礼品等你来拿