谷歌再放核弹，开源最宏壮模子gemini技巧，碾压llama 2，一月三大招硬刚openai

李孟君 2024-02-23 00:26 250

"谷歌再放核弹，开源最宏壮模子gemini技巧，碾压llama 2，一月三大招硬刚openai,这篇新闻报道详尽，内容丰富，非常值得一读。这篇报道的内容很有深度，让人看了之后有很多的感悟。作者对于这个话题做了深入的调查和研究，呈现了很多有价值的信息。 " 账号设置我的关注我的收藏申请的报道退出登录登录搜索36氪Auto数字时氪将来消费智能涌现将来城市启动Power on36氪出海36氪研究院潮生TIDE36氪企服点评36氪财经(Finance)职场bonus36碳后浪研究所暗涌Waves硬氪媒体品牌企业号企服点评36Kr研究院36Kr创新咨询企业服务核心服务城市之窗行政部门服务创投发布LP源计划VClubVClub投资机构库投资机构职位推介投资人认证投资人服务寻求报道36氪Pro创投氪堂企业入驻创业者服务创投平台首页快讯资讯推荐财经(Finance)科技(Technology)创新城市最新创投汽车(Car)企服专精特新直播视频专题活动搜索寻求报道我要入驻城市合作谷歌再放核弹，开源最强大模型Gemini技术，碾压Llama 2，一月三大招硬刚OpenAI智东西·2024-02-22 09:26关注突发！谷歌开源Gemini兄弟版，全面狙击Llama 2。

谷歌向最强开源大模型的宝座发起进攻！

智东西2月22日凌晨报道，昨日晚间，谷歌毫无预兆地发布了开源模型Gemma，直接狙击Llama 2，继通过Gemini拳打OpenAI后，试图用Gemma脚踢Meta。

▲谷歌发布Gemma（图源：谷歌）

不同于Gemini的“全家桶”路线，Gemma主打轻量级、高性能，有20亿、70亿两种参数规模，能在笔记本电脑(Computer)、台式机、物联网设备、移动设备和云端等不同平台运行。

性能方面，Gemma在18个基准测评中平均成绩击败目前(Currently)的主流开源模型Llama 2和Mistral，特别是在数学、代码能力上表现突出，还直接登顶Hugging Face开源大模型排行榜。

▲Gemma登顶Hugging Face开源大模型排行榜（图源：X）

谷歌同步放出了技术报告，通过深度解读，智东西注意到除了模型性能优异外，Gemma的分词器词表大小达到256k，这意味着它更容易扩展至其他语言。

谷歌还强调Gemma基于自家TPUv5e芯片训练，Gemma 7B使用了4096个TPUv5e，Gemma 2B使用了512个TPUv5e，秀出挑战英伟达GPU统治地位的“肌肉”。

短短12天，谷歌连续放出三个大招，先是9日宣布其最强大模型Gemini Ultra免费用，又在16日放出大模型“核弹”Gemini 1.5，再是21日突然放出开源模型Gemma，动作之密集、行动之迅速，似乎在向抢了自己风头的OpenAI宣战。

Gemma具体强在哪儿？它在哪些方面打赢了Llama 2？其技术原理和训练过程有哪些亮点？让我们(We)从技术报告中寻找答案。

Gemma官网地址：

https://ai.google.dev/gemma

Gemma开源地址：

https://www.kaggle.com/models/google/gemma/code/

01.采用Gemini相同架构，轻量级笔记本也能跑

据介绍，Gemma模型的研发是受到Gemini的启发，它的名字来源于意大利语“宝石”，是由谷歌DeepMind和其他团队共同合作开发。

Gemma采用了与Gemini相同的技术和基础架构，基于英伟达GPU和谷歌云TPU等硬件平台进行(Carry Out)优化，有20亿、70亿两种参数规模，每个规模又分预训练和指令微调两个版本。

性能方面，谷歌称Gemma在MMLU、BBH、HumanEval等八项基准测试集上大幅超过Llama 2。

▲Gemma在基准测试上与Llama 2的跑分对比（图源：谷歌）

在发布权重的同时，谷歌还推出Responsible Generative AI Toolkit等一系列工具，为使用Gemma创建更安危的AI应用程序提供指导。此外，谷歌通过原生Keras 3.0为JAX、PyTorch和TensorFlow等主要框架提供推理和监督微调（SFT）的工具链。

谷歌强调Gemma在设计时将其AI原则放在第一位，通过大量微调和人类反馈强化学习（RLHF）使指令微调模型与负责任的行为对齐，还通过手工红队测试、自动对抗性测试等对模型进行(Carry Out)评估。

此外，谷歌与英伟达宣布合作，利用(Use)英伟达TensorRT-LLM对Gemma进行(Carry Out)优化。英伟达上周刚发布的聊天机器人Chat with RTX也将很快增加对Gemma的支持。

即日起，Gemma在全球范围内开放使用，用户可以在Kaggle、Hugging Face等平台上进行(Carry Out)下载和试用，它可以直接在笔记本电脑(Computer)可能台式机上运行。

发布才几个小时，已有不少用户分享了试用体验。社交平台X用户@indigo11称其“速度飞快”，“输出很稳定”。

▲X用户@indigo11分享Gemma试用体验（图源：X）

还有用户尝试了其他语种，称Gemma对日语的支持很流畅。

▲X用户@AiXsatoshi分享Gemma在日语上的试用体验（图源：X）

02.数学、代码能力碾压Llama 2，采用自家TPUv5e训练

与Gemini发布时一样，谷歌此次也同步公开了Gemma的技术报告。

▲Gemma技术报告（图源：谷歌）

报告称，Gemma 2B和7B模型分别在2T和6T的tokens上进行(Carry Out)训练，数据主要来自网站文档、数学和代码的英语数据。不同于Gemini，这些模型不是多模态的，也没有针对多语言任务进行(Carry Out)训练。

谷歌使用Gemini的SentencePiece分词器的一个子集以保证兼容性。它分割数字但不去除额外的空格，并且对未知标记依赖于字节级编码，词表大小为256k个tokens，这可能意味着它更容易扩展到其他语言。

▲开发者称256k分词器值得注意（图源：X）

两个规模中，70亿参数的Gemma 7B适用于GPU、TPU上的高效部署和开发，20亿参数的Gemma 2B则适用于CPU。

Gemma基于谷歌的开源模型和生态构建，包括Word2Vec、BERT、T5、T5X等，其模型架构基于Transformer，主要核心参数如下表。

▲Gemma模型主要参数（图源：谷歌）

在基准测评中，Gemma直接对标目前(Currently)先进的开源模型Llama 2和Mistral，其中Gemma 7B在18个基准上取得11个优胜，并以平均分56.4高于同级别模型。

▲Gemma与Llama 2、Mistral基准测评分数对比（图源：谷歌）

从具体能力上看，Gemma 7B在问答、推理、数学/科学、代码等方面的标准学术基准测试平均分数都高于同规模的Llama 2和Mistral模型。

此外，其推理、数学/科学、代码能力还高于规模更大的Llama 2 13B。

▲Gemma与Llama 2、Mistral各能力对比（图源：谷歌）

报告还详细介绍了Gemma训练采用的硬件：使用部署在256个芯片组成的Pod中的TPUv5e训练，这些Pod配置成一个16*16芯片的2D环形网站。

其中，Gemma 7B模型跨16个Pod进行(Carry Out)训练，共使用了4096个TPUv5e；Gemma 2B模型跨越2个Pod进行(Carry Out)训练，共使用了512个TPUv5e。

在一个Pod内部，谷歌为Gemma 7B使用了16路模型分片和16路数据复制，Gemma 2B则使用256路数据复制。优化器状态进一步通过类似于ZeRO-3的技术进行(Carry Out)分片。

技术报告地址：

https://goo.gle/GemmaReport

03.被OpenAI逼急了，谷歌一月连放三大招

2024开年，OpenAI发布的Sora文生视频模型爆火，一举抢走了谷歌最新力作Gemini 1.5 Pro大模型的风头。

但谷歌并没有就此打住，而是乘胜追击放出一个月里的第三个大招，这三个大招分别是：

2月9日大年三十，谷歌宣布其最强大模型Gemini Ultra免费用，Gemini Ultra于2023年12月发布时在MMLU（大规模多任务语言理解）测评上超过人类教授，在32个多模态基准中取得30个SOTA（当前最优效果），几乎全方位超越GPT-4，向OpenAI发起强势一击。（《谷歌大年三十整大活！最强大模型Gemini Ultra免费用，狙击GPT-4》）

2月16日大年初七，谷歌放出其大模型核弹——Gemini 1.5，并将上下文窗口长度扩展到100万个tokens。Gemini 1.5 Pro可一次处理1小时的视频、11小时的音频、超过3万行代码可能超过70万字的代码库，向OpenAI还没发布的GPT-5发起挑战。（《谷歌Gemini 1.5模型来了！突破100万个tokens，能处理1小时视频【附58页技术报告】》）

2月21日正月十二，谷歌在被“抢头条”后，一举将采用创建Gemini相同研究和技术的Gemma开源，一方面狙击Llama 2等开源模型，登上开源大模型铁王座，同时为嗷嗷待哺的生成式AI的应用开发者带来福音，更是为闭源的代表OpenAI狠狠地上了一课。

自2022年12月ChatGPT发布以来，AI领域扛把子谷歌就陷入被OpenAI压着打的境地，“复仇”心切。

在GPT-3大模型问世前，DeepMind的风头更胜一筹，坐拥AlphaGo、AlphaGo Zero、MuZero、AlphaFold等一系列打败人类的明星(Star)AI模型。随着生成式AI风口渐盛，谷歌DeepMind却开始显得力不从心，ChatGPT引发谷歌AI人才大军流向OpenAI，OpenAI却由此扶摇直上。

2023年3月，谷歌促成谷歌大脑和DeepMind冰释前嫌，合并对抗OpenAI，被业内称为“谷歌复仇联盟”。然而，直到年底的12月7日，谷歌最强大模型Gemini才姗姗来迟，尽管效果惊艳却令市场有些意兴阑珊。2024年1月31日，谷歌最新财报显示其收入亮眼，却因AI方面进展不及预期市值一夜蒸发超1000亿美元。

然而，2024年2月一来到，谷歌的状态来了个180度大转弯，攒了一年的大招接二连三地释放，试图用强大的Gemini大模型矩阵证明，其是被严重低估的。

值得一提的是，谷歌还有另一张王牌是自研芯片，有望成为其与OpenAI抗衡的有力底牌。2023年8月，谷歌云发布最新云端AI芯片TPU v5e，TPU被视作全球AI芯片霸主英伟达GPU的劲敌。

据半导体研究和咨询公司SemiAnalysis的分析师曝料，谷歌拥有的算力资源比OpenAI、Meta、亚马逊、甲骨文和CoreWeave加起来还要多，其下一代大模型Gemini已经开始在新的TPUv5 Pod上进行(Carry Out)训练，算力达到GPT-4的5倍，基于其目前(Currently)的基础设施建设情况，到明年年底可能达到20倍。

04.结语：谷歌再放大招，拳打OpenAI，脚踢Meta

从2023年12月发布Gemini多模态大模型，到2024年2月连放Gemini Ultra免费版、Gimini 1.5、Gemini技术开源三个大招，谷歌的大模型矩阵逐渐清晰，从闭源和开源两大路线对OpenAI打响复仇战，也向推出开源模型Llama 2的Meta宣战。

当下，OpenAI的文生视频大模型Sora风头正盛。实际上，谷歌已于2023年12月推出了用于零样本视频生成的大型语言模型VideoPoet，可在单个大模型中无缝集成了多种视频生成功(Success)能。谷歌在文生视频领域的储备想必也深，可以预测后续和OpenAI有得一打，而压力也就此给到了国内的AI企业。

本文来自微信公众号“智东西”（ID：zhidxcom），作者：香草李水青，编辑：李水青，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

+16

好文章，需要你的鼓励

智东西特邀作者0收藏+10评论打开微信“扫一扫”，打开网页后点击屏幕右上角分享按钮微博沉浸阅读返回顶部参与评论评论千万条，友善第一条登录后参与讨论(Discuss)提交评论0/1000你可能也喜欢这些文章前几天被Sora抢了热搜的谷歌，又突然发了个“最强开源小模型”AI芯片黑马一夜爆红：成本推算争议不断，前员工现员工互撕Sora火了，抖音(Tik Tok)们慌了？Sora送上“泼天富贵”，AI基础设施：这次轮到我了AI圈割韭菜乱象频出：卖199元AI课赚了上千万一年豪掷百亿，英伟达狂投这个赛道开源大模型王座易主，谷歌Gemma杀入场，笔记本可跑，可商用AI芯片被Sora彻底引爆，孙正义募集千亿美元，剑指英伟达谷歌VideoPoet负责人蒋路跳槽TikTok，对标Sora，AI视频模型大战在即最新文章推荐前几天被Sora抢了热搜的谷歌，又突然发了个“最强开源小模型”高合停产：当佛系融资碰上激进产品2023年拟计提9亿资产减值，钧达股份(Stock)加紧港股IPO募资出海OpenAI员工自曝作息时间：背公司章程，向优化之神祈祷；他们(They)也搞996？车企离谱出海：建船队、买船厂？如何你是Sora的产品经理，该如何设计这款产品？谷歌再放核弹，开源最强大模型Gemini技术，碾压Llama 2，一月三大招硬刚OpenAIAI芯片黑马一夜爆红：成本推算争议不断，前员工现员工互撕4天涨超70%，当虹科技(Technology)突然成了“顶流”比亚迪是怎么逆袭特斯拉的？土办法打败硅谷钢铁侠

智东西特邀作者

作者有点忙，还没写简介

发表文章1432篇最近内容谷歌再放核弹，开源最强大模型Gemini技术，碾压Llama 2，一月三大招硬刚OpenAI34分钟前AI芯片黑马一夜爆红：成本推算争议不断，前员工现员工互撕35分钟前苹果退钱，首批Vision Pro退货潮调查：多方博弈，黄牛血亏2小时前阅读更多内容，狠戳这里下一篇AI芯片黑马一夜爆红：成本推算争议不断，前员工现员工互撕

AI芯片是时候上演新故事了。

35分钟前

热门标签一叶子武天贸易壁垒宋卫平绿城设计绿城桃花源丁香医生(Doctor)scott颐堤港小龙虾加盟盱眙小龙虾夜生活(Life)笔刷海康萤石萤石奥巴马医改计划米国医疗保险变革傅磊王煜全红岸基地直投业务周期性行业兴趣和职业公装无忧管控模式香薰香薰精油龙虎斗电话评测电话故障关于36氪城市合作寻求报道我要入驻投资者关系商务合作关于我们(We)联系我们(We)加入我们(We)网站谣言信息举报入口热门推荐热门资讯热门产品文章标签快讯标签合作伙伴