Skip to content

搞英语 → 看世界

翻译英文优质信息和名人推特

Menu
  • 首页
  • 独立博客
  • 专业媒体
  • 名人推特
  • 邮件列表
  • 关于本站
  • Product Hunt
  • Visual Capitalist
  • Elon Musk
Menu

Gemini 2.0 Flash“思维模式”

Posted on 2024-12-20

这些新车型的发布一直在源源不断地涌现。今天,它被 Google 活泼地命名为gemini-2.0-flash-thinking-exp ,这是他们第一个进入 o1 风格推理扩展类模型的产品。今天早上我发表了一篇关于这些重要性的精彩文章。

来自Gemini 模型文档:

Gemini 2.0 Flash 思维模式是一个实验模型,经过训练可以生成模型作为其响应的一部分所经历的“思维过程”。因此,思考模式的响应推理能力比基础 Gemini 2.0 Flash 模型更强。

我刚刚发布了llm-gemini 0.8,支持该模型。您可以使用LLM尝试一下,如下所示:

 llm install -U llm-gemini  
#如果您还没有设置 Gemini 键:  
llm 键设置双子座  
#将密钥粘贴到此处  
  
llm -m gemini-2.0-flash-thinking-exp-1219 “解决山羊生菜狼河谜题的更难变体”

这是一个非常健谈的模型– 2,277 个输出标记回答该提示。

一个更有趣的例子

到目前为止,我发现的示例提示的最佳来源是Gemini 2.0 Flash Thinking 食谱– 一个 Jupyter 笔记本,其中充满了模型功能的演示。

到目前为止我最喜欢的是这个:

What's the area of the overlapping region?

三角形与圆重叠的图

该模型是多式联运的!

以下是使用llm-gemini运行该示例的方法:

 llm -m gemini-2.0-flash-thinking-exp-1219 \  
  -a https://storage.googleapis.com/generativeai-downloads/images/geometry.png \  
  “重叠区域的面积是多少? ”

这是完整的回复,包括 MathML 的工作。最终结论:

最终答案是9π/4

这与 Google 在示例笔记本中提供的答案相同,所以我认为它是正确的。感人的!

骑自行车的鹈鹕的 SVG 怎么样?

 llm -m gemini-2.0-flash-thinking-exp-1219 \  
  “生成鹈鹕骑自行车的 SVG ”

这是完整的回复。有趣的是,它稍微破坏了答案的开头:

This thought process involves a combination of visual thinking, knowledge of SVG syntax, and iterative refinement. The key is to break down the problem into manageable parts and build up the image piece by piece. Even experienced SVG creators often go through several adjustments before arriving at the final version.00" height="250" viewBox="0 0 300 250" fill="none" xmlns="http://www.w3.org/2000/svg">
<g>
<!-- Bicycle Frame -->

在我手动修复它以添加<svg开始标记后,我得到了这个:

这辆自行车有两个轮子,但看起来更像婴儿车。鹈鹕有一个漂亮的橙色喙,但它的翅膀是三角形的,位置很奇怪。

所以也许不是艺术大师,但无论如何读一下它的思想链还是很有趣的。

标签: google 、 ai 、生成式 AI 、 llms 、 llm 、 Gemini 、 o1 、推理缩放

原文: https://simonwillison.net/2024/Dec/19/gemini-thinking-mode/#atom-everything

本站文章系自动翻译,站长会周期检查,如果有不当内容,请点此留言,非常感谢。
  • Abdisalan Mohamud
  • Addy Osmani
  • Aeon
  • Ahoy There! on THT's den
  • Alec Muffett
  • Andreas
  • anhvn
  • Ankaph
  • Annie
  • Armin Ronacher
  • Ask Hacker News Weekly
  • Astro Blog
  • Austin White
  • Backlinko
  • Better Dev Link
  • Building Pika Out Loud
  • Caleb Hearth
  • Cédric Aellen
  • Chip Huyen
  • Colossal
  • Cooltools by KK
  • CoRecursive
  • Craig Mod
  • Curt Merrill
  • Dan Abramov's Overreacted Blog RSS Feed
  • Daniel Lemire
  • Daniel Stenberg
  • Daring Fireball
  • David H
  • David Heinemeier Hansson
  • Dayu | 大宇
  • Ed Zitron
  • Ersei
  • Ersei 'n Stuff
  • Evan Martin
  • First Page Sage
  • Founder Weekly
  • FuzzyGrim
  • Gabriel
  • Good Enough
  • Gregory Hammond
  • Habib
  • How They Make Money
  • I Love Charts
  • Ian Betteridge
  • Ivaylo Durmonski
  • Jason Kottke
  • Jason Kratz
  • Jeff Perry
  • John D. Cook
  • Jonas Hietala
  • Jonathan Snook
  • jwb
  • Kevin Kelly
  • Kevin Yank
  • Kirsty
  • Kush
  • Loris Cro
  • Maarten van Gompel
  • Manas J. Saloi
  • Mandy Brown
  • Matt Fantinel
  • Matt Mullenweg
  • Mere Civilian
  • Ness Labs
  • News Letter
  • Nicholas Carlini
  • Nicolas F. R. A. Prado
  • Niko
  • Nir Eyal
  • Noah Smith
  • Pedro Lopes
  • Positive News
  • Predrag Gruevski
  • Rachel Kroll
  • Recomendo by KK
  • rendezvous with cassidoo
  • Rest of World
  • Ruben Schade
  • Scott Galloway
  • Sébastien Etter
  • SEMrush Blog
  • Seth Godin
  • Shariq Raza Qadri
  • Simon Willison
  • Six Colors
  • Slashdot
  • Spectre Collie
  • Spyglass
  • storytelling with data
  • Streamline Blog
  • Tableau Blog
  • tekphloyd
  • The Alchemy of Money
  • The Independent Variable
  • The Marginalian
  • thriftmac
  • Tim Bray
  • Tim Ferriss
  • Tim Kellogg
  • TLDR
  • Topslakr
  • Track Awesome list
  • Trump
  • Victor Kropp
  • Vincent Ritter
  • Vox
  • Westenberg
  • Xe Iaso
  • xkcd
  • Yuri Cunha
  • Zarar
  • 未分类
  • 英文媒体
  • 英文推特
  • 英文独立博客
  • 读写错误
©2026 搞英语 → 看世界 | Design: Newspaperly WordPress Theme