从 Gemini 到 Claude

原本是想测试一下 AI 的编程能力目前到底发展如何了,尤其是对于我这样的小白用户,是不是达到可以语音编程的效果了?由于 Gemini 送了 Google One 用户三个月免费的账户,并且 Gemini AI 的上下文能力足够长,就从 Gemini Advance 先入为主来体验一下。

尝试让 Gemini AI 帮助生成一个 Chrome 插件,在零技术基础 + 口述需求的情况下,诞生了一个增加搜索自己 Tweets 功能的插件雏形,包括四个代码文件。

插件效果演示,这是第一种版本。

插件效果演示,这是第一种版本。

在其他人推荐下,又了解了一下 Claude AI,并尝试用 Claude 解决一些之前 Gemini 无法解决的代码问题,没想到,Claude AI 在处于 Free 的情况下,代码能力高于付费版本的 Gemini Advance,而且,开启了 Claude AI 的 Artifacts 功能之后,体验更好了。

快速交付的另外一个版本的搜索自己的 Tweets

快速交付的另外一个版本的搜索自己的 Tweets

撇开 Claude AI 本身的代码逻辑能力以外,新的 Artifacts 还是以 AI 交互创新为主,让 AI 交付东西变得更友好,比如代码的版本控制、projects 管理、多人协作和分享(部分支持直接部署并分享给其他人),传统的类似于 ChatGPT 或者 Gemini 的基于 Chat 的交互,会让需要被交付的内容散落在对话历史的各个角落,仅在时间线维度上呈现,非常容易失焦。

现在这些成形的内容会以 Artifacts 这种资源管理界面形式呈现在 Chat 右侧,加上版本管理的效果,最终交付物变成了一个锚点物,AI 始终聚焦在交付物上不断进行 Craft。

左侧 Chat,右侧 Artifacts 资源

左侧 Chat,右侧 Artifacts 资源

在 Chat 右侧展开 Code 的情况下,可以切换版本以及快捷导出

在 Chat 右侧展开 Code 的情况下,可以切换版本以及快捷导出

之前有一个个人看法,当 Chat 成为 AI 的一种主要模式之后,AI 应该多向已经 IM 应用取取经。 比如早期 QQ 群管理左侧 Chat 右侧群资源的方式,与 Artifacts 模式有一种异曲同工之妙,类似的还有论坛的常规帖子区域和精华帖,已经是一种成熟的展现时间线和存量资源的交互。

此时应该回过头再细致点一点 QQ 群和飞书群聊天的各个功能了,肯定有更多启发。

喜欢 Claude AI 的代码能力

我没有怎么对比 ChatGPT-4o,主要是担心上下文不够,但是 Claude AI 是我体验中少有的在遇到解决不了的问题时,主动给代码加 Log,然后让我将控制台信息反馈给它的 AI,而且最后确实解决了。

不过,尽管 Claude AI 已经有优于其他家的逻辑推理能力,我的偏见是, AI 仍然属于什么都可以做,但什么都做不好的阶段,缺少准确度和可控性,很多能力比较黑盒不可控,不适合直接用于生产环境的交付,只能作为产品能力的补充,在某个垂直限定的场景下,更能产生高于预期的价值。

上下文理解是一个难题

除了上下文长度不够是一个隐忧以外,跟 AI 对话的过程还是很让人着急的,因为只能通过对话,甚至大部分情况下还必须是文本,无法投屏演示,无法画概念图,无法给原型交互,口述需求看上去是一个很轻松的活儿,没有刻意训练的话,还是很难说出逻辑无误的需求,哪怕这个需求看上去贼简单。

Claude 应该会成为我的 AI 主力

在这之前,其实主力是 ChatGPT,我的工作和生活日常需要一个视野比我大得多的可对话的 AI Copilot,什么都会顺手问一嘴,很好奇它会给我什么样的答案。虽然会犯错,但总能获得不少启发,甚至还可以完成一些简单但无趣的事情,比如写写文案、做做翻译、找找内容错误。

另外,Claude AI 的交互也是各家 AI 里比较入眼的,Perplexity AI 有模仿一些,不是那种一上来就很丑的左侧 Chat 列表,右侧 Chat 内容区的呆板设计。