neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

首款无限Agent Neo深度实测,出道两年半的AI转正了

admin|
18

首款无限Agent Neo深度实测,出道两年半的AI转正了

AI不再相信人类


关于 Agent,


flowith 给出了自己的答案 ——


Neo


拥有了无限步骤无限上下文无限工具,Neo 完全可以通过过量的搜索和推理,不再盲目相信搜索结果,而是把最高质量的信息提供给大模型,让大模型生成最合适的提示语和上下文。



凌晨三点,我盯着屏幕上的 Neo,


任务还在跑,我甚至没动鼠标,


我的邮箱正安静地接收着第 17 轮自动报告,它正在抓取全球 AI 创业公司 CEO 们昨晚更新的 X 帖子,并根据我的口吻写两条新推文。


我之前试过太多 Agent。


有的能规划任务,但只能走五六步。


有的能生图,但中间思路完全看不到。


有的能联网搜索,但查出来的东西全是低质量内容。


Neo 身上的三个无限特质,第一次让我产生“我已经不是一个人在工作”的错觉。


怎么做才是无限呢?


Neo 的无限是,它可以在规定的时间内完成重复的复杂的任务,甚至可以以“年”为单位,只要我不主动终止任务且 token 额度充足,这个任务就可以一直重复、一直跑。


Neo 的无限还是,全自动输出100万字的内容,可以重写小说、电影甚至是电视剧结局,AI 能替代的角色又多了一位。


从我看or运行过的50+案例上看,Neo 除了基础的联网搜索、代码生成&运行,还可以完成邮件通知知识库融合看视频PPT生成浏览器使用等等使用场景的任务,而且质量很高。


我甚至感觉不出哪些是“人工输入”,哪些是“模型输出”,整个过程像是一个有主观能动性的数字生命在自己运转。



跑案例前,


flowith 还提供了 Neo 在通用 AI Agent 能力测试 GAIA 中的表现:在三个难度级别里都拿到了最高分:



接下来我会根据无限步骤无限上下文无限工具来深度拆借四个案例,以及额外盘点6个用例、flowith 的基础使用和这次 Neo 的邀请码们。


01|无限步骤


我给 Neo 下的第一个指令,


是帮我每天追踪全球的AI动态,


虽然维护自己的信息源已经快两年了,尝试过各平台特别关心,用过 RSS、信息聚合、三方订阅等等,但还是会漏掉一些信息。


所以这次的提示语难度相当高,


我是一名用户体验设计师,需要创建一个网站每天自动更新新的设计趋势和资源。
使用在线搜索工具,搜索X(Twitter)和Reddit等社交媒体上用户体验博客作者的最新动态和信息及资源。
网站每日更新一次,更新时间为美国东部时间18:00,持续更新一年。


完成输入后,Neo 开始了一场超长的“规划”动作,


先来看看它长到有点离谱的执行过程,



这些平行的块就是搜索过程,它们最终会汇总成一个完整的文本版日报。



成功运行第一次后,Neo就会将任务需求、时间、注意事项等固定下来,



而且改改需求会可以变成定时发送邮件,



我什么都没动。


Neo 自己选、自己写、自己配图、自己排版、自己发邮件。


限制 Neo 的只剩下钱包里的 Token 额度了。


这里值得额外提一嘴,


flowith 用的是无限画布的形式,


不同于 OpenAI Deep Research 一次性输出结果,中间节点的输出的过程都可以进行二次追问。



02|无限上下文


如果说以 OpenAI Deep Research 为代表,


Agent 擅长使用联网搜索收集多个信息源,通过推理模型筛选事实性信息,再整合输出研究报告。


Neo 就是在这个基础上再将能力放大两倍不止。


请在全网范围内搜索并了解《流浪地球》系列电影的背景和剧情,基于其世界观和故事线,创作《流浪地球3》的续集剧本,时长不少于两小时。每个关键剧情段落需配备相应的剧情概念图,并绘制完整的剧情发展脉络图。同时,为剧本中的关键场景和角色设计插图。开发一个支持多语言的网页平台,展示剧本内容、插图、角色介绍和剧情发展图,提供沉浸式的阅读体验。


一般 Agent 看到这个指令就挂了。


Neo 做到了什么?



一样是夸张的任务数量,



Neo 先是检索了《流浪地球》的背景、人物、主线,还找到了导演的采访信息,合理的推测出后续的剧本



这剧情,我有点入迷


给每个关键剧情、人物角色,甚至是宇宙现象都配了概念图,


每一张图都可以单独下载


然后开始生成网页,这一步非常像真人开发,先打一个能看全中英双语的粗网页,再优化UI、最后轮到交互动画。


这不是“响应式 AI”,这是“主动构建型智能体”。


它懂剧情节奏,懂结构逻辑,懂多模态联动,甚至还懂用户要什么样的体验。


三、无限工具


最后这一类我纠结了半天,


无限工具是指类似 600多个 MCP Servers 全封装进 Neo,


还是指 Neo 有自己的一套云端方案,理论上可以安装所有的已知工具。


都不是,


体验之后才发现真正无限的是 Agent,


在 Neo 里,Agent 可以主动给自己创建 Agent 来完成任务,无限套娃。


听起来有点拗口,我们结合案例来看看:



案例来自我的好朋友@倒放


很明显,这次是要考 Neo 生图能力,


因为我给的已经不是具体的提示语了,它会自主搜集信息、完成提示语编写和图片生成的所有步骤,



这里面它就创建了


搜索 Agent、生图 Agent、文档生成 Agent



还有一个我很喜欢的 case,看视频合集 & PPT制作


完整并深度观看视频(地址:【这里看的是40分钟的 MIT 线性方程教学】),输出针对初学者的教学计划、PPT幻灯片,附加练习和说明。



ppt制作的很全,而且也给出了相应的答案,当初我上大学的时候如果有这玩意,我不知道得是个多么开心的小孩。


还有,


这些案例,量大管饱:


  1. 生成一份比较报告,收集并分析 Nvidia 和 AMD 消费级显卡自2005年以来的更新与迭代,重点关注技术特性和性能迭代幅度。


flo.host/tFRhc9Q/


2. 重写权力的游戏第八季


flo.host/eBJp02r


3. 给《黑神话:悟空》做一个宣传网页


flo.host/69tglwV


4. 以可视化的方式展示2022年至2025年5月人工智能领域重大投融资及并购事件。



5. 使用交互式网页生成最佳选座指南,看来Neo坐飞机也喜欢前排


flo.host/xiHoqI0/


6. 特斯拉Q1分析PPT


也有惊喜!


使用方法很简单,


因为邀请码相当有限,在评论区留下你对 Neo 的看法或者是最想让 Neo 帮你做的一件事,我会随机抽取16个,


同时上面提到的所有案例都整理好了,公众号回复“neo”就可以获取。


来看看 flowith 的基础玩法吧,


🔗 flowith.io



Agent 模式就是 Agent Neo,目前一天的对话次数是20次,一天快超过 OpenAI 一个月的量了。。。


flowith 集成的模型堪称豪华,gpt/o3/o4 mini、deepseek、claude、gemini、grok、glm、ideogram、flux、recraft、kling v1.6、veo2,可以满足基本对话联网搜索图片视频生成提示词生成,以及我使用频率最多的比较模式


flowith 本身还带知识库功能,让知识重新流动,



内置了365个知识库,


在对话开始的时候可以选择是否让模型读取知识库。


写在最后


我打心底佩服 flowith。


这群在硅谷+上海两地作战的年轻人,用不到一年时间,从 Agent Oracle 到 Neo,已经完成了我原以为五年都做不到的事情:


构建了一个真正有自我主张、有计划、有创作欲望的智能体。


flowith 从来不是做模型的,


他们做的是“AI如何变成你的工作搭档”。


Neo 就是一个现在进行时。


它已经在跑任务,在接工作,在接管我们过去每天需要10个app和3个同事的事情。


你可以说它是 Agent,也可以说它是原型 AGI。


但我更愿意说:它是未来人类工作结构的一个前哨。


我现在已经不再纠结“用哪个模型”。


我只想知道:这个 Agent 能不能在我不说话的时候,自己把事情做完。


Neo 能。


而且做得不差。


我非常清楚,它仍有很多不足:


一些任务复用时需要你重复解释 prompt


个别模型调用失败时会卡在流程里,


网页生成部分仍不够美观,需要设计师介入,


但我一点都不在乎。


因为这已经是我目前见过超像 AGI 的 Agent 了。


它能在你睡着时,帮你跑完 30 个流程;


能在你不回复时,继续重试并找方案;


能在你没说清楚时,主动给出预案和建议;


这就够了。


你可能现在还在犹豫要不要用 Agent。


但我建议你至少去试一次 Neo。


别再研究模型的推理方式、提示语写得如何复杂。


试着让 Neo 做一件你已经厌倦的事情,比如每天抓 AI动态,比如收集演讲视频并写结构化 PPT,比如写新闻分析。


然后你会发现:


有一天,你真的不需要动手,


一整套工作流,就被 AI 自动完成了。


工作变成了和 Neo 对话,而不是用手敲字。


这不就是我们曾经梦想的“AI时代”?


现在真的开始了。


欢迎来到未来。


欢迎加入Neo。


文章来自于“卡尔的AI沃茨”,作者“卡尔”。