Chat Bot
- ChatGPT:全能型选手,目前最常用
- Gemini:大上下文,搜索面积广
- AI Studio (Google):用来分析 Youtube 视频 YYDS,还免费
浏览器
Comet (Perplexity)
- 官网:https://www.perplexity.ai/comet
- 定位:Perplexity 出品的 AI 原生浏览器,基于 Chromium 内核,首款免费提供代理式浏览功能的浏览器
- 核心功能:
- 智能地址栏:同时支持 URL 和自然语言输入,Shift+Enter 调用 AI 助手
- Comet Assistant 侧边栏:不只回答问题,还能直接操作网页——总结内容、填写表单、预订服务、管理邮件和日历、辅助购物
- 后台多 Assistant 并行:多个 AI 助手可异步后台处理待办任务
- 高亮文本即时解释:选中任意文本获取即时解释,无需离开当前页面
- AI 标签预览:悬停标签页查看内容摘要
- 多模型选择:可切换 OpenAI / Anthropic / Meta 等不同模型
- 语音指令:Shift+Option+V 语音交互
- 定价:免费(完整代理式浏览);Plus $5/月(优质内容);配合 Perplexity Pro/Max 使用更强
- 平台:macOS / Windows(2025.7)、Android(2025.11)、iOS(2026.3.18)
- 已知局限:AI 驱动的购物车自动化等操作偶有失败;AI 功能激活时资源消耗较高(建议 16GB RAM)
AI Coding
Cursor
- 官网:https://cursor.com/
- 定位:AI 原生代码编辑器(基于 VS Code 完全重构),目前最流行的 AI IDE
- 核心功能:
- Agent 模式:处理复杂的多文件任务,自主重构应用
- Tab 补全:高精度的后台预测补全,编码体验流畅
- 全代码库感知:索引整个代码库,基于文件内容、结构和依赖关系响应
- 实时错误检测:识别终端中的堆栈跟踪,提供上下文感知修复
- 多模型切换:同一会话中切换 GPT-5.3-Codex / Claude Sonnet 4.5 / Gemini 3 Pro 等
- Auto 模式:自动选择最优性价比模型,无限使用,不消耗积分
- 可视化 Diff:出色的差异对比和代码应用准确度
- 定价:Hobby 免费(基础体验);Pro
20/月(20 积分池 + 无限 Tab 补全和 Auto 模式);Pro+60/月(3 倍积分);Ultra200/月;Teams $40/用户/月。学生认证可免费获得一年 Pro - 平台:macOS / Windows / Linux
- 最新动态:2026.1 推出 CLI 版本支持 Agent 模式;积分制替代请求计数制
- 注意:手动选择高端模型(Claude Opus、GPT-4o)会消耗积分,重度用户报告每日超额 $10-20
Kiro (Amazon)
- 官网:https://kiro.dev/
- GitHub:https://github.com/kirodotdev/Kiro(开源)
- 定位:亚马逊推出的”规格驱动开发” AI IDE,基于 Code OSS(VS Code 开源版)
- 核心功能:
- Spec-Driven Development:将自然语言提示词转为详细规格,再转为代码、文档和测试,确保输出与需求严格一致
- Hooks 自动化:在特定触发条件下自动执行任务(如文件保存时检查代码异味、自动同步文档)
- 自主代理:可连续工作数天,跨会话保持持久上下文
- Powers:预打包的 MCP Server + steering 文件 + 代理钩子注册表,即装即用
- MCP Server 支持:连接外部工具和数据源
- Steering 引导:通过 markdown 文件自定义代理行为
- 模型:底层使用 Claude Sonnet 4
- 定价:Free(50 积分);Pro
20/月;Pro+40/月;Power200/月;超额0.04/积分。新用户奖励 500 积分(30 天有效) - 平台:macOS / Windows / Linux
- 最新动态:2025.12 re:Invent 发布自主代理;2026 年与 Amazon Aurora DSQL / SageMaker 集成
- 适合:结构化团队开发,需要高确定性输出的场景
Antigravity (Google)
- 官网:https://antigravity.google/
- 定位:Google 的 Agent-First IDE(VS Code 深度修改分支),2025.11 随 Gemini 3 发布
- 核心功能:
- 双视图模式:Editor View(传统 IDE + 代理侧边栏)和 Manager View(多代理编排控制中心)
- Artifacts 可验证交付物:代理生成任务列表、实现计划、截图、浏览器录制等,而非仅展示工具调用
- 自我改进知识库:代理可保存有用的上下文和代码片段,改进后续任务
- 浏览器集成:代理可操作浏览器执行验证
- 模型:Gemini 3.1 Pro / Claude Sonnet 4.6 / Claude Opus 4.6 / GPT-OSS-120B
- SWE-bench:76.2%
- 定价:个人免费(公共预览期,周度配额);AI Pro
20/月;AI Ultra249.99/月;额外 AI Credits $25/2500 积分 - 平台:macOS / Windows / Linux
- 注意:2026.3 定价调整引发社区不满,Pro 用户报告配额被大幅削减
- 适合:原型搭建 + 架构设计,Manager View 多代理编排是独特优势
Claude Code
- 官网:https://claude.ai/code
- 定位:Anthropic 官方终端编码代理,交互式深度推理
- 核心功能:
- 1M token 上下文窗口(Opus 4.6),token 效率比 Cursor 高 5.5 倍
- 研究 → 规划 → 执行 → 测试的完整工作流
- SubAgent 子代理:调研类任务扔给子代理,不占主会话上下文
- Worktree 并行开发:多个任务并行互不干扰
- CLAUDE.md 项目规则书:每次对话自动加载,等于永久记忆
- Hooks 机制:编辑完自动跑 lint / typecheck,阻断修改受保护文件
- Plan Mode / Markdown 方案流:方案没确认,绝不动代码
- 定价:需 Claude Pro
20/月 或 Max100-200/月 或 API 按量计费 - 平台:macOS / Windows / Linux(终端)
- 适合:复杂的多文件深度操作、需要最大上下文和最强推理的场景
Codex CLI (OpenAI)
- 官网:https://openai.com/codex/
- GitHub:https://github.com/openai/codex(开源,Rust 构建)
- 定位:OpenAI 的轻量级终端编码代理 + 云端异步执行
- 核心功能:
- 异步云端任务:
codex cloud exec将任务委托给云端代理,无需实时监控 - Skills 系统:可扩展代码生成之外的能力(信息搜集、问题解决等)
- Automations 定时任务:让 Codex 在后台按计划执行
- 沙箱安全:默认在隔离环境中运行,网络访问关闭
- IDE 扩展:支持 VS Code / Cursor
- 代码审查:GPT-5-Codex 可在 PR 中自动审查代码、发现 bug
- 异步云端任务:
- 模型:GPT-5-Codex(1M token 上下文)
- 定价:CLI 免费开源;需 ChatGPT Plus
20/月(每 5 小时 30-150 次本地任务)或 Pro200/月;API 按量计费(codex-mini1.50/M 输入、6/M 输出) - 平台:macOS / Windows / Linux(终端);macOS / Windows 桌面应用(2026.2-3 发布)
- 适合:后台自主执行、“告诉它做什么然后等结果”的异步工作流
OpenCode
- 官网:https://opencode.ai/
- GitHub:https://github.com/opencode-ai/opencode(~95K stars)
- 定位:开源、提供商无关的 AI 编码代理
- 核心功能:
- 支持 75+ LLM 提供商:完全 BYOK,包括 Claude / GPT / Gemini / DeepSeek / 本地模型
- 三种使用形态:终端 TUI(Bubble Tea 构建)/ 桌面应用 / IDE 扩展
- 内置代理:Build(全权限开发)和 Plan(只读分析探索)
- 隐私优先:不存储代码或上下文
- LSP 集成 + Vim 风格编辑器 + 多会话管理(SQLite 持久存储)
- 本地模型支持:通过 Ollama 运行,完全消除 API 成本
- ACP 协议:兼容 JetBrains / Zed / Neovim / Emacs
- 定价:核心工具完全免费开源(BYOK);Go
5-10/月(托管开源模型);Zen20 起(按量,精选优化模型) - 平台:macOS / Windows / Linux
- 适合:追求灵活性和成本控制、不想锁定特定厂商的开发者
Terminal
Warp
- 官网:https://www.warp.dev/
- 定位:Rust 编写、GPU 渲染的现代终端,定位为 “Agentic Development Environment”
- 核心功能:
- Block 模式:每条命令及输出视为独立”块”,可单独滚动、复制、重运行(区别于传统终端最大的交互革新)
- IDE 式编辑器:支持文本选择、光标定位,像在编辑器中编辑命令行
#自然语言转命令:输入#即可用自然语言描述想要的命令- Oz 编排平台(Warp 2.0):同时运行多个 Agent(Warp Agent / Claude Code / Codex / Gemini CLI),支持跨仓库复杂变更
- Session Sharing:通过链接即时共享终端会话,对方无需 Warp 账号,可在浏览器查看甚至接管控制权
- Warp Drive:团队协作工作区,保存和共享 Workflows / Notebooks / Prompts
- GitHub Actions 集成:CI 中运行 Warp Agent,PR/Issue 中通过
@warpdotdev触发修复 - 交互式命令监控(2026 新功能):Agent 能监控长时间运行的命令,识别交互式提示并自动响应
- AI 模型:内置 GPT-4o / Claude Sonnet 4 / Gemini,支持 BYOK
- SWE-Bench:71%
- 定价:终端完全免费;Build
20/月(1,500 AI 额度,支持 BYOK,未用额度滚存一年);Business50/月(SSO / SOC 2 / 团队共享额度) - 平台:macOS(Intel / Apple Silicon)/ Windows(x86_64 / ARM64)/ Linux(x86_64 / ARM64)
- Shell 支持:bash / zsh / fish / PowerShell;Windows 支持 WSL2 / Git Bash
- 最新动态:2025.2 Windows 版发布;2025.6 Warp 2.0 转型 ADE;2026 年推出 Ambient Agent、多 Agent 编排
播客
Podwise
- 官网:https://podwise.ai/
- 定位:AI 驱动的播客知识管理工具,核心理念”少听多学”(Listen Less, Learn More),79,000+ 活跃用户
- 核心功能:
- AI 摘要:将数小时播客浓缩为几分钟可读摘要
- 关键洞察提取:智能分析每集内容,提取核心观点和金句
- 高精度转录:可搜索的完整文字转录稿
- 思维导图:可视化呈现内容结构与观点关联,可导出
.xmind格式 - 互动问答(Ask Podwise AI):对任意一集提问并获得即时回答
- 多语言翻译:支持英语、简体中文、繁体中文、日语、韩语、法语等 9 种语言
- 全文搜索:深入内容查找特定讨论,不限于标题
- 集成:Obsidian / Notion / Readwise / Logseq;导出 Markdown / XMind / PDF / SRT
- 内容来源:Apple Podcasts 索引、自定义 RSS 订阅、YouTube 视频
- 定价:Free(每月浏览 4 集,每日 3 次 AI 查询);Standard
5.90/月(20 集/月,50 次/日查询,导出到笔记工具);Pro11.90/月(50 集/月,无限 AI 查询)。年付享 40% 折扣,7 天退款保证 - 平台:Web / iOS App / Android APK / PWA
- 最新动态:iOS 原生应用上线、YouTube 视频支持、蓝牙设备控制、即将支持上传自有音频文件
知识库
NotebookLM (Google)
- 官网:https://notebooklm.google/
- 定位:Google Labs 开发的 AI 研究助手,基于 Gemini,核心特点是源文档锚定(Source Grounding)——AI 回答严格基于用户上传的文档,大幅减少幻觉
- 核心功能:
- 源文档锚定:所有回答附带内联引用标注,点击可定位到原文
- Audio Overview:将文档转化为播客风格 AI 对话,4 种格式——Deep Dive(深度探讨)/ The Brief(2 分钟简报)/ The Critique(评论)/ The Debate(辩论),支持 80+ 语言
- Video Overview:生成带动画、图表和旁白的视频概览,2026 年推出 Cinematic Video Overviews
- Studio 面板一键生成:思维导图 / 幻灯片(可导出 PDF 和 PPTX)/ 信息图 / 数据表格 / 闪卡 / 测验 / 学习指南
- Deep Research:自主浏览数百个网站,制定研究计划,生成锚定报告
- 移动端:Android / iOS 应用,支持离线 Audio Overview
- 支持源类型:PDF / Google Docs / Google Slides / 网页 / YouTube 视频 / MP3 音频 / 图片(JPEG / PNG)
- 定价:Free(100 笔记本 / 50 源 / 50 查询/天 / 3 次 Audio & Video/天);Plus(Google Workspace
14/月,200 笔记本 / 100 源);Pro19.99/月(含 Gemini Advanced + 2TB 存储,500 笔记本 / 500 查询/天);Ultra250/月(重度用户);Enterprise9/许可证/月 - 最新动态:2026.1 可作为 Gemini App 的源添加;2026.2 幻灯片编辑 + PPTX 导出 + Gemini 3.1 Pro 集成;Cinematic Video Overviews 发布;Google Classroom 集成
搜索 / 研究
Perplexity
- 官网:https://www.perplexity.ai
- 定位:AI 驱动的”答案引擎”,估值 $212 亿,月搜索量 12-15 亿次
- 核心功能:
- Deep Research:自动执行数十次搜索、阅读数百个来源并推理分析,2-4 分钟完成需人类专家数小时的研究工作。运行 Claude Opus 4.6,SimpleQA 准确率 93.9%
- Model Council(仅 Max):同时运行三个前沿模型(如 GPT-5.2、Claude 4.6)并对比输出,获得更高置信度
- Perplexity Computer(仅 Max):全代理式 AI 系统,拆解目标为步骤,调度 19 个 AI 模型的专用子代理协同完成任务
- Finance 金融分析:实时市场数据、财报摘要、SEC 文件、分析师评级和市场热力图,40+ 实时金融工具,数据源 FactSet / S&P Global / Coinbase,支持通过 Plaid 连接券商分析投资组合
- 增强记忆引擎:信息召回率从 77% 提升至 95%
- 定价:Free(无限基础搜索 + 每日 5-10 次高级查询);Pro
20/月 / 年付200(无限 Pro 查询、多模型切换、文件上传分析);Max200/月 / 年付2,000(Model Council + Computer);Enterprise Pro40/席位/月;Enterprise Max325/席位/月 - 最新动态:2026.1 与 Microsoft Azure 签署 $7.5 亿三年 GPU 承诺;2026.2 推出 Model Council 和 Perplexity Computer;停止广告,全面转向订阅优先
全能 Agent
Manus
- 官网:https://manus.im
- 定位:通用型自主 AI 代理(Monica.im 团队开发),“Manus”拉丁语意为”手”——将思考转化为行动。2025.12 Meta 宣布收购(估值 $20-30 亿,正接受中国监管审查)
- 核心功能:
- 多代理协作系统:多个专用 AI 代理协同工作,各自负责网页浏览、数据分析或代码编写
- 全自主执行:给定目标后自动收集信息、运行脚本、管理文件并汇总结果
- 后台运行:可在后台处理长时间任务,断线后继续执行,完成后推送通知
- 实时仪表板 “Manus’s Computer”:实时查看代理操作过程——打开了什么页面、执行了什么搜索
- AI 网站构建器:对话生成全栈 Web 应用,含前后端 / 数据库 / 用户认证 / Stripe / SEO
- Wide Research 广域研究:跨多个来源并行研究
- 记忆与个性化:记住用户偏好的输出格式、写作风格和工作流习惯
- 定价:Free(每日 300 积分 + 1,000 启动积分,1 个并发任务);Standard
20/月(4,000 积分);Customizable40/月(8,000 积分);Extended $200/月(40,000 积分)。年付省 17% - 典型场景:深度研究报告 / 竞品分析 / 快速原型开发 / 数据分析可视化 / 旅行规划 / 演示文稿
- 注意:积分消耗不透明(一个复杂研究任务可消耗 500-900 积分,无法提前预估成本);可靠性仍有不足,不建议用于关键业务流程;输出质量参差不齐