推荐使用国际直连GPT,立即访问: www.chatgp1.com
OpenAI于11月15日在X平台上宣布了一项重要进展:ChatGPT现已能够与macOS和Windows桌面上的多种应用程序实现协同工作。这一举措标志着OpenAI首次直接涉足计算机视觉与代理控制领域。
此次早期测试版更新声称,ChatGPT能够检查编码应用程序,为Plus和Team用户提供更为精准的答案。它不仅能够辅助使用VS Code、Xcode、Terminal及iTerm2等代码编辑器,还能与用户进行对话(借助其语音辅助功能),支持用户截取屏幕截图、上传文件以及通过网络搜索(借助SearchGPT)。
此前,Anthropic已向iOS和Android平台的所有用户开放了Claude Artifacts功能,使得任何人都能轻松创建应用程序,而无需编写任何代码。
ChatGPT在桌面端的一个极为实用的功能便是能够解答用户的任何问题。用户只需选择任意文档的任意部分,随后打开ChatGPT询问其含义、解释或反馈。这无疑是ChatGPT核心功能在桌面端的一次重要实现。
这一进展紧随一天前关于OpenAI代理“Operator”的讨论之后,该代理预计将于2025年1月发布。“The Rundown AI”的创始人Rowan Cheung推测,未来的趋势将是允许ChatGPT作为代理来控制和查看桌面。
OpenAI在这一领域紧随其后。今年10月,微软推出了“Copilot Vision”,旨在通过Copilot重塑自主工作流程。据微软介绍,这些自主代理将成为人工智能驱动世界的新型“应用程序”,代表个人、团队和部门执行任务、管理业务功能。
同时,微软还在Dynamics 365中引入了十个新的自主代理,以自动化组织的潜在客户开发、客户服务和供应商沟通等流程。
随后,Anthropic发布了全新的Claude 3.5 Sonnet模型,该模型将借助测试版功能“计算机使用”来控制计算机,这一消息引起了广泛关注。该公司报告称,该模型在代理编码任务方面取得了显著进展,这些任务涉及AI自主生成和操作代码。
Anthropic对于Claude计算机功能的方法尤为引人注目,因为它无需依赖多个代理来执行不同任务;相反,单个代理即可管理多个任务。
正如之前AIM所对比的,微软将Copilot集成到了MS Excel中,而Claude则能够直接操作Excel,这使得Copilot的存在受到了质疑。
OpenAI同样不甘示弱,尽管Anthropic和其他公司(如预计本月发布的谷歌Jarvis)已经在AI行业占据了一席之地。OpenAI的重点已从功能扩展转向界面优化。
OpenAI通过推出Swarm框架加入了这场竞争,Swarm框架是一种用于创建和部署多智能体AI系统的方法。它简化了创建和管理多个AI智能体的过程,有助于它们协同完成复杂任务。
随后,ChatGPT在桌面端的推出标志着人工智能先驱在改变聊天机器人使用方式方面迈出了重要一步,并将在1月份通过“Operator”得到进一步增强。
如今,聊天机器人不仅能够提供答案、成为用户的伙伴,还能协助完成日常任务。