IT之家 3 月 28 日消息,微软于 2024 年 12 月邀请 Copilot Pro 用户测试之后,现已邀请非 Pro 的美国地区用户,在 Microsoft Edge 浏览器中测试 Copilot Vision 功能。
IT之家援引科技媒体 Windows Latest 实测结果,显示该功能虽能识别页面内容,但存在响应中断、交互受限、视野范围狭窄等明显缺陷,目前仅适合提取基础信息,尚不具备实用价值。
Copilot Vision 功能原仅限 Copilot Pro 付费用户使用,现已扩展至美国地区免费用户,但需通过 Edge 浏览器侧边栏调用。
操作流程是用户在 Bing 搜索“Copilot Vision”并点击匹配结果,接受条款后,通过侧边栏语音图标激活“眼镜”按钮,按钮高亮即表示可扫描当前网页。
该媒体实测发现该功能目前仍属于“半成品”,测试中多次出现回答中断或陷入循环,需重复提问才能获取不完整答案。例如,要求描述网页内容时,Copilot 中途停止响应 15 秒后突然切换答案。
此外在交互方面,无法执行点击、播放视频等操作,甚至拒绝用户“停止说话”的指令,称“无法访问页面元素”,此外仅能识别屏幕可见区域内容。
在信息处理方面,依赖页面现有文字,无法主动检索网络数据,滚动页面后无法关联此前识别的相关信息。
该媒体认为当前 Copilot Vision 更像“半成品”,其扫描范围窄、逻辑混乱等问题大幅降低实用性。微软需优化滚动浏览、跨页检索等核心功能,才能兑现 AI 助手的潜力。免费开放或许是为收集用户反馈,但现阶段仅建议用于简单页面摘要。
相关阅读: