Microsoft Bing Chat的GPT-4集成为Windows 11带来强大的图像识别功能
微软Bing聊天在桌面端进行了另一个重大更新,增加了图像识别支持,即OCR。该功能使用OpenAI的ChatGPT-4视觉模型来检测和理解图像中的对象,并使用实际例子对图像进行详细解释。
微软正在向全球部分用户推出Bing聊天的视觉功能。更新后,您会注意到在语音图标旁边多了一个选项,允许您直接上传图像到聊天中,或从互联网上粘贴图像并要求Bing解释。
这个功能正式称为“图像识别”,只有一些用户告诉我们他们有权访问它,这表明它可能是一个随机的A/B测试。微软官员在一份声明中确认了Bing视觉功能的推出,针对使用Bing聊天的用户不到10%的人,证实了我们的猜测,即这是一个随机的A/B测试。
根据微软的说法,您可以期待在接下来的几周内,Bing视觉选项会对所有人显示出来。
需要注意的是,这个功能也包含在Windows Copilot中。您可以从桌面或文件资源管理器中拖动一个图像,将其放入Copilot中,并要求人工智能解释图像或创建类似的图像。最后,您可以直接将图像复制到PowerPoint、Word或剪贴板中。
Bing聊天即将登陆Chrome和Safari。
微软在5月份短暂测试了Bing聊天在Safari和Chrome中的支持,我们预计很快会有正式公告确认扩展。虽然可以通过修改用户代理来让Bing聊天在Chrome中运行,但这可能会感觉不必要,尤其是考虑到Bard和其他聊天机器人都很容易访问。
除了Chrome和Safari的支持,微软还计划利用微软的人工智能改进Bing图像创建工具。
该功能很可能通过Bing插件集成而变得更好,微软官员表示,微软计划进行“大规模插件推出”,以扩展Bing聊天的功能。
公司计划将每个功能都变成一个插件,并创建不同的搜索方式。
微软已经对Bing聊天进行了几项重大改进,例如取消对Microsoft账户的支持。
以前,微软通过强制用户使用Microsoft账户进行登录来限制用户。随着微软现在试图推动Bing AI的采用,这种限制已经被取消,而不再强制要求使用Microsoft账户或Edge等其他服务。