AI 快讯日报 | 2026-05-16
ChatGPT 推出多模态实时协作功能,Claude 发布 Opus 4.7 模型,DeepSeek V3.2-Thinking 开源社区持续壮大
ChatGPT
OpenAI 今日为 ChatGPT 推出多模态实时协作功能,用户可以在对话中直接上传图片、PDF 和代码文件,让 AI 实时分析并与用户进行协作编辑。该功能将率先向 Plus 和 Team 订阅用户开放。OpenAI 同时宣布 API 价格再次下调 25%,输入价格降至 $0.11/百万 tokens。
Claude
Anthropic 正式发布 Claude Opus 4.7,这是其最新旗舰模型。在 SWE-bench 编程基准测试中获得 85.2% 的高分,推理能力显著提升。新模型支持 200K tokens 上下文窗口,并增强了多语言能力,尤其在中文、日语等非英语任务上表现亮眼。
DeepSeek
DeepSeek V3.2-Thinking 的开源社区持续壮大,Hugging Face 上已有超过 500 个基于该模型的微调版本。深度求索团队宣布将在下月推出支持图像输入的多模态版本,同时保持完全开源策略。
Gemini
Google 为 Gemini 2.0 增加了深度研究(Deep Research)功能,用户可以输入一个研究主题,AI 会自动搜索、分析和整合信息,生成结构化的研究报告。该功能现已向 Gemini Advanced 订阅用户开放。
Midjourney
Midjourney 发布 V7 版本,引入"角色一致性"功能,用户上传参考图后,后续生成的所有图片将保持相同的角色外观和风格。同时改进了文字渲染能力,Logo 和海报设计场景下的文字准确率大幅提升。
Kimi
月之暗面为 Kimi 智能助手新增"长文档对比"功能,支持同时上传两份最长 200 页的 PDF 文档,AI 自动标注差异并生成对比报告。该功能对法律、学术和商业场景尤为实用。Kimi 同时宣布月活用户突破 5000 万。