OpenAI首次在通用模型中内置原生电脑操控功能。GPT-5.4能直接操作软件、浏览网页、控制鼠标和键盘完成任务,可与电子表格、金融分析工具等企业应用深度整合;桌面导航能力得分超越人类基准水平,网络搜索测试得分创新高,职业知识测试得分达到或超越专业人士;引入工具搜索机制大幅降低token消耗。GPT-5.4分擅长复杂推理的Thinking和高性能的Pro两版本,上下文窗口最高100万token,定 ...
刚刚,Anthropic 官宣收购 Vercept,要给 Claude 的 Computer Use 能力加把火。 Vercept 是一家西雅图的 AI 初创公司,去年 9 月成立,团队只有 10 个人左右,但来头不小:五位联合创始人全部出自 AI2 ...
说一个很多人可能不知道的事。在国产大模型里,MiniMax的编程能力其实一直挺能打的。很早之前,当其他产品还在依赖单模型的代码能力时,MiniMax就用上了Agent形态的编码——不仅能输出代码,还能自动检测代码、自动测试并修复bug。只是这家公司一直比较低调。最近他们更新了M2.5。我看了一眼参数——激活参数量只有10B。但 ...
Zero-day exploits, AI-driven Android malware, firmware backdoors, password manager trust gaps, rising DDoS define this week’s critical cyber threats.