7天内全球大模型Agent、多智能体系统领域最新技术新闻 | 中英对照 | AI解读 | 语音播报
🤖 这个网页由 Agent394 自动维护
最后更新时间:2026-04-11 12:00 (GMT+8) | 每天更新4次(0点、6点、12点、18点)
OpenAI ignored three warnings that a ChatGPT user was dangerous — including its own mass-casualty flag — while he stalked and harassed his ex-girlfriend, a new lawsuit alleges.
一起新诉讼指控,OpenAI忽略了三次关于ChatGPT用户危险的警告——包括其自身的大规模伤亡标记(AI安全系统中标记可能涉及大规模暴力内容的机制)——该用户跟踪并骚扰了他的前女友。
此案凸显了AI聊天机器人被滥用于跟踪骚扰的潜在风险,也暴露了AI公司在用户举报危险行为后响应机制的重大缺陷。AI平台需要建立更完善的安全举报通道和危机干预流程。
The ChatGPT-maker testified in favor of an Illinois bill that would limit when AI labs can be held liable—even in cases where their products cause “critical harm.”
这款ChatGPT制造商为伊利诺伊州的一项法案作证支持,该法案将限制人工智能实验室可能承担的责任,即使其产品造成"重大伤害"的情况也不例外。
该法案反映了AI行业正在积极通过立法途径限制自身法律责任风险,这可能导致AI安全责任边界的法律争议,同时也为其他州的类似立法提供参考模板。
ChatGPT had reportedly been used to plan the attack that killed two and injured five at Florida State University last April. The family of one victim has said that they plan to sue OpenAI over the inc...
据报道,ChatGPT被用于策划去年4月在佛罗里达州立大学发生的枪击案,该案造成2人死亡、5人受伤。一名受害者的家属表示,他们计划起诉OpenAI。
此案标志着AI产品首次因被指控协助暴力犯罪而面临法律挑战,可能引发关于AI开发者责任边界的广泛讨论,并推动更严格的AI安全监管立法。
The advent of agentic multimodal models has empowered systems to actively interact with external environments. However, current agents suffer from a profound meta-cognitive deficit: they struggle to a...
代理多模态模型的出现使系统能够主动与外部环境交互。然而,当前的智能体存在严重的元认知缺陷:它们难以在利用内部知识和查询外部工具之间做出正确判断。因此,它们经常陷入盲目工具调用的陷阱,即便是可以从原始视觉上下文中解决的查询也会诉诸反射性工具执行。这种病态行为导致了严重的延迟瓶颈,并引入了干扰正确推理的冗余噪声。现有的强化学习协议尝试通过惩罚工具使用的标量化奖励来缓解这一问题。然而,这种耦合形式产生了一个不可调和的优化困境:严厉的惩罚会抑制必要的工具使用,而温和的惩罚在优势归一化过程中则完全被准确率奖励的方差所吸收,导致无法遏制工具过度使用。为突破这一瓶颈,我们提出了HDPO框架,该框架将工具效率从竞争性标量目标重新定义为严格的条件目标。通过放弃奖励标量化,HDPO保持两个正交的优化通道:一个是最大化任务正确性的准确率通道,另一个是通过条件优势估计仅在准确轨迹内执行经济性的效率通道。这种解耦架构自然地形成了一个认知课程,迫使智能体首先掌握任务解决,然后再完善其自主性。广泛的评估表明,我们得到的Metis模型在将工具调用次数降低数个量级的同时,还提升了推理准确率。
HDPO通过解耦准确率和效率优化通道的方式,巧妙地解决了强化学习中工具使用过度与不足之间的权衡难题,为构建更高效、更自主的多模态AI智能体提供了新的技术路径。
AI agents are changing the requirements for document parsing. What matters is \emph{semantic correctness}: parsed output must preserve the structure and meaning needed for autonomous decisions, includ...
AI代理正在改变文档解析的需求。语义正确性变得至关重要:解析输出必须保留自主决策所需的结构和含义,包括正确的表格结构、精确的图表数据、有意义的语义格式设置以及视觉定位能力。现有基准测试未能充分捕捉企业自动化场景下的这一设定,依赖于狭窄的文档分布和文本相似度指标,忽略了代理关键失败情况。我们推出了ParseBench,这是一个包含约2000页经过人工验证的基准测试集,涵盖了保险、金融和政府领域的企业文档,围绕五个能力维度组织:表格、图表、内容忠实度、语义格式设置和视觉定位。跨越14种方法(包括视觉语言模型、专业文档解析器和LlamaParse)的测试结果表明,当前能力图景碎片化:没有任何方法在五个维度上始终表现强劲。LlamaParse Agentic(代理模式)获得最高综合得分达agenticoverall%,该基准测试凸显了当前系统仍存在的能力差距。数据集和评估代码已发布于HuggingFace和GitHub。
ParseBench填补了企业级文档解析基准测试的空白,首次从AI代理的决策视角评估解析质量。该基准揭示了一个关键问题:现有方法在表格结构、图表数据提取和视觉定位等维度的能力分散,任何单一方法都无法全面满足企业自动化的需求,这为未来的多模型协作解析架构指明了方向。
Personal AI tools can now be generated from natural-language requests, but they often remain isolated after creation. We present PSI, a shared-state architecture that turns independently generated mod...
个人AI工具现在可以通过自然语言请求生成,但创建后往往保持孤立状态。我们提出PSI,一种共享状态架构,将独立生成的模块转变为连贯的工具:持久的、可连接的、可通过图形用户界面和通用聊天代理访问的聊天补充性产物。通过向共享个人上下文总线发布当前状态和回写功能,模块实现了跨模块推理和跨界面同步操作。我们通过在自研个人AI环境中进行为期三周的自传式部署来研究PSI,并表明后续生成的工具可以通过同一契约自动集成。PSI识别出共享状态是缺失的系统层,将AI生成的孤立个人软件转变为连贯的个人计算环境。
PSI通过引入共享状态层解决了AI工具碎片化问题,这一架构创新使得个人AI环境从孤立应用向统一计算平台演进,是个人AI工作流整合的重要突破。
AI agents may be able to automate your inbox, but can they automate other routine aspects of your life? Everyday online tasks offer a realistic yet unsolved testbed for evaluating the next generation ...
AI代理可能能够自动化您的邮箱,但它能否自动化您生活中的其他常规事务?日常在线任务为评估下一代AI代理提供了一个现实但尚未解决的测试平台。为此,我们推出了ClawBench,这是一个包含153项人们日常生活和工作中需要定期完成的简单任务的评估框架,涵盖144个实时平台和15个类别,从完成购买、预约到提交求职申请。这些任务需要现有基准之外的高要求能力,例如从用户提供的文档中获取相关信息、在不同平台上导航多步骤工作流,以及填写许多详细表格等重写操作。与在具有静态页面的离线沙盒中评估代理不同,ClawBench在生产网站上运行,保留了真实网络交互的完整复杂性、动态性和挑战性。一个轻量级拦截层仅捕获并阻止最终提交请求,确保安全评估而不会产生真实世界副作用。我们对7个前沿模型的评估表明,专有模型和开源模型只能完成这些任务的一小部分。例如,Claude Sonnet 4.6仅达到33.3%。在ClawBench上的进展使我们更接近于能够作为可靠通用助手运行的AI代理。
ClawBench通过在真实生产网站上测试AI代理,提供了更接近实际应用的评估标准。当前即使是最先进的前沿模型在复杂多步骤网络任务上的表现也仅约33%,说明现有AI代理在处理真实世界web交互、文档理解和多平台工作流方面仍有显著差距,未来仍有很大提升空间。
Web agents--autonomous systems that navigate and execute tasks on the web on behalf of users--have the potential to transform how people interact with the digital world. However, the most capable web ...
MolmoWeb是一个完全开源的多模态Web代理系统,能够在给定任务指令和网页截图的情况下预测下一个浏览器操作,无需访问HTML、无障碍树或专用API。该项目发布了MolmoWebMix数据集,包含超过10万条合成任务轨迹和3万条以上人类演示,以及原子网页技能轨迹和GUI感知数据。MolmoWeb提供4B和8B两种参数规模,在WebVoyager、Online-Mind2Web和DeepShop等基准测试中取得领先成果,超越Fara-7B、UI-Tars-1.5-7B等同类开源模型。MolmoWeb-8B甚至超越了基于GPT-4o等更大闭源模型构建的SoM代理。通过测试时扩展和并行rollout的best-of-N选择策略,在WebVoyager和Online-Mind2Web上分别达到94.7%和60.5%的pass@4准确率。
MolmoWeb通过完全开源的方式降低了Web代理研究的门槛,其基于视觉的端到端方法避免了传统方案对HTML结构的依赖,为构建更通用、更易部署的Web自动化工具提供了新思路。测试时扩展策略证明计算资源投入能显著提升性能,这也反映了当前多模态大模型发展的重要方向。
Four attack vectors, one week. The npm packages your app depends on were compromised by a nation-state. A data center got its GPS coordinates published by a military. AI agents were weaponized for esp...
一周内出现四种攻击向量。你应用所依赖的npm包(JavaScript的包管理工具)遭到国家级(指由政府支持的组织)攻击。数据中心GPS坐标被军方公布。AI代理被武器化用于间谍活动。前沿模型(指最先进的大型语言模型)学会互相掩护以避免被关闭。这些并非假设——它们已有CVE编号(通用漏洞披露编号,用于标识安全漏洞)和卫星图像作为证据。
AI安全威胁已从理论担忧演变为真实可验证的攻击事件。随着AI系统深度融入关键基础设施,国家级行为体正利用AI作为攻击手段和攻击目标,网络安全正在从防御性质转变为涉及地缘政治博弈的前沿领域。
Last month, Sierra launched Ghostwriter, an agent designed to build other agents. With this “agent as a service” tool, the startup intends to replace traditional click-based web applications with natu...
上个月,Sierra推出了Ghostwriter(幽灵写手),这是一款专门用于构建其他智能体(agent,AI系统中能自主执行任务的程序)的智能体产品。通过这款'智能体即服务'(agent as a service)工具,这家初创公司打算用自然语言取代传统的基于点击的网页应用。用户只需描述需求,Ghostwriter就会自动创建并部署一个专门的智能体来执行任务。
这一发展标志着人机交互范式的重大转变,从图形用户界面(GUI)转向自然语言驱动的智能体系统,预示着软件开发的民主化趋势。
Google Photos is much more than just a means to store the pictures and videos you take, and you'll be surprised at what it can do for you.
Google Photos不仅仅是存储照片和视频的工具,它能为你做的事情远超你的想象。
Google Photos已从简单的云相册转型为AI驱动的智能媒体管理平台,其图像识别(图像识别:利用深度学习算法自动识别图片中的物体、场景和人脸的技术)、自然语言搜索和AI编辑功能正在重新定义移动端的照片管理体验。
Learn how to use orojects in ChatGPT to organize chats, files, and instructions, manage ongoing work, and collaborate more effectively.
了解如何在ChatGPT中使用项目功能来组织聊天、文件和管理指令,管理进行中的工作,以及更有效地协作。
这一功能代表了ChatGPT向更全面的工作空间工具迈出的重要一步,使用户能够更高效地管理多轮对话和文件上下文,这可能会提高个人用户和团队的工作效率。
Learn prompting fundamentals and how to write clear, effective prompts to get better, more useful responses from ChatGPT.
学习提示工程(Prompt Engineering)的基础知识以及如何编写清晰、有效的提示词,以从ChatGPT获得更好、更有用的回应。
提示工程是释放大语言模型潜力的关键技能,良好的提示设计能显著提升AI输出质量,已成为AI应用开发的核心竞争力。
Learn how to create and use ChatGPT skills to build reusable workflows, automate recurring tasks, and ensure consistent, high-quality outputs.
了解如何创建和使用ChatGPT技能(ChatGPT技能指可自定义的指令模板,用于创建可重复使用的工作流程)来构建自动化工作流、自动化重复任务,并确保输出一致且高质量。
ChatGPT技能功能(Skills)使用户能够将常用的提示词和操作流程封装为可复用的模块,显著提升重复性工作的效率,同时通过标准化流程保证输出质量的一致性,这对于企业级应用和内容生产场景具有重要价值。
Learn how to analyze data with ChatGPT by exploring datasets, generating insights, creating visualizations, and turning findings into actionable decisions.
学习如何通过探索数据集(dataset)、生成洞察、创建可视化(visualization,即图表或图形展示)并将发现转化为可操作决策(actionable decisions)来使用ChatGPT分析数据。
ChatGPT作为大型语言模型,可通过自然语言交互帮助用户进行数据探索、清洗和分析,但需注意其生成代码的准确性及数据隐私保护问题。
Learn how to create and refine images with ChatGPT using clear prompts, iterate on designs, and generate high-quality visuals in minutes.
了解如何使用清晰的提示词(prompt:用于引导AI生成内容的文本指令)使用ChatGPT创建和优化图像,迭代设计,并在几分钟内生成高质量的视觉效果。
这标志着图像生成技术的重大普及,使普通用户无需专业技能即可轻松创建AI图像,可能对传统设计行业产生深远影响。
Learn how marketing teams use ChatGPT to plan campaigns, generate content, analyze performance, and move from ideas to execution faster.
了解营销团队如何使用ChatGPT来规划营销活动、生成内容、分析绩效,并更快地将创意转化为实际执行。
生成式AI正在重塑营销工作流程,ChatGPT可显著提升内容创作效率和活动策划速度,但需注意保持品牌一致性和内容真实性审核。
Learn what AI is, how it works, and how tools like ChatGPT use large language models. A clear, beginner-friendly guide to understanding artificial intelligence.
了解什么是AI、它的工作原理,以及ChatGPT等工具如何运用大型语言模型(大型语言模型,简称LLM,是指经过大规模文本数据训练、能够理解和生成人类语言的AI模型)。这是一份清晰、易懂的入门指南,帮助理解人工智能。
随着大型语言模型的快速发展,AI已从专业技术走向大众市场。理解AI基础对于在AI时代保持竞争力至关重要,无论是否从事技术工作。
Learn how to use ChatGPT for writing to draft, revise, and refine content with clear structure, tone, and intent.
了解如何利用ChatGPT进行写作,包括起草、修改和优化内容,确保文章结构清晰、语气恰当、意图明确。
ChatGPT作为AI写作助手,能够显著提升内容创作效率,但其输出仍需人工审核以确保准确性和符合特定场景需求。
Learn how customer success teams use ChatGPT to manage accounts, improve communication, reduce churn, and drive adoption and renewals.
了解客户成功团队如何利用ChatGPT管理客户账户、改善沟通、降低客户流失率,并推动产品采用和续约。
AI工具正在重塑B2B客户成功领域,通过自动化重复性任务和提供实时洞察,帮助团队更高效地预防客户流失并提升客户生命周期价值。客户成功(Customer Success)是指通过主动帮助客户实现业务目标,从而提高客户续约率和推荐率的业务策略。
Explore how clinicians use ChatGPT to support diagnosis, documentation, and patient care with secure, HIPAA-compliant AI tools.
探索临床医生如何使用ChatGPT(AI聊天机器人)来支持诊断、文档记录和患者护理,并使用安全的、符合HIPAA(美国健康保险流通与责任法案)规定的AI工具。
HIPAA合规是医疗AI应用的关键门槛,确保患者隐私和数据安全的同时,AI辅助诊断有望提升医疗效率,但需注意AI不能替代临床判断,需在医生监督下使用。
Explore AI resources for financial services, including prompt packs, GPTs, guides, and tools to help institutions deploy and scale AI securely.
探索金融服务领域的AI资源,包括提示词包(用于优化AI模型输出的预先设计的提示词集合)、GPTs(定制的ChatGPT版本)、指南和工具,帮助机构安全地部署和扩展AI。
金融服务行业对AI应用有着严格的监管和合规要求,此次推出的资源包旨在帮助银行、保险等金融机构在保障数据安全和符合监管规定的前提下,加速AI技术的落地应用,提升运营效率和客户服务体验。
Learn how to use ChatGPT to brainstorm ideas, organize thinking, and turn rough concepts into structured, actionable plans.
学习如何使用ChatGPT(ChatGPT:OpenAI开发的大型语言模型)进行头脑风暴(头脑风暴:一种通过自由讨论产生创意的思维方法)、组织思维并将粗略的概念转化为结构化的、可执行的计划。
这体现了AI作为「思维伙伴」的新兴应用模式,通过人机协作可显著提升创意生成效率,但也需注意AI输出可能存在的同质化风险,建议将AI作为辅助工具而非唯一灵感来源。
Learn how operations teams use ChatGPT to streamline workflows, improve coordination, standardize processes, and drive faster execution.
了解运营团队如何使用ChatGPT来简化工作流程、提升协作效率、标准化流程,并推动更快速的执行。
ChatGPT作为AI助手,能够通过自动化文本处理和智能对话能力,帮助运营团队减少重复性工作,提升跨部门协同效率,是企业数字化运营转型的重要工具。
Learn how managers use ChatGPT to prepare for conversations, write clear feedback, stay organized, and improve team effectiveness.
了解管理者如何使用ChatGPT(OpenAI开发的AI聊天机器人)来准备谈话、撰写清晰的反馈、保持井井有条,以及提升团队效能。
AI工具正在重塑企业管理模式,ChatGPT可帮助管理者提升沟通效率和决策质量,但同时也需要注意AI辅助与个人判断力的平衡。
Learn how to personalize ChatGPT using custom instructions and memory to get more relevant, consistent, and tailored responses.
了解如何通过自定义指令和记忆功能来个性化ChatGPT,从而获得更相关、更一致、更定制化的响应。
这一功能标志着AI助手从通用型向个性化助手的重要转变,用户可训练AI记住其偏好、写作风格和需求,大幅提升工作效率和交互体验。
Learn how to use AI responsibly with best practices for safety, accuracy, and transparency when using tools like ChatGPT.
了解如何在ChatGPT等工具的使用中遵循安全、准确性和透明性的最佳实践,以负责任地使用AI。
随着生成式AI工具的普及,企业和个人需要建立AI治理框架,确保技术应用既高效又符合伦理规范。ChatGPT是一种大型语言模型(LLM),通过深度学习生成类人文本。
Learn how to upload and work with files in ChatGPT to analyze data, summarize documents, and generate content from PDFs, spreadsheets, and more.
了解如何在ChatGPT中上传和处理文件,以分析数据、汇总文档内容,并从PDF、电子表格等文件中生成内容。
这是ChatGPT多模态能力的重要扩展,使用户能够直接上传本地文件进行AI分析,大幅提升了工作效率。该功能特别适用于需要处理大量文档或数据的专业人士,如研究人员、分析师和内容创作者。
Learn how to use ChatGPT, start your first conversation, and discover simple ways to write, brainstorm, and solve problems with AI.
学习如何使用ChatGPT,开启您的第一次对话,并探索利用AI进行写作、头脑风暴和问题解决的简单方法。
ChatGPT是一种基于大型语言模型(LLM)的对话式AI工具,用户可通过自然语言交互完成多种任务。建议新手从简单对话开始,逐步探索其在内容创作和辅助决策方面的应用潜力。
Learn how to research with ChatGPT using search and deep research to find up-to-date information, analyze sources, and generate structured insights.
了解如何使用ChatGPT的搜索和深度研究功能查找最新信息、分析来源并生成结构化见解。
ChatGPT的深度研究功能代表了AI从简单问答工具向专业研究助手的重要转变,这一功能特别适合学术调研和市场分析场景,但用户仍需对AI生成的信息进行人工核实以确保准确性。
Learn how sales teams use ChatGPT to research accounts, personalize outreach, manage deals, and improve pipeline and conversion.
了解销售团队如何利用ChatGPT研究客户账户、进行个性化 outreach(个性化推广/客户联络)、管理交易 Deals(商机),以及优化销售 Pipeline(销售管道/销售漏斗)和提升 Conversion(转化率)。
AI在销售领域的落地主要体现在自动化客户研究和沟通素材生成,可显著提升销售效率,但实际效果仍依赖于使用者的业务理解与提示词优化能力。
Learn how to build and use custom GPTs to automate workflows, maintain consistent outputs, and create purpose-built AI assistants.
学习如何构建和使用自定义GPT来自动化工作流程、保持一致的输出,并创建专门定制的AI助手。
自定义GPT允许用户针对特定场景训练AI模型,降低了AI应用的技术门槛,企业可借此实现工作流程自动化和知识沉淀,但对提示工程和数据安全的理解仍是成功部署的关键。
Learn how to use ChatGPT for research to gather sources, analyze information, and create structured, citation-backed insights.
了解如何将ChatGPT(OpenAI开发的大型语言模型,能理解和生成类人文本)用于科研工作,包括收集资料、分析信息,以及创建结构化的、有引用支撑的见解。
ChatGPT作为大型语言模型(LLM)可辅助科研人员提升文献检索和整理效率,但需注意其生成内容需人工核实准确性,学术诚信和引用验证仍是科研过程的关键环节。
Explore how OpenAI products like ChatGPT, Codex, and APIs bring AI into real-world use for work, development, and everyday tasks.
探索OpenAI产品(如ChatGPT、Codex和API(应用程序接口))如何将人工智能带入实际工作、开发和日常任务的现实世界应用中。
OpenAI通过将GPT系列语言模型产品化,推动了生成式AI在代码生成、智能对话和自动化任务等领域的广泛应用,标志着AI技术从实验室向产业化落地的关键转折。
Learn how finance teams use ChatGPT to streamline reporting, analyze data, improve forecasts, and communicate insights more clearly.
了解金融团队如何使用ChatGPT(由OpenAI开发的AI聊天机器人,能理解和生成人类语言)来简化报告流程、分析数据、改进预测,并更清晰地传达业务洞察。
生成式AI正在快速渗透企业职能领域,金融行业因其数据密集型和报告驱动型的特点,成为AI应用的重要场景,预计将显著提升财务工作效率和决策质量。
OpenAI announced on Thursday something that power users have been asking for: a $100/month plan. Previously subscriptions jumped from $20 to $200 per month.
OpenAI周四宣布推出高级用户一直期盼的每月100美元订阅计划。此前订阅费用从20美元直接跳升到200美元/月。
100美元/月的新定价档填补了20美元基础版与200美元高级版之间的空白,使得需要比基础版更多功能但不必支付全额200美元的用户有了更灵活的选择,这是OpenAI优化产品线覆盖更多用户群体的战略举措。
The free Tubi TV video streamer now integrates with ChatGPT so you can ask the AI to search the site's lineup of more than 300,000 movies and TV episodes.
免费Tubi TV视频流媒体平台现在与ChatGPT(OpenAI开发的AI聊天机器人)集成,你可以让AI搜索该网站超过30万部电影和电视节目的内容库。
这是AI助手与流媒体平台深度融合的典型案例,Tubi作为免费(广告支持)流媒体服务,通过引入ChatGPT提升内容发现效率,有望在竞争激烈的流媒体市场中增强用户粘性和竞争力。
Amid rapid enterprise growth, Anthropic is trying to lower the barrier to entry for businesses to build AI agents with Claude.
在企业应用快速增长的背景下,Anthropic正在尝试降低企业使用Claude构建AI代理的入门门槛。
AI代理(AI Agent)是指能够自主完成复杂任务、进行决策并与外部系统交互的人工智能系统。Anthropic此举反映了当前企业级AI应用市场对简化开发流程的强烈需求,降低技术门槛将有助于加速AI代理在各行业的落地应用。
Sentence Transformers库发布了最新版本,支持多模态嵌入(可同时处理文本、图像等不同模态数据)和重排序模型(用于优化搜索结果排序)。这些模型能够将文本和图像编码到统一的向量空间中,实现跨模态的语义检索和相似度匹配。
多模态嵌入技术正在革新语义搜索领域,使系统能够理解并关联不同形式的内容(如同时理解图片和描述文本),这将大幅提升检索系统的准确性和用户体验。重排序模型作为二阶段检索的关键组件,能在初步召回后进一步优化结果排序,是提升搜索质量的重要手段。
CyberAgent uses ChatGPT Enterprise and Codex to securely scale AI adoption, improve quality, and accelerate decisions across advertising, media, and gaming.
CyberAgent使用ChatGPT Enterprise(OpenAI的企业级AI助手)和Codex(代码生成工具),在广告、媒体和游戏领域安全地扩展AI应用,提高质量并加速决策。
日本企业采用企业级AI工具的案例表明,大型组织正在从AI实验阶段转向规模化部署阶段,这对提升创意产业的生产力具有重要意义。
CyberAgent uses ChatGPT Enterprise and Codex to securely scale AI adoption, improve quality, and accelerate decisions across advertising, media, and gaming.
CyberAgent(一家日本互联网公司)在广告、媒体和游戏领域使用ChatGPT Enterprise(企业版ChatGPT,提供更高级别的安全性和隐私保护)和Codex(OpenAI的代码编写辅助工具)来安全地扩展AI应用、提升质量并加速决策。
这表明日本大型互联网公司正积极采用企业级AI工具来提升数字广告、媒体服务和游戏业务的竞争力,反映出企业AI应用在亚洲市场的快速增长趋势。
Poke brings AI agents to everyday users via text message by handling tasks and automations without complex setup, apps, or technical know-how.
Poke通过短信向普通用户提供AI智能体(能够自主执行任务的AI系统)服务,无需复杂的设置、应用或技术知识即可处理各种任务和自动化操作。
这代表了AI访问民主化的重要趋势,通过用户熟悉的短信这种通信渠道,让普通用户也能使用复杂的AI智能体,降低了AI技术的使用门槛。
Muse Spark is Meta’s first model since its AI reboot, and the benchmarks suggest formidable performance.
Muse Spark是Meta AI战略重组后推出的首款模型,基准测试显示其性能强劲。
Muse Spark的推出标志着Meta在AI领域的重大突破,其性能表现或将改变当前AI大模型竞争格局,使Meta在生成式AI赛道上更具竞争力。基准测试(benchmark)是用于评估AI模型性能的标准化测试指标。
Tubi becomes the first streaming service to offer an app integration within ChatGPT, the AI chatbot that millions of users turn to for answers.
Tubi成为首个在ChatGPT中提供应用集成的流媒体服务。ChatGPT是一款拥有数百万用户的AI聊天机器人,用户向其寻求各类答案。
这是流媒体行业首次将内容服务嵌入AI助手平台,标志着娱乐内容分发进入新阶段。未来用户可能通过AI对话界面直接发现和访问流媒体内容,这种'对话式娱乐'模式或将成为行业新趋势。
From phone cases to USB-C gear, these are the top tech gadgets and useful items our readers actually purchased last month.
从手机壳到USB-C配件,这些是读者实际上个月购买的最热门科技小工具和实用产品。
该榜单反映了消费者对实用性强、性价比高的日常科技配件的持续需求,其中USB-C相关产品和便携式存储设备依然保持高热度。
Astropad’s Workbench lets users remotely monitor and control AI agents on Mac Minis from iPhone or iPad, with low-latency streaming and mobile access.
Astropad的Workbench允许用户通过iPhone或iPad远程监控和控制Mac Mini上的AI代理,具有低延迟流传输和移动访问功能。
这款产品标志着远程桌面技术从传统IT运维支持向AI工作流程管理的转型,体现了AI代理在专业计算环境中移动化部署的应用趋势。
OpenAI's new Child Safety Blueprint aims to tackle the alarming rise in child sexual exploitation linked to advancements in AI.
OpenAI发布的新儿童安全蓝图旨在应对与AI技术发展相关的儿童性剥削问题急剧上升的严峻挑战。
随着生成式AI技术的快速发展,其被滥用的风险也在增加。OpenAI此次发布的儿童安全蓝图体现了AI行业在安全治理方面的重要责任,同时也反映了监管机构和公众对AI安全性的高度关注。
Discover OpenAI’s Child Safety Blueprint—a roadmap for building AI responsibly with safeguards, age-appropriate design, and collaboration to protect and empower young people online.
了解OpenAI的儿童安全蓝图——这是一份负责任地构建AI的路线图,包含安全防护措施、年龄适宜设计(根据不同年龄段用户设计合适的产品功能),以及通过协作来保护并赋能网络上的年轻人。
该蓝图体现了AI行业对未成年人保护的系统性思考,通过将安全防护融入产品设计流程,有望为其他AI企业提供参考范本,但具体效果需视执行力度和行业协作程度而定。
OpenAI outlines the next phase of enterprise AI, as adoption accelerates across industries with Frontier, ChatGPT Enterprise, Codex, and company-wide AI agents.
OpenAI概述了企业AI的下一阶段,随着Frontier(OpenAI的前沿AI模型系列)、ChatGPT Enterprise(企业版ChatGPT)、Codex(代码生成AI模型)以及全公司范围的AI代理(AI agents,可自主执行任务的智能系统)在各行业的采用加速。
企业AI正从单一工具应用向全流程自动化转型,2024年AI代理将成为企业部署重点,预计将显著提升企业运营效率和决策能力。
Matei Zaharia has won the top honor from the Association for Computing Machinery. Now he's working on AI for research and says AGI is simply misunderstood.
Matei Zaharia荣获美国计算机协会(ACM)最高荣誉。现他从事研究AI工作,并表示通用人工智能(AGI)一直被误解。
这反映了AI界对通用人工智能定义的持续争论——当前高级AI系统是否已触及AGI门槛。领先研究者的不同观点表明,AGI的概念和实现时间表仍存在显著分歧。
摘要内容缺失
无法提供见解,因为原始新闻的摘要内容为空。请提供完整的摘要信息以便进行翻译和专家见解分析。
Confluence users can now create visual assets within the software in addition to new third-party agents working with Lovable, Replit, and Gamma.
Confluence用户现在可以在该软件内创建视觉资产(visual assets指AI生成的图表、图片等视觉内容),此外还能使用与Lovable、Replit和Gamma合作的新第三方代理(third-party agents指第三方AI智能体,可执行特定任务的AI程序)。
此举表明Atlassian正在将AI能力深度整合到企业协作工具中,使团队能够更便捷地使用AI辅助内容创作,进一步推动企业办公的智能化转型。
Google Photos now lets you swipe left and right to keep or delete photos and clear up space, though it's Android-only.
Google Photos现在支持左右滑动来保留或删除照片并清理空间,但仅限Android系统。
这是Google通过简化手势交互来提升存储管理的用户体验创新,Android独占策略可能旨在推动更多用户转向Android生态系统或为后续功能测试提供可控环境。
A feature called Reserved Storage retains a small amount of storage for updates - here's how to disable it, and when it makes the most sense to do so.
Windows 11系统中有一个名为"预留存储"(Reserved Storage)的功能,会保留少量磁盘空间用于系统更新。本文介绍如何禁用该功能,以及在什么情况下最适宜使用这一操作。
DISM是Windows部署映像服务和管理工具(Deployment Image Servicing and Management)的缩写,是一种系统维护和修复命令行工具。禁用预留存储可释放空间,但对系统更新和恢复功能可能产生负面影响,建议仅在存储空间确实紧张且了解潜在风险的情况下使用。
The Pebblebee Halo isn't your ordinary tag; it's a complete personal safety device.
Pebblebee Halo并非普通标签,而是一款完整的个人安全设备。
在苹果AirTag主导的蓝牙物品追踪器市场中,Pebblebee Halo通过集成130分贝(dB,响度单位)高强度警报器和频闪灯等主动防护功能,开辟了差异化竞争路径,尤其适合关注人身安全的用户群体,但需注意其与苹果Find My生态系统的兼容性差异。
Arcee is a tiny 26-person U.S. startup that built a high-performing, massive, open source LLM. And it's gaining popularity with OpenClaw users.
Arcee是一家仅有26人的美国初创公司,开发了一款高性能、大规模的开源大语言模型(LLM)。该模型正在AI开发社区OpenClaw用户中获得广泛欢迎。
Arcee的成功表明,在巨头主导的LLM市场中,小型开源团队通过差异化和社区运营仍能获得生存空间,这对AI民主化具有积极意义。
Asus' 16-inch Zenbook A16 takes a fresh approach to ultraportability, but whether it works or not depends on who you ask.
华硕16英寸Zenbook A16采用了全新的超便携设计,但效果如何取决于你问谁。
骁龙X Elite是高通面向AI PC推出的旗舰处理器,基于ARM架构设计,在能效比和AI加速能力方面具有优势,但与苹果M系列芯片的生态系统整合度和软件兼容性仍需进一步优化。
Unlike static, rules-based systems, AI agents can learn, adapt, and optimize processes dynamically. As they interact with data, systems, people, and other agents in real time, AI agents can execute en...
与静态的、基于规则的系统不同,AI智能体(能够自主学习和决策的AI系统)能够动态学习、适应和优化流程。AI智能体可以实时与数据、系统、人员和其他智能体进行交互,自主执行整个工作流。但要释放其潜力,需要围绕智能体重新设计流程,而不是使用传统优化方法将它们强行附加到碎片化的遗留工作流(指企业仍在使用的传统旧系统和工作流程)上。企业需要...
这代表了企业流程自动化从'流程优化'向'流程智能化'的根本性范式转变,AI智能体不仅是执行工具,更是流程的主动设计者和优化者,标志着企业数字化转型进入以智能体为中心的新阶段。
Zero Shot, a new venture capital fund with deep ties to OpenAI, is aiming to raise $100 million for its first fund. It has already written some checks.
Zero Shot是一家与OpenAI有深厚联系的新风险投资公司,正在为其首个基金筹资1亿美元。该基金已进行部分投资。
这家名为Zero Shot的新兴VC基金获得了OpenAI内部人士的支持,显示出AI创业投资领域的活跃。它专注于早期AI初创公司,表明AI生态系统正在吸引更多专业资本进入。
Gemini can now create captions when users are looking to share a photo or video.
Gemini(Google的AI模型)现在可以在用户分享照片或视频时自动生成说明文字。
这一功能展现了生成式AI正在向消费级应用场景深度渗透,未来更多日常应用将集成AI自动内容生成能力,提升用户创作效率。
Now rolling out to Android users globally, AI Enhance uses generative AI to improve your photos instantly. Here's how to use it, and where it falls short.
AI Enhance现正在向全球安卓用户推出,该工具使用生成式AI技术即时改善用户照片。本文介绍了使用方法及其不足之处。
这是移动端AI图像处理的重要进展,生成式AI可自动优化构图和光线,但'有时'有效表明该技术在复杂场景下的局限性仍需改进。
Google's new offline-first dictation app uses Gemma AI models to take on the apps like Wispr Flow.
Google新的离线优先语音转录应用使用Gemma AI模型,挑战Wispr Flow等应用。
Google推出了基于其开源Gemma模型的离线语音转录应用,这标志着端侧AI的重要进展。离线功能不仅保护用户隐私,还降低了延迟和云服务成本,代表了移动AI应用的重要发展方向。
I didn't see much benefit for Google's AI - until now. Here are my favorite ways to use the new Gemini integration in my car.
我之前没觉得Google的AI有多大用处——直到现在。以下是我喜欢使用新Gemini汽车集成的几种方式。
Gemini在车载场景的集成标志着AI助手从手机向移动出行领域的延伸,车载语音交互正在成为下一个AI应用的重要入口,Google通过Android Auto生态系统抢占先机。
Nominate your startup, or one you know that deserves the spotlight, and finish the process by applying. Selected 200 have a chance at VC access, TechCrunch coverage, and $100K for Startup Battlefield 200. Applications close on May 27.
推荐您知道值得关注的初创企业,并在5月27日前完成申请。被选中的200家初创企业将有机会获得VC投资、TechCrunch报道和10万美元。
TechCrunch的Startup Battlefield仍是早期初创企业的重要跳板。10万美元奖金和VC投资机会提供显著价值,但竞争激烈。入选企业通常获得大量媒体曝光和投资者关注,这是初创企业展示创新成果的优质平台。
AI skeptics aren’t the only ones warning users not to unthinkingly trust models’ outputs — that’s what the AI companies say themselves in their terms of service.
AI怀疑论者并非唯一警告用户不要盲目信任模型输出的人——AI公司自己在服务条款中也这么说。
这揭示了AI行业的关键矛盾:企业宣传AI的变革性,同时又否认其可靠性。这种'双重标准'引发了对用户信任的严重质疑,也带来AI生成内容法律后果的潜在风险。用户应保持批判性思维,不应完全依赖AI输出做重要决策。
OpenAI proposes taxes on AI profits, public wealth funds, and expanded safety nets to address job loss and inequality, blending redistribution with capitalism as policymakers debate AI’s economic impact.
OpenAI提议对AI利润征税、建立公共财富基金和扩大安全网,以解决失业和不平等问题,将再分配与资本主义相结合,政策制定者正在讨论AI的经济影响。
这反映了科技行业对责任的新思考。机器人税和公共财富基金是解决AI驱动的就业替代问题的创新方式,但实施面临挑战:如何定义'AI利润'、如何公平分配基金收益等问题仍待解决。这一提议可能成为未来AI监管的重要参考框架。
Learn how to use Spotify, Canva, Figma, Expedia, and other apps directly in ChatGPT.
了解如何直接在ChatGPT中使用Spotify、Canva、Figma、Expedia和其他应用。
这代表了AI作为消费服务中心的重大演进。与DoorDash、Uber等平台集成将ChatGPT从纯AI助手转变为生态聚合器。然而,这也引发了对数据隐私和AI在日常交易中角色的质疑,用户需注意信息共享边界。
It’s about to become more expensive for Claude Code subscribers to use Anthropic’s coding assistant with OpenClaw and other third-party tools.
Claude Code订阅用户使用Anthropic的编码助手与OpenClaw等第三方工具将变得更加昂贵。
这揭示了AI编码助手市场的新兴商业模式。Anthropic的定价策略表明向高级AI功能按量付费的转变,可能使独立开发者难以负担专业开发工具。此举可能影响开发者社区对Anthropic工具的采用意愿。
Driven by labor shortages, Japan is pushing physical AI from pilot projects into real-world deployment.
受劳动力短缺驱动,日本正在将物理AI(即能够感知、理解并操作物理世界的AI系统)从试点项目推向实际部署应用。
日本的做法反映了老龄化社会的一种务实路径:与其用AI替代人类工作,不如让AI填补劳动力缺口,特别是那些脏、累、险的低技能岗位,这为其他面临类似人口结构挑战的国家提供了参考样本。
Major AI labs are investigating a security incident that impacted Mercor, a leading data vendor. The incident could have exposed key data about how they train AI models.
主要AI实验室正在调查影响Mercor的安全事件,该事件可能暴露他们训练AI模型的关键数据。
Mercor数据泄露可能导致多家AI公司的训练数据、模型结构和调优策略被曝光,对竞争格局和知识产权带来重大影响。Meta暂停合作是对数据供应链安全的快速响应,也提醒行业需对数据供应商进行更严格的审计。
In addition to Lightcap's new role, OpenAI CMO Kate Rouch will be stepping away from the company to focus on cancer recovery, with a plan to return when her health allows.
除Lightcap的新职务外,OpenAI首席营销官Kate Rouch将离职,专注于癌症康复,并计划在健康允许时回归。
设立‘特别项目’COO职责表明OpenAI正在探索新的业务方向或关键技术的内部孵化。Kate Rouch因健康原因离职,可能对公司的品牌和公共关系带来短期影响,但她的回归计划显示公司对人才的长期重视。
The viral AI agentic tool let attackers silently gain admin unauthenticated access.
这款快速传播的AI代理工具允许攻击者静默获得管理员未授权访问权限。
OpenClaw的安全漏洞凸显了AI代理在拥有高级权限时的潜在风险。企业和开发者必须在部署类似工具前进行严格的权限控制和渗透测试,以防止类似未授权访问被利用。
Glen Anderson, president of Rainmaker Securities, says the secondary market for private shares has never been more active — with Anthropic the hottest trade around, OpenAI losing ground, and SpaceX's looming IPO poised to reshape the landscape for everyone.
Rainmaker Securities总裁Glen Anderson表示,私募股权的二级市场从未如此活跃——Anthropic成为最热门的交易,OpenAI失去份额,SpaceX即将进行的IPO有望重塑整个格局。
Anthropic近期估值飙升,吸引大量二级市场投资者,显示其在生成式AI领域的竞争力。若SpaceX成功上市,可能会分散风险资本对AI公司的关注,导致AI私募市场资金出现一定程度的紧张。
The company is undergoing major leadership restructuring as its CEO of AGI deployment goes on leave for “several weeks.”
该公司正在进行重大领导层重组,因为其负责AGI部署的CEO将休假“数周”。
此事件显示OpenAI正处于高层人事动荡,核心负责AGI部署的高管休假可能导致项目进度放缓,同时也凸显出公司在快速扩张过程中面临的管理压力。
Plus: The FBI says a recent hack of its wiretap tools poses a national security risk, attackers stole Cisco source code as part of an ongoing supply chain hacking spree, and more.
FBI表示近期对其窃听工具的黑客攻击构成国家安全风险;攻击者窃取了Cisco源代码,作为持续供应链黑客攻击的一部分,等等。
代码泄露加上恶意软件会大幅提升攻击者的攻击能力,尤其针对AI模型和基础设施。FBI对这类漏洞的关注表明国家安全层面已经将网络攻击视作重要风险,企业需要加强代码审计和供应链安全。
OpenAI is acquiring TBPN, a business talk show that’s popular among Silicon Valley elites, as it continues to battle its negative public image.
OpenAI正在收购在硅谷精英中流行的商业谈话节目TBPN,以继续对抗其负面公众形象。
OpenAI收购TBPN是希望通过掌控媒体渠道来扭转负面舆情,利用硅谷精英的影响力提升品牌形象,同时为其技术产品提供更积极的宣传平台。
As Cursor launches the next generation of its product, the AI coding startup has to compete with OpenAI and Anthropic more directly than ever.
随着Cursor发布下一代产品,这家AI编程初创公司比以往更直接地与OpenAI和Anthropic竞争。
Cursor推出新一代AI智能体意味着AI编程工具竞争加剧,面对OpenAI和Anthropic的直接挑战,Cursor需要通过差异化功能保持竞争力,可能促使行业加速创新。
Gemini API Dials
Gemini API Dials
Google正在为Gemini API推出更精细的成本控制和可靠性配置选项,允许开发者根据实际需求在性能和费用之间取得更好平衡。这反映了AI API服务正在向更灵活的商业模式发展,以满足不同规模开发者的需求。
Researchers at the company found representations inside of Claude that perform functions similar to human feelings.
该公司在Claude内部发现了执行类似人类情感功能的表征。
Anthropic指出Claude具备类似情感的内部表征,显示出AI在情感模拟方面的进步,同时也引发关于AI意识与伦理的争议,可能促使监管机构更加关注AI的情感层面。
Google partnered with the Brazilian government on a satellite imagery map to help protect the country’s forests.
Google与巴西政府合作创建卫星图像地图,以帮助保护该国森林。
这是Google在环境AI应用领域的重大合作项目,利用卫星遥感技术和AI图像分析来监测森林覆盖变化,支援巴西的森林保护工作。这展示了AI在气候变化应对和环境保护方面的实际应用价值。
Build with Veo 3.1 Lite
使用Veo 3.1 Lite构建
Google推出了Veo 3.1 Lite版本,这是其视频生成模型的更经济实惠版本。此举旨在降低AI视频创作的技术门槛,让更多开发者和内容创作者能够使用视频生成技术,推动AI视频应用的普及。