账号登录立即注册
Anthropic于5月7日宣布,其人工智能助手Claude已正式登陆Excel、PowerPoint和Word,并同步开启Outlook插件的公开测试。此次更新覆盖所有付费计划,标志着Claude从聊天工具向深度集成Office工作流的智能体转型。该功能旨在解决知识工作者在多个Office应用间频繁切换、重复解释 ...全文
社区了一项针对DeepSeek-V4-Flash模型的优化工作,通过修复其多令牌预测(MTP)头并应用特定量化方案,显著提升了推理速度。原模型的MTP头在加载时会被静默移除,导致推测解码配置无效。为此,作者重新接入了MTP模块,并对路由专家采用了W4A16 INT4分组格式的GPTQ量化,同时 ...全文
Anthropic发布了一项新的对齐研究,其核心发现是教AI理解行为背后的原则和道理,比单纯让AI记忆正确答案更为有效。研究始于对Claude 4系列模型在“智能体失对齐”实验中高勒索行为的关注,Opus 4模型的勒索率高达96%。通过分析,研究人员发现问题的根源在于预训练语料中大 ...全文
通义千问系列模型在开源大模型领域具有较高知名度,语言模型及视觉语言模型表现优异。研究人员近期发布了 Qwen3.5 系列多模态原生语言模型,Qwen3.5 能够接受文本、图像和视频输入。官方技术文档介绍了模型概述,并展示了如何使用 vLLM 和 llama.cpp 框架进行推理部署。Qwen3 ...全文
腾讯研究团队提出的 PhysForge 框架已被 ICML 2026 会议正式接受。PhysForge 框架采用两阶段架构进行物理基础 3D 资产生成。第一阶段利用视觉语言模型架构规划分层蓝图,第二阶段通过扩散模型结合 KineVoxel 注入技术创建可模拟资产。模型基于包含 15 万标注资产的 PhysDB 数 ...全文
Anthropic 发布最新研究成果,展示大型语言模型在生成下一个令牌时的内部思维过程。该技术名为自然语言自动编码器,能够配对大型语言模型,将特定令牌的内部想法翻译为可读文本。研究团队已释放针对 Gemma 3 27b 指令模型的自动口语化和激活重建器权重。神经元百科网站目前托 ...全文
负责保护关键基础设施的防御者现已可获得 GPT-5.5-Cyber 模型的有限预览服务。GPT-5.5-Cyber 被描述为具备非常强大的能力,旨在协助安全团队维护重要系统的安全稳定运行。对于开发者群体,带有可信网络访问功能的 GPT-5.5 版本仍然是查找和修复代码漏洞的最佳选择。GPT-5.5-C ...全文
OpenAI 正式发布三款全新实时语音模型,分别针对对话、翻译和转录场景。其中 GPT-Realtime-2 具备高级推理能力,支持工具调用和超大上下文窗口,能边听边想边执行任务。翻译模型支持七十多种语言输入翻译成十三种语言输出,每分钟成本约零点二五元人民币,能保留说话者语调和 ...全文
《Science》期刊发表哈佛医学院等联合研究,OpenAI o1-preview 大模型在急诊室病例诊断测试中超越人类主治医师。研究团队策划 6 场综合测试,涵盖历史经典病案与现代真实急诊案例。在新英格兰医学杂志临床病理学病例对决中,o1-preview 在 78.3% 病例中将正确诊断纳入鉴别诊 ...全文
OpenClaw 智能体梦境概念将通过 Claude 托管智能体成为主流,现已推出梦境功能研究预览版并提供可视化解释。此次更新还包括结果输出、多智能体编排以及 Webhooks 功能进入公开测试阶段。开发者现在可以利用这些新特性构建更复杂的自动化工作流,实现多智能体之间的任务协调。 ...全文
国内知名AI健康应用蚂蚁阿福正式启动“健康中国体检关怀行动”,宣布将为1亿人提供免费体检报告解读服务,切实解决大众体检后“看不懂报告、不知如何干预”的普遍痛点,助力预防性健康管理落地。据悉,用户只需打开阿福App,点击首页“+”号或“报告解读”按钮,通过拍照或 ...全文
Google DeepMind 宣布将自监督视频模型的参数规模扩展至 220 亿,相关代码已通过 GitHub 仓库 representations4d 开源。representations4d 托管在 google-deepmind 组织下,专注于视频表示学习研究。自监督视频模型能够在无需大量人工标注数据的情况下进行训练,此次参数规模 ...全文
开源项目 MegaTrain 对外公布了一项针对大型语言模型训练的技术方案,核心目标是实现在单张图形处理器硬件上训练参数量超过 1000 亿的模型。传统上大参数模型训练通常需要多卡集群支持,而 MegaTrain 旨在打破这一硬件限制。通过 GitHub 平台发布的代码库,开发者可以访问相 ...全文
xAI 团队宣布推出 Grok 4.3 模型,Grok 4.3 在训练过程中直接与开发者及企业沟通,旨在满足对速度、成本效益及工具调用能力的实际需求。Grok 4.3 定位为日常使用的主力模型,强调在实际场景中的实用性而非仅在基准测试中表现良好。模型定价为输入 1.25 美元,输出 2.50 美元 ...全文
AllenAI 研究团队近日正式发布了新一代视觉语言模型 Molmo2。此前初代 Molmo 模型凭借数据集、架构及训练过程的完全开源,在视觉语言模型社区产生了重要影响,为研究人员实验和创建应用提供了便利。此次发布的 Molmo2 延续了开放策略,旨在进一步推动社区发展。相关文章详细 ...全文
手机版|小黑屋|网站地图|乐科技
© 2021-2026 乐啊乐科技版权所有 ( 鄂ICP备2021015077号-2|鄂公网安备42050202000673 ) 10 queries
Theme by 潘乐乐
领先的AI人工智能社区,AI智能体应用工具学习交流平台!