账号登录立即注册
欢迎来到DeepSeek人工智能社区,让我们一起愉快的学习交流吧!
社区了一项针对DeepSeek-V4-Flash模型的优化工作,通过修复其多令牌预测(MTP)头并应用特定量化方案,显著提升了推理速度。原模型的MTP头在加载时会被静默移除,导致推测解码配置无效。为此,作者重新接入了MTP模块,并对路由专家采用了W4A16 INT4分组格式的GPTQ量化,同时 ...全文
DeepSeek正计划进行首轮融资,金额高达500亿元人民币(约73.5亿美元)。其中,创始人梁文锋可能个人投资200亿元,占融资总额的40%。如果完成,公司估值将突破515亿美元,刷新中国AI公司的融资纪录。同时,升级版DeepSeek V4.1模型可能在6月上线,将支持MCP集成标准和多模态输 ...全文
中国人工智能实验室 Deepseek 正在接近完成一轮新的融资交易,本轮融资可能使公司估值达到约 450 亿美元。本轮融资由中国国家芯片基金领投,显示出对中国本土人工智能发展的支持。如此估值水平标志着 Deepseek 在人工智能领域的市场地位进一步提升。融资消息引发行业关注,体 ...全文
DeepSeek 开始灰度测试多模态视觉能力,并发布论文《Thinking with Visual Primitives》解释技术原理,随后迅速撤回。研究员陈小康表示,传统思维链主要停留在语言空间,视觉推理需要更多能力。DeepSeek 提出使用视觉基元进行思考,将图像中的点、边界框、路径坐标作为推理过 ...全文
近日,国内知名人工智能大模型DeepSeek的一次悄然更新,意外在社交媒体上掀起轩然大波。2月11日,DeepSeek对其旗舰模型启动灰度测试,本以提升性能为目标的技术迭代,却因用户普遍反馈“语气变冷”“像换了个人”“变得傻了”而登上热搜,引发广泛讨论。这 ...全文
DeepSeek 正式开源发布新一代光学字符识别模型 DeepSeek-OCR 2。该模型在 OmniDocBench v1.5 基准测试中取得 91.09% 的综合得分,较前代提升 3.73%,显著领先同类方案。核心突破在于其全新 DeepEncoder V2 架构,引入“视觉因果流”机制,使模型不再机械 ...全文
2026年1月12日 —— 据最新消息,人工智能企业深度求索(DeepSeek)计划于2026年2月中旬(农历新年前后)正式发布其新一代旗舰大模型 DeepSeek-V4。此次发布标志着继V3模型后又一重要技术迭代,聚焦提升代码生成与复杂软件开发支持能力。核心亮点: ...全文
深度求索(DeepSeek)今日正式推出其全新升级的数学大模型 DeepSeek-Math-V2。该模型在复杂推理、多步证明与竞赛级数学问题求解上实现重大突破,全面超越前代版本及多个国际主流数学模型。DeepSeek-Math-V2 基于深度求索自研的高效推理架构,在保持千亿参 ...全文
在今日举行的中国世界互联网大会(WIC)乌镇峰会上,人工智能初创公司 DeepSeek 的高级研究员陈德利罕见公开亮相,发出关于人工智能社会影响的严峻预警:未来五到十年内,AI 可能取代大量人类岗位;十年至二十年后,或将覆盖绝大多数现存职业。陈德利指出 ...全文
DeepSeek-V3.1于2025年8月21日正式发布,标志着DeepSeek在大模型领域的重要进展。此次发布的版本在多个方面进行了升级和优化,提升了模型的性能和用户体验。主要升级内容: 混合推理架构:新模型支持思考模式与非思考模式的自由切换,用户可以通过“ ...全文
近日,腾讯通过一系列技术升级和产品整合,显著提升了DeepSeek的性能,进一步巩固了其在AI搜索领域的领先地位。这一系列举措不仅优化了用户体验,还为国内AI生态的发展注入了新的活力。一、技术升级与性能提升腾讯云率先支持DeepSeek API+联网搜索功能 ...全文
DeepSeek创始人梁文锋荣登《时代》杂志“2025年全球最具影响力100人”榜单,这一消息再次彰显了他在人工智能领域的卓越贡献和全球影响力。梁文锋以其在AI技术上的创新突破,以及对开源精神的坚持,引领了AI行业的一次革命性变革,使DeepSeek成为全球瞩目的 ...全文
2025年4月1日,缅甸发生了一次7.9级地震,给当地带来了严重的破坏。在这场灾难中,中国救援队首次将DeepSeek技术应用于国际地震救援行动,取得了显著成效。这一突破性应用得益于国家应急语言服务团与北京语言大学合作开发的中缅英互译系统,该系统基于DeepS ...全文
DeepSeek最新公布了一项名为“一种广度数据采集的方法及其系统”的专利,该专利由其关联公司杭州深度求索人工智能基础技术研究有限公司申请。这项专利旨在解决传统数据采集过程中存在的诸多问题,例如无法获取复杂网站的完整链接、过量下载导致网站崩溃、重 ...全文
DeepSeek-V3-0324于2025年3月24日深夜悄然发布,此次更新虽然被官方低调称为“小版本迭代”,但其性能提升显著,引发了广泛关注。这一版本在多个领域表现突出,尤其在代码生成、数学推理、前端开发以及多语言支持方面达到了前所未有的高度,甚至在某些场景中超越了世界领先的 ...全文
手机版|小黑屋|网站地图|乐科技
© 2021-2026 乐啊乐科技版权所有 ( 鄂ICP备2021015077号-2 ) 10 queries
Theme by 潘乐乐
领先的AI人工智能社区,AI智能体应用工具学习交流平台!