DeepSeek-V3.2-Exp模型开源发布重磅消息
2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
当地时间9月26日,美国白宫表示,最新针对药品的关税措施不适用于已与美国达成贸易协定的国家。 据路透社消息,白宫官员表示,对于欧盟、日本等贸易伙伴,美国将继续遵守协定中规定的15%关税上限。 9月25日,美国总统特朗普在其社交媒体“真实社交”宣布,自10月1日起,美国将对多类进口产品实施新一轮高...
界面新闻记者 | 王婷婷 上海高端住宅市场依然一枝独秀。 9月14日,楼市“金九”第二个周日,位于虹口内环内的外滩瑞府首期开盘,119套房源当日售罄,录得销售额超24.8亿元。“现场选房氛围比较好,购房者的认购热情还是挺OK的,选房时间很快,也不是很纠结。”外滩瑞府项目负责人告诉界面新闻...
界面新闻记者 | 陈慧东 光电玻璃精加工企业沃格光电(603773.SH)日前修改了其定增融资计划。 沃格光电拟定增募资不超过15亿元,拟用于玻璃基Mini LED显示背光模组项目和补充流动资金及偿还银行贷款项目。 界面新闻记者注意到,对比沃格光电今年5月披露的原定增预案,此次公司...
界面新闻记者 | 肖芳界面新闻编辑 | 文姝琪 从去年就在寻找新故事的爱奇艺,又看中了线下娱乐业。 在2025爱奇艺iJOY秋季悦享会上,爱奇艺创始人、首席执行官龚宇在演讲中明确,线下业务未来将是爱奇艺的核心...
9月26日,神奇制药(600613.SH)公告,公司于9月26日收到上海证监局出具的《关于对上海神奇制药投资管理股份有限公司采取责令改正措施并对ZHANG TAO TAO、冯斌、陈之勉采取出具警示函措施的决定》(下称《决定书》)。 《决定书》显示,经查,神奇制药存在以下违规事项:2023年,公...
9月26日,富煌钢构(002743.SZ)披露公告称,公司于当日收到证监会对公司送达的《立案告知书》,公司因涉嫌信息披露违法违规,证监会决定对公司进行立案。 富煌钢构表示,目前公司各项经营活动和业务均正常开展,在立案调查期间,公司将积极配合证监会的相关调查工作,并严格按照有关法律法规及监管要求...