Earth-2是什么NVIDIA Earth-2 是英伟达推出的全球首套完全开源的 AI 气象预测模型家族,基于 Atlas、StormScope、HealDA 三大核心架构,分别实现 15 天全球中
Lucy 2是什么Lucy 2.0 是 Decart AI推出的实时世界转换模型,支持让高保真视频编辑从离线渲染跃升为可交互的实时体验。作为纯扩散模型,模型无需依赖 3D 几何或深度图,物理行为完全通
DeepSpeed-MII是什么DeepSpeed-MII 是 DeepSpeed 团队开源的 Python 库,提供高效模型推理。DeepSpeed-MII用阻塞 KV 缓存、连续批处理和动态 Sp
OpenJudge是什么OpenJudge 是开源的 AI 应用评测框架,能解决从原型到生产环境的过渡难题。框架通过系统化的评测机制,帮助开发者量化评估 AI 应用的性能,确保其在复杂业务场景中的可靠
FlowAct-R1是什么FlowAct-R1是字节跳动推出的实时交互数字人视频生成框架,仅需单张参考图和音频,支持流式生成无限时长的全身动态视频。框架通过分块扩散强制策略和多模态大语言模型实现低延迟
Agentation是什么Agentation 是开源的AI编程协作工具,能解决开发者与 AI 编程助手之间沟通效率低下的问题。工具通过让用户直接在网页上标注问题,将视觉反馈转化为代码可读的信息,生成
D4RT是什么D4RT(Dynamic 4D Reconstruction and Tracking)是谷歌 DeepMind 推出的动态 4D 重建模型。模型通过统一的「时空查询」接口,将 3D 重
Qwen3-TTS是什么Qwen3-TTS是Qwen开源的系列语音生成模型,具备强大的音色克隆、创造和语音控制能力。模型基于创新的Qwen3-TTS-Tokenizer-12Hz多码本语音编码器,实现
SAM Audio是什么SAM Audio是Meta开源的音频分割模型,能通过文本、视觉和时间片段等多模态提示,从复杂的音频混合中分离出特定的声音。核心技术是Perception Encoder Au